Pourquoi la constitution de donnés cartographiques libres est difficile
Je vais tenter de répondre plus en détails au billet de Ludo sur la libération des informations cartographiques.
Comme visiblement les modèles économiques de la cartographie en ligne ne sont pas clairs, je vais tenter d’abord de présenter les acteurs actuels, sans dévoiler d’informations confidentielles. Car la cartographie, comme l’édition de logiciel propriétaire, est le royaume des NDA et des accords de confidentialités.
Fournisseurs de données
Il faut savoir que Navtech et Teleatlas, les fournisseurs les plus souvent utilisés par les sites internet (Yahoo, Google, MSN, Mapquest, Maporama, Viamichelin, Mappy…) le sont parce que :
- Les données sont les plus complètes en termes de couvertures (USA + une grande partie de l’Europe).
- Les données sont les plus riches, et sont notamment adaptées au calcul d’itinéraire. En effet si l’affichage d’une carte peu se faire simplement en utilisant un scan d’un plan papier (ou un bitmap généré à partir de sa version numérique), le calcul d’itinéraire ne peut se faire qu’avec un réseau formé de tous les segments des voies, et avec des attributs riches (comme les limitations de vitesses, les sens interdit). De même la localisation d’une adresse sur un plan (qu’on appelle géocodage) nécessite des attributs riches comme le noms de tous les segments des voies, les numéro dans la rue, etc. A la différence des géométries des voies, ces données ne peuvent pas être obtenus à partir d’images satellite ou de photos aériennes. Il faut effectuer des relevés sur place et des interventions humaines pour saisir ces informations. L’origine de l’activité de Navtech et Tele Atlas étant la fourniture de données pour les systèmes de navigation embarqué dans les véhicules (couplés avec un GPS), les données de ces fournisseurs se doivent d’être très riches et complètes.
- Navtech et Tele Atlas propose pour les sites web un modèle de licence à la consommation (au hit donc). Les sites grand public étant rémunérés par la publicité, qui fonctionne aussi au hit, ce modèle s’avère bien adapté. Les tarifs étant bien sur dégressifs, il n’est pas évident que même pour Google ou MSN l’achat d’un Navtech ou d’un Tele Atlas soit intéressant (même si des bruits ont courut il y a quelques temps, mais chut…)
- La mise à jour continues des donnés est nécessaires, à cause des changements de plan de circulation, des changements de nom de rue, etc. Navtech et Tele Atlas livrent plusieurs mise à jour de leurs données par an.
Certaines donnés libres existent, mais elle sont plutôt sommaire (carte du type atlas mondial)
Fournisseurs des briques de base.
Pour exploiter ces données brutes, il faut utiliser des moteurs fournissant les fonctions de base (affichage de carte, calcul d’itinéraire, saisie de données).
C’était au départ le rôle des SIG (système d’information géographique) comme Esri et Mapinfo (entre autres, et je me dois de citer aussi GeoConcept, bien sur), mais aucun de ces outils n’est vraiment adapté à l’utilisation dans un site web à fort trafic. Il existe des outils open-source mais aucun n’est utilisé dans un contexte de site web grand public.
Il existe quelques fournisseurs de solution propriétaires sur ce domaines, dont Telcontar utilisé par Google et Yahoo ! La plupart des sites de cartographie ont développé leur propre solution (du moins en partie).
Bien qu’il existe des formats plus ou moins standard d’échange de données cartographique, l’intégration des données dans les moteurs n’est pas une tâches faciles.
Fournisseur de services webs.
La complexité de l’intégration des données et la difficulté de configuration des moteurs de base rend intéressant l’utilisateur de services web pour les fonctions de bases
Microsoft propose ainsi toutes les fonctions de base de MSN Mappoint avec Mappoint.net. Plusieurs sites de cartographie en ligne proposent des offres comparables. Le coût est en général semblable à de la téléphonie : un abonnement fixe et un coût à la requête.
Au départ utilisé principalement pour des applications interne, on voit apparaitre des services à valeurs ajouté exploitant ces briques, comme MapImpact dont j’ai déjà parlé.
Il existe quelques services gratuits, mais bien limités par rapport aux outils payants
Fournisseur d’application web.
Le service fournit est de plus haut niveau que les simples briques de bases, en général adapté à un usage particulier (portail web, logistique, marketing…). On trouve beaucoup de fournisseurs payants dans ce domaine. Les “API” gratuites de Google maps et Yahoo Maps sont plutôt à ranger dans cette catégorie.
Et les standards ?
Il existe un organisme de standardisation, l’OGC, qui élabore des formats de fichier et des interfaces. Sur plus de 200 application implémentant les spécifications Open GIS (dont quelques outils open-source), une quarantaine ont passé la certification.
Cependant tous les acteurs du marché ne suivent pas les recommandations de l’OGC, notamment Microsoft avec Mappoint.net. Est-ce si étonnant, vu que MS ne fait pas partie de l’OGM, contrairement à Oracle et IBM ?
Et si l’OGC a définit un format d’échange de données géographique basé sur XML (GML), il ne définit pas de format de stockage directement utilisable. Par contre il définit le moyen d’étendre une base de données relationnelle pour enregistrer des données géographique. Une partie de cette spécification est d’ailleurs implémenté dans MySQL 4.1 et Postgres 8 (PostGIS).
Des données libres ?
L’existence de l’OGC et l’adoption progressive de ses spécification par de plus en plus d’éditeurs propriétaires rend possible le développement d’outils open-source qui progressivement pourraient remplacer tout ou partie des solutions propriétaires.
Par contre la création de bases libre ne pourraient pas s’appuyer sur les bases propriétaires existantes que l’on replacerait peu à peu par des données libres, car leur licence l’interdit (pas fous !).
Or une base cartographique n’est intéressante pour la communauté que si elle dépasse une certaine taille et qu’elle est complète sur les zones qu’elle couvre.
Une analogie avec Wikipedia est simple. Aujourd’hui il n’existe pas encore l’équivalent de Wikimedia (le moteur de wiki utilisé par Wikipedia), mais sa création est possible, bien que plus complexe à réaliser que Wikimedia. Par contre si Wikipedia était intéressant dès l’écriture des premiers articles, il faudra attendra de disposer de plusieurs villes complètements couvertes avant que des données soient utile. J’ai connus quelques aventuriers qui ont tenté de saisir les données (voire de créer une communauté, et ils ont très vite décidé de travailler avec Navtech ou Tele Atlas.
Reste l’hypothèse d’un mécène. Il ne faut pas compter sur le secteur public, car la mission de service public de collecte des données est rendue par les IGN nationaux et leur modèle économique ne peut pas fonctionner sans vente des données. Et contrairement à d’autres bases de données que l’on peut libérer, les base cartographiques doivent être mise à jour régulièrement pour être valable. On peut envisager que des bases anciennes soient libérés (je crois que c’est le cas aux USA), mais sans mise à jour leur intérêt est très limité.
Quand à un consortium d’entreprise privé, il ne se créera que si l’un des deux fournisseurs venaient à disparaitre. Car quoi qu’on en dise, le développement du modèle libre dans le logiciel, et notamment son soutien par beaucoup de sociétés comme IBM et Novell, est quand même liée à l’hégémonie de Microsoft. Tant qu’il existera deux fournisseurs en concurrences les prix continueront à baisser avec la généralisation de l’utilisation des données (puisque le coût sera virtuellement partagé entre les utilisateurs).
Et comme l’a dit Ludovic, il faut prendre en compte le rapport entre l’intérêt pour la communauté et les coûts. L’existence de Wikipedia se justifie par le partage de la connaissance qu’une encyclopédie permet. Les bases de données cartographique utilisé par les sites web sont plutôt des informations. A l’inverse certains informations géolocalisés sont plus proches de l’esprit de partage, comme ce que fait Yahoo avec Yahoo locals.
En conclusion
Comme je l’ai déjà dit, je reste persuadé que c’est un modèle mixte propriétaire/libre qui va s’imposer, du moins pour le moment. A moins qu’une technologie de rupture dans la création des données cartographiques n’apparaisse. Mais chut… c’est une autre histoire.
août 20th, 2005 à 7:52
Puisque j’ai mes propres orientations idéologiques, et que je pense que ton opinion en vaut largement une autre, de personne plutôt bien informée sur le sujet, je me sens obligé de te demander : que penses-tu de PostGIS ? Je suis assez surpris que tu n’y fasses aucune allusion, même si ton sujet est plus les données que leur modèle (non, je ne confonds pas tout), mais, n’étant pas moi-même spécialiste et étant franchement orienté au niveau des logiciels auxquels je choisis de m’intéresser, bah… Et puis citer des implémentations MySQL sans citer les mêmes avec l’"autre", la meilleure base de données libres (de loin), ça me fait mal…
À titre personnel et dans l’absolu je pense ton analyse assez juste : le domaine est, comme d’autres, assez spécifique et complexe pour que le modèle propriétaire ne cède le pas que très très lentement. Au passage… Parce qu’on en a parlé un jour il y a quelque temps, je me suis un peu intéressé au domaine d’un point de vue technique… eh bah putain j’y comprends que dalle, ou j’ai l’impression de comprendre, mais au ralenti ! Tu as bien du mérite (ou as eu les bons formateurs) pour avoir bossé dedans…
août 20th, 2005 à 9:55
Exact, j’avait oublié PostgreSQL. Je modifie donc l’article. Par contre je n’ai pas encore d’avis sur PostGIS, ne l’ayant pas utilisé. Il faudra que je m’en occupe, surtout que j’ai envie d’évaluer les performance de PostgreSQL sous Windows.
Quand à la difficulté technique du domaine, ma foi, j’ai encore des lacunes, la preuve !
août 20th, 2005 à 11:33
PostgreSQL sous Windows, moi mon premier test n’a pas été très concluant : on garde les spécificités de PostgreSQL (optimisation évidente pour des bases de données complexes à très complexes, avec vues et procédures stockées très rapides, mais requêtes simples censées renvoyer de la ligne à la chaîne beaucoup plus lentes, une vraie incitation à se replonger dans Merise, cette base…), mais sans les sockets UNIX, que le système utilise historiquement énormément, le portage a dû recourir à des artifices sous Windows, assez peu convaincants, en particulier du point de vue de la consommation de RAM, qui m’a semblée un peu supérieure, en Windows 32 bits, à la version Linux en 64 bits. La stabilité devrait quant à elle être au rendez-vous, puisque j’ai fait planter Apache 2 Windows avant PostgreSQL 8 Windows (sur deux machines séparées et équivalentes), et aucune des nombreuses et puissantes fonctionnalités de la base n’est perdue, mais est-ce assez pour être convaincant ? Honnêtement, moi j’ai tendance à dire que c’est… "bien compte-tenu du prix". On est plutôt sous SQL Server (nonobstant le lock table sur les transactions, que je juge toujours inadmissible), loin sous Oracle, des lieues sous DB2. Mais je pense que PostgreSQL progressera beaucoup plus vite.
Enfin fais toi ton avis, tu confirmeras !
août 22nd, 2005 à 11:29
Pour constituer une base carto libre, il pourrait y avoir un site internet où chaque internaute du monde est invité en entrer les coordonnées de son adresse postale personnelle…(d’où l’analogie avec wikipedia dans ton article je suppose)
août 22nd, 2005 à 12:54
clem, ceci permettrait plutôt de faire une base annuaire “riche”.