Open data à la française:
tous contre Google!
Le projet de loi pour une République numérique pourrait contribuer à clarifier la question de l’Open data dans le domaine des transports. Mais en attendant le vote final mi-mai, les langues se délient. Celles des opérateurs tout d’abord, avec la publication d’une tribune de Jean-Pierre Farandou, président de l’UTP, intitulée «L’ouverture des données oui, la fin du secret industriel non» (les Echos, 6 avril 2016). Mais aussi les start-up, avec la mise en ligne par Citymapper d’une pétition dont l’objectif est de pousser la RATP à ouvrir ses données en temps réel, sans conditions. Interrogés par Mobilettre, une écrasante majorité des acteurs du secteur déclarent qu’il est enfin temps de s’intéresser véritablement à ce sujet, qui jusqu’à présent, était considéré comme un gadget. Mais comment, et pour quel résultat?
Si la logique d’une large ouverture des données, au bénéfice des voyageurs, prévaut dorénavant, l’obsession de la protection des intérêts des uns et des autres pourrait singulièrement complexifier des échanges et affecter la performance finale des applications. L’Open data à la française peut-elle concilier les intérêts légitimes de tous? Notre enquête.
Quoi de plus banal que les fiches horaires d’un réseau de bus ou la carte d’un réseau de métro? Quoi de plus classique qu’une application qui donne accès à ces informations? Désormais, les usagers des transports publics sont en attente d’une information voyageurs exhaustive, rapide et précise. Pour répondre à cette exigence toujours plus importante, la promesse de l’open data est de libérer l’innovation grâce à la créativité de tous. Mais ouvrir des données, cela n’est pas si simple qu’il n’y parait : qui doit réaliser la démarche (exploitant ou AOT?), selon quelles modalités (type de données, licence, monétisation…), pour quel coût et enfin, avec quel financement? Ces différentes questions, légitimes, ont été au centre des nombreux échanges lors des discussions autour du rapport Jutand, puis de la loi Macron et enfin de la loi numérique portée par Axelle Lemaire.
Lors de la remise du rapport Jutand, en mars 2015), la volonté était de «tout ouvrir et de favoriser l’innovation». Mais progressivement, cet élan s’est vu freiné, notamment par deux craintes très largement diffusées :
- une volonté farouche et partagée de réduire voire bloquer l’accession gratuite de Google aux données (via Google Maps)
- la recherche d’un modèle économique pérenne et viable, l’ouverture des données ayant un coût, notamment pour le temps réel.
«Des délégataires du transport français préfèrent se couper de leurs usagers en enfermant leurs données dans des coffre-forts»
Voilà pourquoi la loi Macron, votée en août 2015, propose certes «des données diffusées librement, immédiatement et gratuitement en vue d’informer les usagers et de fournir le meilleur service», mais pose surtout des conditions à l’ouverture : «des dérogations au principe de gratuité» puis «un délai raisonnable de mise à disposition». Ces conditions doivent être inscrites dans un code de conduite, à la charge des opérateurs. A peine promulguée, la loi Macron était vivement critiquée, notamment par l’association Regards Citoyens, qui dénonce un travail de sape «des délégataires des services publics du transport français qui préfèrent se couper de leurs usagers en enfermant leurs données dans des coffre-forts plutôt qu’informer en toute transparence les citoyens sur leurs activités».
Voilà le problème nettement, voire crûment posé… Les institutions abusent-elles de leur pouvoir au détriment des usagers? Quelques mois plus tard, la même association se réjouissait des différentes modifications que pourrait apporter la loi numérique portée par Axelle Lemaire – même si le Républicain Christophe-André Frassa, rapporteur de la loi au Sénat, annonçait que pour lui «l’open data c’est oui, mais l’open bar, non». Il ne sera pas le seul à veiller au grain, puisque 375 amendements ont été déposés. Les élus se sont donc investis, tout comme les opérateurs de transports, représentés par le président de l’UTP, Jean-Pierre Farandou. Ils souhaitent peser dans le processus démocratique. L’organisation professionnelle, contactée par Mobilettre a rappelé sa ligne directrice : «Assurer la sécurité juridique, respecter les savoir-faire et la propriété industrielle et enfin, mesurer les coûts», tout en précisant que «le projet de loi prévoit l’ouverture de toutes les données. Ce principe bénéficiera surtout aux géants du Net, seuls à même de pouvoir tirer profit de ces énormes volumes d’informations».
Les dispositions relatives aux Gafa sont-elles complexes et inefficaces?
L’ambiguïté rédactionnelle des lois et projets de loi, leur enchevêtrement révèlent un profond embarras face à la puissance des Gafa (Google, Amazon, Facebook et Apple). Prenons l’exemple des licences pour l’accès aux données. Le modèle le plus partagé en France est celui de l’ODbl, choisi par la Ville de Paris, la Région Ile-de-France, le Stif ou encore les métropoles de Rennes et Bordeaux. Cette licence offre de grandes libertés, mais engage le ré-utilisateur à partager son travail et à maintenir ouverte la base de données. Pour Jean-Baptiste Casaux, Business Developper chez Citymapper, «ce type de licence est peu adapté à des données horaires, encore moins en temps réel puisqu’elles sont modifiées très régulièrement. Lorsque l’on échange avec les exploitants, ils nous expliquent que ces licences ont surtout été mises en place pour contrer Google et qu’un simple feedback suffit. Mais le problème c’est qu’aucun outil n’a vraiment été mis en place pour réaliser ces feedback». Néanmoins, l’objectif de ce premier filtre semble être atteint, puisque ce flou juridique a, pour le moment, réussi à freiner Google.
Autre exemple, la monétisation de l’accès aux données, afin de répondre à la question du coût, notamment sur le temps réel. La loi Macron prévoit «des dérogations au principe de gratuité à l’égard des utilisateurs de masse, justifiées par des coûts significatifs de mise à disposition, sans toutefois que la contribution des utilisateurs puisse excéder ces coûts». Parmi les utilisateurs de masse, on pense bien sûr à Google… Certains opérateurs utilisent déjà cette possibilité offerte par la loi et proposent un système dit «freemium»: à partir d’un certain nombre de requêtes à la base de données, l’accès à l’API est payant. Si à première vue, ce dispositif semble adapté, en réalité il s’oppose à deux problèmes :
A Rennes, la Star ne fait pas payer l’accès aux données car on ne sait pas réellement combien coûte l’open data pour l’opérateur
Mais nous n’avons pas trouvé d’exploitant ou d’AOT capable de décrire avec précision le coût d’ouverture et d’exploitation de ses données en open data. Même à Rennes, Christophe Millot, chef de projet digital chez Keolis et spécialiste du sujet, le confesse: «Pour le moment la Star ne fait pas payer l’accès aux données car on ne sait pas réellement combien coûte l’open data pour l’opérateur». Pour certains développeurs, en réalité, peu importe le coût puisqu’il existe de nombreuses possibilités de contournement. Lorsque la donnée n’existe pas, le crowdsourcing (la participation de citoyens renseignant directement les données sur le réseau) peut être utilisé. Le scraping, une manière moins officielle de récupérer des données, est aussi possible. Enfin, une firme comme Google peut se permettre d’envoyer ses propres salariés pour cartographier les réseaux de transports, ce qui explique pourquoi le réseau RATP est malgré tout disponible sur Google Maps.
Sur le terrain, c’est chacun sa stratégie
Parallèlement à ces grandes manœuvres législatives, que se passe-t-il sur le terrain ? En Ile-de-France, souvent décrite comme «l’exception à la française», le système est complexe à appréhender. Du côté de l’autorité organisatrice de transports, le Stif, la politique est plutôt claire: elle pousse à l’ouverture des données transports et propose sa propre plate-forme d’exposition des données, qui regroupe l’ensemble des offres (Transilien, Optile, RATP), ainsi qu’une explication concernant les licences associées. Pour autant, malgré ce souci de centralisation, chaque opérateur francilien propose sa propre plate-forme. La SNCF donne accès à ses données Transilien sur le site data.sncf.com. Elle y propose ses propres jeux de données, son API ainsi qu’une licence «maison». La RATP en fait tout autant, avec son site data.ratp.fr, ses propres données et ses différents types de licences (ODbl, RATP, Etalab). La principale différence entre les deux réseaux provient de l’absence de données temps réel du coté de l’entreprise parisienne. Leur point commun? Un acteur extérieur souhaitant créer une appli multimodale francilienne devra jongler entre les différentes plates-formes, licences, type de données et modèles économiques associés!
Selon Jean-Baptiste Casaux, la situation observée à Paris est singulière et c’est en grande partie contre cela que se bat le business developper de Citymapper (notamment à travers une pétition mise en ligne le 9 avril dernier, lire ci-dessous), avec en ligne de mire la RATP. Cette dernière, en attendant d’ouvrir officiellement ses données temps réel, a bloqué l’accès à Citymapper. Selon Pascal Auzannet, cela était nécessaire car plus d’un million de requêtes provenaient chaque jour de la start-up. La RATP rouvrira les vannes courant 2016, mais avec une API payante, dans une logique freemium. Interviewée par nos confrères du Journal du Net, elle précise : «Il n’est pas question qu’un acteur développe dans son coin une application capable de croiser les données temps réel des transport à celles des commerces locaux, par exemple, et d’en tirer profit, en la commercialisant notamment, sans la partager avec les autres. Il doit être interdit de confisquer une utilisation faite en Open data. Citymapper est-t-elle prête à jouer le jeu?» Aujourd’hui, les intéressés affirment qu’il est hors de question de payer cet accès…
En province, le jeu d’acteurs est plus simple, peut-être trop d’ailleurs. Alors que les conseils régionaux sont autorités organisatrices de transports, c’est la SNCF qui réalise l’ouverture des données TER, à travers son propre dispositif. Pour le député de Gironde Gilles Savary, c’est une parfaite illustration de la relation entre les conseils régionaux et leur exploitant. Selon lui, on assiste à une véritable «cécité intermodale», voulue par la SNCF, qui «tente de maîtriser la totalité de la chaîne de déplacement, notamment via la donnée». Pour lui, les régions sont «véritablement émasculées» et l’Open data ne fait qu’illustrer ce qui se passe à l’échelle nationale et européenne. Avant de questionner: «Pourquoi les données transports et leur gestion ne feraient pas l’objet de conditions inscrites directement dans les conventions TER?». Cela permettrait à chaque région d’afficher sa propre stratégie et ne pas laisser totalement la main à l’exploitant du réseau.
«La marchandisation des données SNCF n’est pas la réponse à Google»
Parce que la stratégie dominante et offensive appliquée par la SNCF à l’échelle régionale l’est aussi à l’échelle nationale. C’est bien l’Epic qui gère ses données Transilien, TER et TGV. Elle propose sa propre licence et son propre modèle économique, dit freemium : au-dessus d’un certain nombre de requêtes sur son API, le ré-utilisateur doit payer l’accès aux données. Simon Chignard, spécialiste des questions de données, avait lancé un «tu déconnes Yves! » à l’attention d’Yves Tyrode, directeur Digital de la SNCF, en 2015 lors d’un débat organisé sur ce sujet. Plus tard, il s’expliquait sur son blog dans un article intitulé: «La marchandisation des données SNCF n’est pas la réponse à Google». Interrogé par Mobilettre le 12 avril à l’occasion de la conférence de presse #SNCF DIGITAL, Yves Tyrode rappelait quant à lui la stratégie du groupe: «Nous avons aujourd’hui 80 jeux de données ouverts et 2500 entreprises connectées, du jamais vu dans le monde. Nous ouvrons nos data, tout acteur qui souhaite se connecter le peut, Citymapper lui-même est connecté à ce programme», avant de parler lui-même d’un «bémol», à savoir que «quand le partenaire pèse un pourcentage significatif de l’audience Internet mondiale, pour cet utilisateur de masse (on pense aux GAFA), il faut proposer un modèle économique dans lequel il contribue au financement de la data. C’est donc payant pour les très gros et gratuit pour les autres».
Dans les métropoles, les autorités organisatrices de transports semblent avoir bien pris la mesure de ce que représente l’Open data. A Bordeaux, c’est bien l’AOT, Bordeaux Métropole, qui expose les données transports en Open data sur son propre portail, avec d’autres données mises à disposition par la collectivité. Ces données, centralisées, sont disponibles en temps réel, selon un seul modèle de licence ODbl, et de manière gratuite. Du côté de Rennes Métropole, pionnière de l’Open data en France, Keolis propose une démarche inédite de labellisation des applications issues du travail de la communauté de développeurs Open data. C’est notamment grâce à ce dispositif que l’opérateur gère les «utilisateurs de masse», qui dépassent les 5000 requêtes chaque jour. Selon le chef de projet digital de Keolis Rennes, Christophe Millot, «ce dispositif favorise l’émergence d’applications performantes et un feedback intéressant pour l’exploitant du réseau». Ou comment lutter intelligemment contre Google…
Un véritable écosystème reste à inventer
Si le cadre législatif n’est pas encore totalement stabilisé à l’échelle hexagonale, cela n’empêche pas quelques acteurs d’expérimenter de nouveaux dispositifs.
Transdev communique assez peu sur l’Open data. Pourtant, l’opérateur développe petit à petit sa stratégie. Au travers d’expérimentations de terrain tout d’abord, comme par exemple l’application multimodale «Optimod» déployée par sa filiale Cityway à Lyon. Au travers de partenariats avec des spécialistes du sujet, comme l’ADEME et son accélérateur européen dédié à l’innovation «La Fabrique des Mobilités». Enfin, l’opérateur a mobilisé Rahul Kumar, ancien business developper Trandev à San Diego, en Californie, pour piloter la Digital Factory. L’objectif de cette micro-structure installée au siège de l’opérateur est de créer une base de données Open data transports à vocation mondiale. Un hub qui deviendrait une référence pour tous les acteurs du domaine.
Chez Keolis, on regarde du côté des start-up devenues des références dans le domaine. A Bordeaux, l’exploitant a signé avec Moovit un partenariat inédit en France. Il permet à la start-up israélienne d’accéder aux données transports et à des informations «circonstanciées», comme un accident sur une ligne de tram, mais aussi de bénéficier de la force de communication locale de l’opérateur. En échange, Moovit donne accès à Keolis à ses données crowdsourcées, afin que l’exploitant puisse enrichir sa compréhension des flux et réagir rapidement aux sollicitations.
Ce type de partenariats et d’échanges existe aussi à l’étranger, l’exemple le plus connu étant celui de Rio de Janeiro, qui échange ses données avec Strava, Moovit et Waze. Mais sans aller jusqu’au Brésil, Jean-Baptiste Casaux explique que ce type de dialogue existe avec de nombreuses AOT européennes, comme à Londres, où «Citymapper est souvent sollicitée par Transport for London pour tester de nouvelles expérimentations». Au-delà du fait qu’ils contribuent à «équilibrer les pouvoirs», ces partenariats ont un second avantage: celui d’améliorer la qualité des données. En effet, le problème, peu évoqué par les exploitants, existe bel et bien: de nombreux ré-utilisateurs se plaignent d’avoir accès à des données de piètre qualité. Pourtant, là aussi des solutions existent. Pour Bertrand Billoud (Kisio Digital), «une première étape consisterait à unifier les données proposées au grand public et celles utilisées pour l’exploitation du réseau, ce que fait par exemple la Star à Rennes».
«Ces applications nous font progresser et la concurrence est plutôt bonne pour l’émulation»
Mais selon lui, plus fondamental que la donnée en elle-même, «c’est la discussion et l’échange entre tous les acteurs de l’écosystème» qui doit prévaloir. Une relation de confiance, qui, une fois installée, est bénéfique pour tous: à Strasbourg par exemple, l’autorité organisatrice interpelle régulièrement les start-up pour savoir si les données mises à disposition sont de bonne qualité, notamment lors de mises à jour. C’est cet esprit de communauté qu’il s’agit de créer, et c’est pour cette raison que Kisio échange avec la plupart des start-up du secteur et avec de nombreux développeurs. C’est aussi pour cela qu’elle ouvre son algorithme et prône l’open innovation à tout-va. Mais pour son responsable de la communication, cela doit aller plus loin et il est essentiel que tout le monde y mette du sien, car «si les acteurs publics tentent parfois de brouiller les pistes, les acteurs privés refusent aussi de jouer le jeu. Les applications comme Moovit ou Citymapper n’ouvrent pas leurs algorithmes en open source». Néanmoins, il insiste sur le fait que toutes ces applications sont une excellente chose pour l’information voyageurs : «Elles nous font progresser et la concurrence est plutôt bonne pour l’émulation». Cette émulation passe aussi par un rapprochement avec les utilisateurs des applications, qui, gratuitement, peuvent cartographier des réseaux complets grâce au crowdsourcing. C’est d’ailleurs le parti pris des sociétés comme Moovit et CItymapper. Une relation d’autant plus intéressante que lorsqu’elles sont en temps réel, les informations fournies ont une grande valeur ajoutée : elles permettent d’alerter sur un problème survenu en ligne, informer sur le taux de remplissage d’un bus, d’une rame de métro…
Enfin, il est sûrement possible d’apaiser les relations entre les entités publiques qui possèdent les données et les ré-utilisateurs, quels qu’ils soient. La majorité des interlocuteurs interrogés par Mobilettre pense qu’il est désormais temps de clarifier les conditions d’accès, notamment via les dispositifs de licence. Parce que certes, l’actuelle schizophrénie d’une «ouverture contrôlée» écarte pour le moment Google, mais complexifie aussi et surtout le travail de tous les autres acteurs. A tel point que certaines situations deviennent cocasses: comment mixer des données Transilien avec des données Autolib, qui ne fonctionnent pas avec le même type de licence? C’est le flou artistique, dans une situation qui semble pourtant banale. Il en va de même pour la monétisation de l’accès aux données. Pierre Valentin, Country Manager France de Moovit, nous le confirme: «Nous ne payons pas d’accès aux données, ni en France, ni à l’étranger. Lorsque nous n’avons pas accès aux données, nous faisons appel au crowdsourcing». Chez Citymapper, le discours est le même : «Il n’y a qu’à Paris que les opérateurs nous demandent de payer. Ailleurs, le débat n’existe même pas, on pense plutôt à collaborer avec les start-up pour impulser des innovations». Voilà pourquoi les deux start-up sont fermement opposées à des échanges financiers avec les autorités. Cette logique est parfois partagée par certaines autorités publiques elle-mêmes, qui au lieu de financer leur propre appli tout en faisant payer l’accès à leurs données, préfèrent laisser les start-up s’en occuper et investir dans d’autres missions.
La France a toutes les clés en main pour évoluer sur la question de l’Open data. D’autres pays européens semblent être de bons exemples, à l’image de l’Angleterre ou encore des Pays-Bas. Sans aller aussi loin, quelques métropoles françaises semblent proposer des modèles intéressants. A Paris, le Stif pourrait-il reprendre le leadership sur ce sujet? Au moment même où nous écrivons, l’AOT francilienne lance un marché d’assistance à l’animation de sa démarche Open data. L’objectif: «Accompagner le Stif dans sa démarche d’ouverture des données en particulier sur l’animation, la conception d’une démarche de labellisation de réutilisations, l’identification et la mise en œuvre de partenariats…»
Désormais, il s’agit de porter une ambition partagée par tous et de clarifier de nombreux sujets. Pour Pascal Auzannet, «si jusqu’à présent, on a fait beaucoup de com sur l’Open data, il est temps désormais de passer aux choses sérieuses». Garantes d’une information voyageurs de qualité, les autorités publiques ont le pouvoir de mutualiser leurs réflexions afin de limiter les coûts d’exploitation de la donnée, améliorer sa mise en qualité et démocratiser son ouverture en temps réel. Les start-up, de leur côté, sont en attente de conditions claires et acceptables.
Les usagers enfin, loin des réflexions des autorités publiques, possèdent un pouvoir que personne ne doit négliger: en tant qu’utilisateurs, ce sont eux qui diront si une application est pratique ou pas. Ce sont donc eux aussi qui la noteront et contribueront à créer des succès comme Moovit ou Citymapper à l’échelle mondiale. A moins que Google Maps ne mette tout le monde d’accord?
Retour sur le conflit RATP-Citymapper
Cela a commencé le samedi 9 avril, jour de la mise en ligne d’une pétition sur la désormais célèbre plateforme change.org (la même qui héberge la non moins fameuse « loi travail, non merci ! ») par la jeune startup Citymapper. Le soir même, cette dernière apparaissait dans les colonnes de nos confrères du Monde, qui titrait «Citymapper, cette start-up qui agace la RATP». Et depuis, c’est un déchainement sur la toile. Mais quel est le sujet de la discorde?
Tout vient d’un refus de la RATP d’ouvrir ses données en temps réel à Citymapper, qui explique pourtant bénéficier de ce type de data dans de nombreuses métropoles dans le monde.
D’un côté, une entreprise publique qui se frotte comme elle le peut au numérique. De l’autre, une très jeune start-up du digital
C’est une parfaite illustration de l’opposition entre deux univers. D’un côté, une entreprise publique de transports et ses 50 000 salariés, qui se frotte comme elle le peut au numérique. De l’autre, une très jeune start-up du digital, créée par un ancien de Google, pilotée depuis Londres, grâce à une trentaine de jeunes salariés. La start-up fonctionne grâce à des fonds privés (la dernière levée se chiffrait à 40 millions de dollars) et est aujourd’hui valorisée à plus de 350 millions d’euros.
Ce sont aussi deux manières de communiquer. D’un côté, Jean-Baptiste Casaux, la trentaine, le «business developper France» de Citymapper. C’est lui qui a lancé la pétition en ligne ayant déjà atteint 17000 signatures et qui anime le buzz sur le web avec une très grande agilité. Il utilise le compte Twitter de la start-up et ses 13000 abonnés pour distiller subtilement les tweets les plus impactants, à l’image de celui que Nathalie Kosciuzko-Morizet a publié le 14 avril: «J’invite la RATP à libérer ses données, carburant essentiel de la nouvelle économie pour des apps comme Citymapper». Il utilise également l’appli elle-même pour informer les utilisateurs sur les avancées «du dossier». C’est ainsi qu’il publiait un premier billet intitulé «ce qu’en pensent les Parisiens», qui reprend les meilleurs commentaires observés sur la pétition puis une «revue de presse» des différents médias ayant parlé de «l’affaire RATP». Très prétentieux, pas vraiment objectif, mais efficace comme relais de lobbying…
De l’autre, il y a la RATP, qui, habituée des communiqués de presse, a mis du temps pour réagir. Quand les jeunes «start-upers» londoniens twittent le week-end, il a fallu attendre le lundi pour lire une réponse de l’entreprise: un papier publié sur le site du Journal du Net auquel Dominique de Ternay a accordé une interview, puis un billet directement rédigé par la RATP sur le très branché «Medium» (la RATP ayant créé un compte pour l’occasion). Cette stratégie de communication réduite à des médias ou relais de la communauté digitale révèle la difficulté ou l’embarras à porter le débat devant le grand public. La position des institutions pourrait apparaître fatalement défensive face au dynamisme innovant des start up. Et comme l’on sait qu’en matière de communication, mieux vaut avoir la main que subir…
Mobilettre, mai 2016