Les données publiques sont un bien commun, au même titre que les idées scientifiques. Ce postulat, c’est celui qui a servi de base à l’open data, belle idée née en 2007 à San Francisco, de la bouche d’un professeur de droit et d’un entrepreneur du Web. Cinq ans plus tard, en 2013 donc, la charte du G8 pour l’ouverture des données publiques était signée. Le début d’un accès généralisé aux données, renforcé çà et là par de nombreuses lois permettant de définir les conditions d’exercice de ce droit. Il faut dire que le concept de l’open data est séduisant : grâce à lui, les citoyens peuvent connaître les actions des institutions en toute transparence.
Les Systèmes d’Information et les processus sont facilités. On peut envisager de nouvelles méthodes de travail, plus libres, comme le pilotage en temps réel des politiques publiques. Ou encore limiter les demandes de documents administratifs, ceux-ci étant en libre accès sur Internet. Bref, l’open data est régulièrement présenté comme une belle idée. Mais comme toute belle idée, elle n’est pas exempte de critiques. Quels en sont les risques et les limites ? Décryptage !


Moyens et accessibilité, deux limites à l’open data

Des moyens parfois insuffisants

C’est sans doute la limite la plus évidente de l’open data : pour partager des données, encore faut-il… en avoir les moyens. En effet, certains domaines jugés sensibles, stratégiques, voire rémunérateurs, n’ont pas encore fait l’objet d’une libération des données, faute de budget suffisant.
C’était par exemple le cas de l’équipe Etalab en France, dirigée par l’ancien conseiller Internet de François Fillon, qui disposait d’un budget largement insuffisant de 4 millions d’euros pour mettre en œuvre sa politique open data. C’est aussi, à une autre échelle, l’un des enjeux auxquels doit faire face le portail data.gouv.fr : il est connu, beaucoup de gens l’utilisent, mais ses moyens ne sont pas à la hauteur de ses ambitions, ralentissant grandement son potentiel !
Résultat ? Des données fermées, qui créent des conflits — éthiques, stratégiques… — dans plusieurs secteurs. D’autres données incomplètes, à cause d’un certain cloisonnement. Et un idéal « open data » loin d’être atteint partout !

La publication des données, ce n’est pas l’accessibilité

De plus, ajoutons que ce n’est pas parce que les données sont en ligne qu’elles sont accessibles. En effet, tout d’abord, leur réutilisation peut ne pas être aisée. Ce sera le cas dans les domaines des finances publiques, du commerce ou encore de la finance privée. Les entités mettent des données en ligne, certes, mais elles sont invérifiables puisque sans lien avec les données qui ont permis de faire les conclusions.
C’est d’autant plus vrai que l’on déplore souvent une absence de normalisation. Les formats des données, publiées parce que la réglementation l’impose, sont difficilement exploitables. Et quand les acteurs ne se donnent pas la peine de sourcer leurs conclusions, c’est encore plus compliqué !

Des compétences incontournables

Accessibilité toujours, mais version compétences. Les données sont de plus en plus accessibles, mais quid de la culture de la donnée ? Beaucoup de compétences sont en effet nécessaires pour pouvoir les exploiter :

  • Il faut savoir repérer les sources,
  • Traiter les données,
  • Les manipuler,
  • Être capable de porter un regard critique, sur elles, leur production et leur ouverture,
  • Comprendre les statistiques pour les interpréter…

Une ouverture scientifique à perfectionner

Le libre accès ne concerne pas uniquement les administrations et les entreprises : les scientifiques sont également priés de partager leurs données (y compris celles à la base des publications, donc pas uniquement les thèses et les articles). Or, s’ils passaient volontiers par Google Scholar pour permettre à tout le monde de retrouver les publications classées par thèmes, ils ne semblent pas encore prêts à ouvrir l’ensemble de leurs données. Ce qui est un frein notable à l’expansion de l’open data !

Quels risques sont engendrés par l’existence même de l’open data ?

Vers la privatisation des données publiques ?

Les entreprises peuvent mener vers un triple risque en matière d’open data : la privatisation des données publiques, la marchandisation et l’utilisation massive et abusive.
Commençons par la privatisation des données publiques. Public et privé ne sont pas confrontés aux mêmes exigences en matière de pertinence, de transparence et de clarté : au public, les règles incontournables, au privé la liberté — en caricaturant légèrement. C’est par exemple le cas des entreprises qui se réapproprient les images de Google StreetView, pour indiquer que tel restaurant ou telle entreprise se trouve à une adresse donnée. Pour ce faire, elles s’appuient sur des données publiques, se les approprient et les détournent, sans que personne ne leur demande de prouver ce qu’elles avancent. Ce que ne pourraient pas faire les administrations…


A lire également : Ne confon­dez pas Data & Big-data


Ce qui amène à un autre travers : la marchandisation des données. L’APIE (Agence du patrimoine immatériel de l’État) a une mission : mettre en valeur le patrimoine public. Elle propose ainsi deux modèles de licence de réutilisation des données publiques. Excluant, de fait, les TPE et les petites PME du système, celles-ci n’ayant pas assez d’argent à consacrer à l’achat de données publiques, et créant un regrettable déséquilibre entre celles qui ont les moyens d’acheter de la data, et celles qui ne peuvent qu’en rêver.
Terminons, enfin, avec l’une des plus grandes craintes des observateurs de l’open data : que certaines entreprises étrangères profitent à moindre coût des données, pour en faire un usage commercial. Certains n’hésitent pas à parler de pillage, puisque celles-ci ne rapporteraient rien à l’État — elles ne paient pas d’impôt en France ! — tout en profitant gratuitement des données publiques…

L’essence même de l’open data se trouve dans l’article 15 de la Déclaration des droits de l’homme et du citoyen, stipulant en substance que la société a le droit de demander des comptes à tout agent public de l’administration. La France a donc été pionnière de cet idéal, qui se poursuit aujourd’hui avec la création de la fonction d’Administrateur général des données. De quoi être enthousiaste et verser dans l’optimisme : les possibilités de l’open data vont continuer à se développer, avec des lois qui permettront d’empêcher toute utilisation frauduleuse des données et qui renforceront la transparence… pour le public comme pour le privé !


Pour aller plus loin :


Pour recevoir tous les mois les articles de Datanergy, inscrivez-vous !

Jenny Dujeux

Publié par Jenny Dujeux

Ingénieure Efficacité énergétique