« Ouvert » n’est pas « Vrai »

5 mars 2012

J’ai assisté, il y a quelque jours, à une soirée organisée à la Cantine sur l’Open Data vu par les candidats à l’élection présidentielle. J’ai été agréablement surpris par le niveau de compétences sur le sujet des différents intervenants (chaque candidat déclaré, sauf le FN, avait dépêché un représentant qui parlait au nom de son champion).

La soirée était finalement relativement consensuelle : tout le monde trouve que l’Open Data, c’est bien ;-). Le seul point (un peu) clivant était en fait le type de licence que chacun recommandait de mettre en place pour protéger les contenus mis à disposition. Les uns (les plus à gauche) préconisent une licence très restrictive quant à l’utilisation commerciale des données (licence virale de type GPL dans le monde de l’Open Source). A l’autre bout, des licences plus « libérales » permettent toute utilisation même commerciale des données, à condition de citer la source (c’est le cas de la licence ouverte qui régit les données publiées par la mission etalab). Entre les deux, des licences permettent l’utilisation commerciale pour proposer des services à valeur ajoutée tout en imposant le « partage à l’identique » et la redistribution des données produites (c’est le type de licence ODbL utilisée par la Mairie de Paris pour ses publications).

Je ne suis pas un expert, mais il me semble que le problème de ce dernier type de licence (un peu chèvre et chou) est de fixer la limite entre Création Produite et simple Base de Données dérivée, la seconde obligeant un partage à l’identique, la première pouvant se limiter à la mention de la source. Qui décide et comment ?

En fait si je fais ce billet, c’est que j’ai été surpris que personne ne fasse mention d’un point qui me semble pourtant essentiel : comment garantir l’intégrité de l’information produite à partir des données ouvertes utilisées ?

Je m’explique. La donnée ouverte brute a une caractéristique intéressante : elle est mise à disposition par l’état ou un organisme public ou parapublic qui lui confère une certaine garantie de qualité liée à la confiance qu’on peut accorder à son producteur. C’est ce qui fait dire à beaucoup de gens que l’Open Data, en permettant à chaque citoyen d’accéder directement aux données « à la source » l’aidera à prendre des décisions éclairées et à savoir si les politiques lui mentent ou non (chacun pourra faire son « fact checking » personnel). L’Open Data serait donc un grand progrès pour la démocratie.

Je suis assez dubitatif : la donnée n’est pas l’information. Ne serait-ce que parce qu’elle est extrêmement volumineuse, la donnée ouverte n’est pas manipulable ni a fortiori directement interprétable par le citoyen. Pour faire un parallèle avec un monde que je connais mieux, on a besoin de requêter, manipuler, agréger, transformer la donnée pour créer l’information nécessaire à la prise de décision (c’est justement le propos de l’informatique décisionnelle).

Autrement dit, les citoyens devront passer par des intermédiaires qui proposeront cette information agrégée (et donc interprétée). Mais qui va contrôler cette interprétation ? Qui va garantir que sous couvert d’une donnée objective issue directement de l’INSEE par exemple, ne se cache pas une information biaisée ? On le sait, il est extrêmement facile de « faire dire ce qu’on veut aux chiffres ». Il n’y aura pas, ici, de règles déontologiques (celles qui encadrent les instituts de sondages) ou d’éthique professionnelle (celle des bons journalistes par exemple) pour freiner, ou au moins expliciter, les interprétations partisanes. Et l’intégrité ne va pas de soi.

J’applaudis des deux mains tout ce qui peut encourager l’état à nous restituer notre propriété (ces données dont nous payons la production avec nos impôts). Je suis persuadé que nous avons là une nouvelle source de création de valeur et donc de richesse. Mais je n’y vois, malheureusement pas, le grand pas en avant démocratique promis par tous les speakers de la soirée.

One Response to “« Ouvert » n’est pas « Vrai »”

  1. Frédéric ZgudNo Gravatar Says:

    Personnellement, je trouve les commentaires précédent particulièrement pertinents.
    Ceci précisé, je pense qu’il en sera des données interprétées comme il en est déjà de la production d’information sur le net : tout le monde en produit à son échelle, chacun se fait son opinion et on a tendance à croire plus volontiers les sources que l’on considère plus fiables, généralement celles liées à des organismes jugés crédibles déjà auparavant (journaux…). Non ?

Leave a Reply

buy sale viagra
buy viagra online price
buy discount levitra
buy sale viagra
viagra 100 mg
buy cheap cialis
buy viagra
cheapest levitra
buy viagra online
buy viagra usa
buy viagra online
buy now viagra
buy price viagra
buy now levitra
buy discount viagra
cheap viagra online
buy viagra fedex
buy viagra overnight
buy viagra las vegas
generic viagra
cheap price viagra
Pfizer viagra free samples
generic cialis
cialis black reviews
buy cheap cialis
free madonna ringtones
cheapest cialis
buy now viagra online