6. Valorisation des données par leur diffusion

Télécharger le PDF

L'utilisation des nouvelles technologies de l'information favorise l'accessibilité, la réutilisation et la valorisation des données, crée de nombreuses opportunités de collaboration, soutient l'innovation et facilite la réalisation de nouvelles recherches. La diffusion et le partage des données scientifiques soutiennent la valorisation et la démocratisation des données et font rayonner les travaux de recherche en science. Ces valeurs animent de plus en plus de gouvernements, d'organisations et de scientifiques à travers le monde et stimulent l'adoption de meilleures pratiques de gestion de l'ensemble du cycle de vie des données.

6.1 Principes

Le Gouvernement du Canada a établi une série de principes en matière de données ouvertes 1. Ces principes généraux peuvent aisément s'appliquer à tout jeu de données :

  1. Exhaustivité : les jeux de données devraient être aussi exhaustifs que possible et contenir l'ensemble de l'information colligée sur un sujet donné incluant les métadonnées qui définissent et expliquent les données brutes, de même que des explications sur les méthodes de calcul des données.
  2. Primauté : les données devraient provenir d'une source primaire, comprenant les renseignements originaux et toutes précisions disponibles sur la manière dont les données ont été recueillies afin de permettre aux utilisateurs de vérifier que l'information a été recueillie adéquatement et consignée avec exactitude.
  3. Rapidité : les données devraient être mises à la disposition des utilisateurs dans les meilleurs délais.
  4. Facilité d'accès physique et électronique : les jeux de données devraient être aussi facilement accessibles que possible en évitant de compliquer les conditions d'accès ou en exigeant des technologies ou applications trop contraignantes.
  5. Lisibilité par machine : les jeux de données devraient être conservés dans des formats de fichiers largement utilisés qui se prêtent aisément à un traitement par machine (ex. CSV, XML). Ces fichiers devraient être accompagnés de la documentation relative au format et à son mode d'utilisation en lien avec les données.
  6. Non-discrimination : les jeux de données devraient présenter le moins possible d'obstacles à l'utilisation par toute personne, à tout moment, sans qu'elle ait à s'identifier ou à fournir une justification.
  7. Utilisation de formats communs : dans la mesure du possible, les jeux de données devraient être conservés dans des formats de fichiers accessibles et non propriétaires afin d'éviter que l'utilisateur doive se procurer une application particulière pour lire les données.
  8. Licence d'utilisation : une licence ouverte est conçue de manière à limiter au minimum les restrictions à l'utilisation des données.
  9. Permanence : pour être utilisée de manière optimale, l'information publiée en ligne devrait rester en ligne avec un suivi des différentes versions et un archivage adéquats au fil du temps.
  10. Frais d'utilisation : les données ouvertes sont publiées gratuitement.

Le Gouvernement américain abonde dans le même sens avec le US White House Project Open Data 2 en affirmant que ses données seront documentées, complètes, réutilisables, publiques et disponibles en temps opportun. Un plan d'action pour les données ouvertes gouvernementales a été publié à cet effet en 2014. 3

À l'échelle mondiale, le Global Earth Observation System of Systems (GEOSS) base également son approche sur des principes visant le partage de données sans lequel les bénéfices de société visés ne peuvent être réalisables 4. L'accessibilité complète, ouverte et en temps opportun des métadonnées et des données est l'un des fondements de cette stratégie. À titre d'exemple, on peut citer le programme International Oceanographic Data and Information Exchange (IODE) du Intergovernmental Oceanographic Commission (IOC) de l'UNESCO qui vise à faciliter l'échange de données et d'informations océanographiques. 5

Devant la multiplicité des initiatives à travers le monde, un groupe de travail du GEO a examiné la situation qui prévaut chez les principaux acteurs mondiaux en matière de production et de gestion de données. Le groupe a soulevé particulièrement le besoin d'harmonisation des diverses approches, des terminologies et des définitions. 6

  1. Gouvernement du Canada – Données ouvertes.
    http://ouvert.canada.ca/fr/labc-des-donnees-ouvertes#toc6
  2. US White House Project Open Data.
    https://project-open-data.cio.gov/
  3. US Government. 2014. U.S. Open Data Action Plan. 21 p.
    https://obamawhitehouse.archives.gov/sites/default/files/microsites/ostp/us_open_data_action_plan.pdf
  4. Global Earth Observation System of Systems (GEOSS).
    http://www.earthobservations.org/geoss.php
  5. International Oceanographic Data Exchange (IODE).
    http://www.iode.org/
  6. GEO Data Sharing Working Group. 2013. Interpretation of the "Full and Open" Access to and Use of (Geographic) Data: Existing Approaches. 13 p.
    https://www.earthobservations.org/documents/dsp/201310_full_and_open_principle_interpretation_living_paper.pdf