Facebook - OGSL Twitter - OGSL LinkedIn - OGSL
Menu

2. Définitions

La gestion de données est un processus qui comporte de multiples ramifications autant au niveau du développement que de la mise en œuvre de l'ensemble de l'architecture, des processus et des pratiques de gestion de l'ensemble du cycle de vie des données d'une organisation, d'un groupe de recherche ou d'une équipe de projet.

La portée du présent document se voulant de nature générale, des notions de base sont présentées, afin de permettre au lecteur de s'y retrouver dans le domaine technique parfois complexe qu'est la gestion des données scientifiques, à commencer par les quelques définitions suivantes :

Données

Toute information pouvant être enregistrée en format numérique incluant texte, nombre, image, vidéo, audio, logiciel, algorithme, équation, animation, modèle, simulation, etc. Ces données peuvent être générées de diverses manières comme par observation, calcul ou expérimentation. 1

Données ouvertes

Les gouvernements adoptent de plus en plus une approche « ouverte » afin de rendre accessibles les données et les informations gouvernementales financées à l'aide des fonds publics. 2 Cette notion est également à la base d'initiatives non-gouvernementales favorisant la transparence, l'obligation de rendre compte et la réutilisation des données. Gartner 3, un leader mondial en recherche sur les technologies de l'information, définit les données ouvertes comme de l'information ou du contenu rendu gratuitement disponible pour l'utilisation et la redistribution à condition d'en créditer la source. Les formats de données ouverts non-propriétaires conservent les données sous une forme qui permet à un utilisateur d'accéder librement aux données sans obligation de se procurer un logiciel (ou une version du logiciel) en particulier. Ex. : document texte avec extension .ODF (Open Document Format). 4

Données géoréférencées / géospatiales / géodonnées

Les données géospatiales sont des données qui réfèrent à un lieu géographique et qui comportent une position X-Y [Latitude-Longitude] ou, au moins, une référence à un site dont on peut calculer la position. Souvent, les données possèdent également une composante verticale Z [profondeur/altitude].

Jeu de données

Un jeu de données est un ensemble de données organisées souvent sous une forme tabulaire où les champs (colonnes) correspondent aux diverses variables mesurées et les lignes aux valeurs de ces variables. Plusieurs formes existent incluant par exemple les formats structurés (ex. CSV – Coma Separated Values), géospatiaux (ex. GeoTIFF) et XML (Extended Markup Language) utilisé pour les métadonnées d'un jeu de données.

Domaines d'intervention de GEOSS
DOMAINES D'INTERVENTION DE GEOSS :
désastres, santé, énergie, climat, agriculture, écosystèmes, biodiversité, eau et météo.

GEOSS

Global Earth Observing System of Systems : regroupement international d'organisations mettant en commun leurs expertises dans neuf domaines ou « bénéfices de société ». GEOSS contribue au monitorage, à l'analyse et à l'accessibilité des données dans ces domaines. 5

Information

De façon très générale, la distinction entre « données » et « informations » tient au fait que les données sont dites observables et brutes, résultant de recherches ou d'activités de monitorage alors que l'information fait référence à des données qui ont été traitées et/ou interprétées. 6

Interopérabilité

L'interopérabilité est la capacité que possède un produit ou un système informatique à fonctionner sans restrictions avec d'autres produits ou systèmes existants et ce, indépendamment de leur architecture physique et de leurs systèmes d'opération respectifs, grâce à l'utilisation de normes ouvertes de l'Internet. Le World Wide Web Consortium – W3C 7 s'est donné comme mission de guider et de contribuer à l'évolution du Web en développant des protocoles, des normes et des lignes directrices qui favorisent l'interopérabilité.

ISO

L'Organisation internationale de normalisation (ISO) est le premier producteur mondial de Normes internationales dans une multitude de domaines allant des codes pour la représentation des monnaies, aux normes pour les compteurs d'eau, en passant par celles décrivant la représentation de la date et de l'heure. Les Normes internationales ISO établissent des spécifications pour les produits, les services et les bonnes pratiques dans une optique de qualité, de sécurité et d'efficacité. 8

Un monde sans métadonnées…

…serait comme un club vidéo sans sections thématiques et où on trouverait des centaines de boîtes de DVD dont les couvertures et étiquettes ont été retirées des boîtes et des disques eux-mêmes.

Comment trouver un film en particulier ?
Comment connaître l'inventaire disponible sans devoir ouvrir chaque boîte et faire jouer chaque DVD ?

Comment pourrait-on trouver des données environnementales sur le Saint-Laurent si aucun producteur ne documentait ses données et n'en publiait l'existence de façon à les rendre découvrables ?

Métadonnées

Fichier de données décrivant un jeu de données. La référence en la matière est la norme internationale ISO 19115.

Moissonnage

Action de récolter des métadonnées dans divers catalogues. Un service de moissonnage fait en sorte que des données décrites dans un registre puissent être plus largement découvertes.

Norme

Document définissant des exigences, des lignes directrices, des spécifications, ou des caractéristiques à employer systématiquement pour assurer l'utilisation cohérente de produits, de processus et de services.

Registre / Catalogue

Les services de catalogues permettent la publication et la recherche de collections d'information descriptive (métadonnées) à propos de données et de services de données. Ils ont, de plus, la capacité de moissonner (harvesting) des métadonnées dans d'autres catalogues 9. L'Open Geospatial Consortium (OGC) fait une distinction entre « catalogue » et « registre » en précisant qu'un registre est un catalogue spécialisé maintenu par une entité officielle et se conformant aux procédures et aux politiques d'accès et de gestion du contenu (normes ISO 19135, ISO 11179-6).

Service de données

Un service de données rend des données (incluant texte, image, vidéo, audio) disponibles et les distribue via Internet. Ex. : Fil de nouvelles RSS.

  1. National Science Board. 2005. Long Lived Digital Data Collections: Enabling Research and Education in the 21st Century. 92 p.
    http://www.nsf.gov/geo/geo-data-policies/nsb-0540-1.pdf
  2. Gouvernement du Canada – Données ouvertes.
    http://ouvert.canada.ca/fr/donnees-ouvertes
  3. Gartner – Open Data.
    http://www.gartner.com/it-glossary/open-data
  4. ISO. 2006. OpenDocument OASIS standard for data interoperability of office applications.
    http://www.iso.org/iso/home/news_index/news_archive/news.htm?refid=Ref1004
  5. Fontaine, K.S. 2007. Architecture and Data Management Challenges in GEOSS and IEOS. 10 p.
    http://ntrs.nasa.gov/archive/nasa/casi.ntrs.nasa.gov/20070017998.pdf
  6. International Oceanographic Data and Information Exchange (IODE) - Marine Data Management.
    http://www.iode.org/index.php?option=com_content&view=article&id=3&Itemid=33
  7. World Wide Web Consortium (W3C).
    http://www.w3.org/
  8. Organisation Internationale de Normalisation (ISO).
    http://www.iso.org/iso/fr/home/standards.htm
  9. Open Geospatial Consortium (OGC).2014. OGC I15 (ISO19115 Metadata) Extension Package of CS-W ebRIM Profile 1.0. 136 p.
    http://www.opengis.net/doc/ISx/csw-ebrim-i15/1.0