Facebook - OGSL Twitter - OGSL LinkedIn - OGSL
Menu
Acquisition

3. Cycle de vie des données

3.3 Acquisition

La quantité de données environnementales qui est récoltée à l'échelle mondiale lors d'expériences, d'observations, de simulations et de captation par divers senseurs et satellites est si énorme qu'elle va jusqu'à être qualifiée de « déluge de données » 1. Il importe donc, dans chaque cas, de s'assurer que les données soient documentées de façon appropriée afin qu'elles puissent être trouvées et utilisées par les moteurs de recherche et les outils de moissonnage de données (data mining, data harvesting).

3.3.1 Vocabulaire contrôlé

Un des éléments clés à considérer est l'utilisation de vocabulaire contrôlé, c'est-à-dire d'une nomenclature reconnue et normalisée. Il est essentiel d'adopter une approche la plus près possible de ce qui se fait à l'échelle internationale de façon à ce que les données puissent être reconnaissables, intelligibles, compréhensibles et, éventuellement, retrouvables et accessibles par d'autres utilisateurs ou par divers systèmes d'information. Conséquemment, l'emploi de noms de variables reconnus et de dictionnaires de données établis et utilisés par la communauté internationale, permet d'éviter de la confusion. Pour des besoins spécifiques de certaines communautés, des organisations mettent également en place des serveurs qui fournissent aux utilisateurs la nomenclature appropriée.

Quelques exemples de ressources de référence sont présentés ci-dessous :

  • GCMD - le Global Change Master Directory (GCMD) 2 de la NASA est une référence dans le domaine des données environnementales. GCMD fournit non seulement un vocabulaire contrôlé mais également des ressources de haute qualité pour la découverte, l'accès, l'utilisation et le partage de données scientifiques mondiales.
  • CIEM - le Conseil International pour l'Exploration de la Mer (CIEM) met à disposition des codes de référence pour les données océanographiques, environnementales, les données de missions de recherche par chalutage et par pêche commerciale ainsi que les codes de plateformes d'échantillonnage 3.
  • BODC - le British Oceanographic Data Center (BODC), centre de données désigné du Natural Environment Research Council (NERC) 4, offre l'accès à des listes de termes normalisés couvrant un large éventail de disciplines pertinentes pour les communautés d'utilisateurs et fait partie du réseau SeaDataNet, une infrastructure pan-européenne de gestion de données marines et océaniques 5.
  • ITIS - Integrated Taxonomic Information System (ITIS) 6 est un système intégré qui fournit de l'information taxonomique officielle sur les plantes, les animaux, les champignons et les microbes (noms d'espèces, codification taxonomique TSN et classification hiérarchique).
  • WoRMS - le World Register of Marine Species (WoRMS) 7 est un répertoire de listes officielles d'organismes marins et de synonymes des noms d'espèces. La version canadienne est le Canadian Register of Marine Species (CaRMS) 8.
  • CFMetadata - le CF (Climate and Forecast) Metadata 9 est une convention de la NASA et du Earth Science Data Systems Working Group qui favorise l'interopérabilité entre les producteurs, utilisateurs et services de données grâce à une norme claire et non ambiguë pour la représentation de géolocations, du temps et de quantités physiques.
  • MMI - Le Marine Metadata Interoperability (MMI) 10 fait la promotion de l'échange, l'intégration et l'utilisation de données marines et favorise la publication, la découverte, la documentation et l'accessibilité les plus efficaces. Il offre un cadre sémantique, des normes de vocabulaire et des outils de documentation de métadonnées.
  1. Hey, A.J.G. and A.E. Trefethen. 2003. The Data Deluge: An e-Science Perspective. In, Berman, F., G.C. Fox and A.J.G. Hey (eds.). Grid Computing - Making the Global Infrastructure a Reality. Wiley and Sons, p. 809-824.
  2. Olsen, L.M., G. Major, K. Shein, J. Scialdone, S. Ritz, T. Stevens, M. Morahan, A. Aleman, R. Vogel, S. Leicester, H. Weir, M. Meaux, S. Grebas, C.Solomon, M. Holland, T. Northcutt, R. A. Restrepo and R. Bilodeau. 2013. NASA/Global Change Master Directory (GCMD) Earth Science Keywords. Version 8.0.0.0.0 .
    http://gcmd.nasa.gov/learn/keyword_list.html
  3. International Council for the Exploration of the Sea (ICES). Vocabulary Server.
    http://vocab.ices.dk
  4. Natural Environment Research Council (NERC). Vocabulary Server.
    http://www.bodc.ac.uk/products/web_services/vocab/
  5. SeaDataNet - Pan-European Infrastructure for Ocean & Marine Data Management. Common Vocabularies.
    http://www.seadatanet.org/Standards-Software/Common-Vocabularies
  6. Integrated Taxonomic Information System (ITIS).
    http://www.itis.gov
  7. World Register of Marine Species (WoRMS).
    http://www.marinespecies.org
  8. Canadian Register of Marine Species (CaRMS).
    http://www.marinespecies.org/carms/index.php
  9. Climate and Forecasts (CF) Metadata.
    https://earthdata.nasa.gov/standards/climate-and-forecast-cf-metadata-conventions
  10. Marine Metadata Interoperability (MMI).
    https://marinemetadata.org/