3. Cycle de vie des données

Télécharger le PDF

3.5 Archivage

3.5.1 Formats

Le format fait référence à la façon dont les données sont organisées dans un fichier électronique. La sauvegarde des données dans des formats standards et durables est un enjeu majeur en gestion de données. En effet, les données recueillies et préservées adéquatement pourront être consultées à long terme par les utilisateurs, peu importe l'évolution des outils de consultation utilisés.

POUR L'ARCHIVAGE DES DONNÉES :

  • enregistrer les données dans des formats ouverts non-propriétaires afin qu'elles puissent être lues à long terme indépendamment des logiciels et de leur évolution;
  • établir une nomenclature claire pour l'identification des fichiers de données;
  • établir une stratégie d'entreposage incluant deux différentes formes ex.: sur disque dur et sur CD et deux endroits physiques différents;
  • numériser la documentation papier et la conserver en format portable (ex. : PDF/A);
  • s'assurer que le lieu d'entreposage des données (numériques et non-numériques) est approprié et sécuritaire ;
  • copier les données sur un nouveau support (ruban magnétique, disque, etc.) de 2 à 5 ans après leur création puisque certains médias optiques et magnétiques sont sujets à la dégradation physique;
  • vérifier régulièrement l'état de l'intégrité des données enregistrées.

À titre d'exemple, la Norme ISO 19005 propose le PDF/A comme format de conservation à long terme des données1. ISO et IEC (International Electrotechnical Commission) approuvent également l'utilisation de formats ouverts comme ODF2 afin d'assurer l'interopérabilité et l'accès efficace aux données et lui ont conféré la désignation ISO/IEC 26300. Ce format est un standard notamment pour les documents de type « suite Office » incluant texte, chiffrier, présentation et éléments graphiques.

De son côté, la Library of Congress du Gouvernement américain, dresse un tableau complet de la démarche adoptée et du processus de décision en ce qui concerne la préservation des données et les formats des fichiers.3

En ce qui concerne les fichiers images et vidéos, Nozères (2011) a effectué un examen approfondi de l'archivage et des bonnes pratiques en la matière4. Les caractéristiques des divers formats d'imagerie, le géomarquage, les métadonnées et les options de stockage de données y sont présentés de façon détaillée.

NOMENCLATURE DE FICHIERS :

  • donner des noms de fichiers significatifs
    Ex. :2012-IVerte-Hareng009.xls
    [Par exemple, pour un chiffrier de données biologiques d'un échantillon no. 009 de hareng pris à l'Ile-Verte en 2012]
  • éviter d'utiliser des espaces,  des accents et des caractères spéciaux tels $/%& @!
  • éviter les noms de fichiers trop longs
    x. : 2012/08/19 pointe Est Ile Verte-échantillons JLambert.xls
  1. ISO. 2009. ISO 19005-1:2005 Document management - Electronic document file format for long-term preservation -- Part 1: Use of PDF 1.4 (PDF/A-1).
    http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=38920
  2. Open Document Format (ODF).
    http://www.opendocumentformat.org/aboutODF
  3. US Government – Library of Congress. Digital Preservation.
    http://www.digitalpreservation.gov/formats/intro/format_eval_rel.shtml
  4. Nozères, C. 2011. Gestion des données d'images en sciences aquatiques : une introduction aux bonnes pratiques et aux flux de travail. Rapp. Tech. can. Sci. halieut. Aquat. 2962F : xiv + 195 p.
    http://www.dfo-mpo.gc.ca/Library/345814.pdf