Gérer le cycle de vie des données signifie “harmoniser” voire “normaliser” mais pas tout et pas trop : harmoniser suffisamment pour faciliter la centralisation des données et leur réutilisation mais pas trop, afin de laisser aux producteurs de données et aux utilisateurs, la liberté d'adapter les données aux problématiques actuelles et à venir. A l'échelle d'une organisation comme l'Inrap, l'équilibre entre les besoins collectifs et les nécessités individuelles ou locales est sans cesse discuté.
L'Inrap s'est lancé dans la gestion de ses données numériques avec l'ambition de maîtriser la totalité des étapes du cycle de vie en interne, conduisant, à termes, à modifier l'organisation du travail développée antérieurement à l'ère du tout numérique dans l'objectif principal, sinon unique, de réaliser des opérations.
Les choix qui régissent le cycle de vie des données de l'inrap s'appuient sur plusieurs initiatives successives :
-
2009 : la bibliothèque numérique de l'Inrap DOLIA renfermant la plus grosse collection de rapports d'opération, décrits de manière normalisée ;
-
2013 : la définition d'arborescences de rangement des fichiers numériques pour en faciliter la transmission et la conservation ;
-
2014 : le catalogue de données spatiales CAVIAR alimenté par les données géoréférencées des opérations structurées selon la norme interne des “7 couches” ;
-
la réflexion sur les systèmes d'enregistrement de terrain tel le développement et la mise en application récente de BADASS, un système d'enregistrement spatial et relationnel utilisant l'interface QGIS ; fondé sur la normalisation des propriétés géométriques des données en “7 couches” et s'appuyant sur l'arborescence de rangement des fichiers de 2013 pour l'accès aux données sources ;
-
2022 : les travaux en cours sur l'édition structurée des rapports d'opérations en XML-TEI afin de faciliter l'exploitation des informations qu'ils contiennent (projet Arche) ;
-
2025 : la plateforme Archipel dont l'ambition est de rendre progressivement accessibles, dans la limite du possible, les données scientifiques de l'Inrap.
Ainsi se dessinent les objectifs d'un dispositif numérique cohérent permettant, à termes, d'accéder aux données hors et dans leur contexte de collecte soit par la donnée elle-même selon des critères géographiques, morphologiques, chronologique et/ou fonctionnels, soit par l'événement producteur des données, soit par le chercheur qui l'a produite. La gestion du triptyque événement/données/chercheurs est destinée à multiplier les canaux d'accès et à contextualiser les données dans un processus qui s'apparente à une forme nouvelle, exclusivement numérique, de mémoire vive collective.