“Documentation is a love letter that you write to your future self.” Damian Conway (2005)
La documentation des données peut être définie comme la description claire de tout ce qu'un nouvel "utilisateur de données" ou "votre futur-moi" aurait besoin de savoir pour trouver, comprendre, reproduire et réutiliser vos données, de manière indépendante et sans risque d'interprétation erronée. Elle doit décrire clairement comment vous avez généré ou utilisé les données, pourquoi et où trouver les fichiers associés. Il pourrait également être utilisé comme documentation d'intégration pour les nouveaux collègues, même si le chercheur responsable quitte le projet. L'élaboration d'un plan de gestion des données (PGD) peut faciliter l'élaboration de la documentation.
La documentation des données est nécessaire à deux niveaux : la documentation sur l'ensemble de l'étude ou du projet et la documentation sur les enregistrements individuels, les observations ou les points de données. (Adapté de ELIXIR Belgium, 2020)
Voici une liste d'éléments importants à considérer pour assurer une documentation adaptée qui facilitera le repérage de l’information, le partage des données au sein de l’équipe de recherche et leur possible réutilisation tout en veillant à leur assurer une pérennité tout au long de leur vie utile (Université de Sherbrooke, 2022):
Les métadonnées sont une documentation très structurée. Les métadonnées lisibles par machine ou exploitables rendent vos (méta)données plus trouvables, accessibles, interopérables et réutilisables. Elles augmentent donc la qualité et la visibilité des données auprès d’une communauté scientifique, et par conséquent leur potentiel de réutilisation et de reconnaissance. Elles sont aussi utiles pour la préservation numérique à long terme des données.
Les métadonnées devraient être accompagnées de la documentation suffisante (comme les manuels de logiciels, la conception des enquêtes et les guides d'utilisation, etc.), préparée par la personne qui a créé les données, afin de permettre l'utilisation de la ressource par d'autres. (Adaptée de Digital Preservation Coalition, 2021)
Le fichier LISEZ-MOI (ou README) est un fichier texte généralement nommé LISEZ-MOI.txt ou README.txt, au format ouvert .txt, qui présente et explique un projet. Il fait partie de la documentation des données qui devrait être produite au début du projet. Il permet d'enregistrée sous forme de texte libre toute information qui ne peut pas être enregistrée de manière hautement structurée.
Les utilisateurs potentiels de données du projet en question doivent normalement le consulter avant de consulter les données.
Les services d'hébergement de code tels que GitHub , Bitbucket et GitLab rechercheront également votre LISEZ-MOI et l'afficheront avec la liste des fichiers et des répertoires de votre projet.
Avant de montrer un projet à d'autres personnes ou de le rendre public voire pendant la phase de planification. Il est recommandé de prendre l'habitude d'en faire le premier fichier que vous créez dans un nouveau projet.
De plus, certains dépôts de données peuvent demander qu'un fichier LISEZ-MOI soit déposé avec la liste des fichiers afférents aux données du projet ainsi que toutes informations pertinentes. Créer un fichier LISEZ-MOI au début de chaque projet vous fera gagner du temps plus tard.
En fonction du nombre de dossiers/fichiers dont vous disposez et du nombre d'années pendant lesquelles vous allez les conserver, vous pouvez créer un fichier LISEZ-MOI pour votre répertoire ou pour chaque dossier et sous-dossier créé dans votre répertoire, afin de documenter des parties spécifiques de vos données.
Il est recommandé d'avoir un fichier LISEZ-MOI dans le répertoire de niveau supérieur du projet étant donné que c'est à cet endroit qu'une personne non familière avec votre projet commencera sa consultation. Le fichier LISEZ-MOI placé à ce niveau devrait contenir des informations générales sur le projet et le système d'organisation des données utilisé.
Si un fichier LISEZ-MOI est placé dans un sous-dossier contenant des données brutes ou traitées, il doit contenir des informations descriptives pour ces données.
Assurez-vous que vos fichiers LISEZ-MOI ne sont pas trop longs.
(Adapté de Elixir Belgium, 2020 et Make a README, 2018)
Informations générales
*Répétez cette section si nécessaire pour chaque ensemble de données (ou fichier, le cas échéant)*
Directives et modèles de fichier LISEZ-MOI / README
ELIXIR Belgium (2020). RDM guide. Repéré à https://rdm.elixir-belgium.org/about_DMP
Digital Preservation Coalition (DPC) 2021. Manuel de préservation numérique. Repéré à https://www.dpconline.org/docs/digital-preservation-handbook2/2519-handbook-2021-fr/file
Université Sherbrooke (2022). Gestion des données de recherche: Documenter son projet et ses processus. Repéré à https://libguides.biblio.usherbrooke.ca/gdr/documenter
Make a README, 2018. Repéré à https://www.makeareadme.com/
Guide to writing “readme” style metadata. Cornell University. Repéré à https://data.research.cornell.edu/data-management/sharing/readme/