Aller au contenu principal
Retour au site principal de la Bibliothèque de l'ÉTS
 

La gestion des données de recherche (GDR): Formats de fichiers propriétaires et formats de fichiers ouverts

Ce guide diffuse de l'information et des ressources pour appuyer la communauté de recherche de l'ÉTS dans la gestion des données de recherche.

Qu’est-ce qu’un format de fichier?

Le format de fichier est la structure d'un fichier qui indique à un programme comment afficher son contenu. Par exemple, un document Microsoft Word enregistré au format de fichier .DOC s'affiche mieux dans Microsoft Word. Même si un autre programme peut ouvrir le fichier, il se peut qu'il ne dispose pas de toutes les fonctionnalités nécessaires pour interpréter correctement le document. (Computer Hope, 2022)

Chaque type de fichier (texte, image ou son) dispose de nombreux formats de fichier. Le format est indiqué dans l'extension du nom de fichier.

 Illustration par Alfan Subekti repéré chez Vecteezy

Parmi les formats utilisez les plus couramment utilisés, il y a:

  • .xls (Microsoft Excel)
  • .mp3 (pour l'audio numérique)
  • .docx (Microsoft Word)
  • .gdoc (document Google)

 

Exercice 1

Un club de danse de Châteauguay conserve ses documents depuis le début des années 2000. Récemment, un membre du club a voulu se référer à l'agenda du 5 juillet 2003 (veuillez consulter le fichier WordPerfect ci-dessous) mais n'a pas pu l'ouvrir.

Essayez de télécharger ce document et de le récupérer sur votre ordinateur.

Photo de David Pupăză repérée sur Unsplash

Constat: il s'agit d'un ancien fichier propriétaire qui ne peut plus être ouvert. Cette inaccessibilité peut arriver à d'autres formats propriétaires comme Microsoft Word ou Google Docs.

Que sont les formats propriétaires ?

Les formats propriétaires sont en général limités par :

  • des brevets logiciels;
  • le manque de détails quant aux spécifications de format;
  • un cryptage intégré pour empêcher une utilisation ouverte par le public.

Il est obligatoire d’utiliser le logiciel du fournisseur pour pouvoir utiliser le format propriétaire

Photo de Roth Melinda sur Unsplash

Dans certains cas, une industrie peut traiter des formats de fichiers spécifiques comme une norme de facto même si les formats sont propriétaires et reposent sur des logiciels coûteux.

Que sont les formats ouverts ?

Les formats ouverts:

  • ne sont pas propriétaires.
  • sont librement accessibles à tous.
  • permettent aux développeurs open source d'utiliser les spécifications du format qui ont été publiées pour écrire des logiciels permettant de continuer à utiliser le format de fichier en question au cas où son fournisseur ne le prendrait plus en charge;
  • peuvent réduire le risque d'obsolescence technique en supprimant la dépendance vis-à-vis de la technologie sous-jacente.

Photo de valérie faiola sur Unsplash

Favorisez les formats ouverts car ils sont plus durables et plus faciles à conserver sur le long terme

Favoriser la qualité du fichier ou sa taille ?

La qualité du fichier et la représentation de ses caractéristiques font aussi partie des critères de sélection du format de fichier.

En termes simples, si vous voulez une meilleure qualité d'image, vous aurez besoin d'un encodage de plus grande taille pour gérer la haute résolution. Cependant, cela signifie que le fichier prendra plus d'espace de stockage et sera moins pratique à partager avec d'autres personnes.

Photo de Kier in Sight sur Unsplash

Formats de fichiers courants recommandés pour la conservation à long terme

Les format propriétaires ne sont durables à cause des restrictions inhérentes à leur utilisation. Par conséquent, il n'est pas recommandé de les utiliser pour la conservation des données à long termes

Lorsque l'analyse des données est terminée et que les données doivent être préparées pour un stockage à long terme, la conversion des données doit être envisagée. L'utilisation de formats ouverts, standards, interchangeables et durables permet garantir la facilité d'utilisation des données à long terme. Cette pratique est également recommandé pour les sauvegardes.(UK Data services, 2021)

Le tableau suivant présente les formats de fichiers recommandés pour le partage, la réutilisation et la préservation des données:

Type de fichier Formats recommandés
Texte XML, ASCII, TXT, PDF
Images TIFF, JPEG2000, PNG, JPEG/JFIF
Vidéo MOV, MPEG-2
Audio PCM, WAVE, DSD
Base de données (Dataset) CSV, TSV, .db, .sqlite, Shapefile
Données Web  JSON, XML, HTML

Pour plus de conseils sur les les formats de fichiers recommandés, consultez la section Ressources du présent guide.

Exercice 2

Cas pratiques de préservation d'ensembles de données à long terme:

Accéder à cet ensemble de données :

Koralesky, Katherine; Sirovica, Lara; Hendricks, Jillian; Moulins, Katelyn ; von Keyserlingk, Marina; Weary, Daniel, 2022, "Acceptation sociale de la technologie du génie génétique"https://doi.org/10.5683/SP3/NX3LZ9 , Borealis, V2

  • Téléchargez un fichier Excel (.xlsx) et convertissez-le en CSV ; 
  • Téléchargez un fichier Word (.docx) et convertissez-le en PDF ou .txt.

Photo de Compare Fibre sur Unsplash

Bravo!

Bravo! Vous savez maintenant quels formats de fichiers sont appropriés pour la conservation des données afin que vos données de recherche puissent être conservées à plus long terme !

Photo de Vasily Koloda sur Unsplash