# Introduction

💡 Découvrez nos nouveaux guides !

Nous avons travaillé à la refonte des guides et une nouvelle version beta est disponible.

Découvrir les nouveaux guides

Rédaction de ce guide

Ce guide a été publié initialement fin mars 2020 et est mis à jour de manière régulière. Il résulte d'une co-rédaction entre les équipes d'Etalab et d'OpenDataFrance. Si vous souhaitez faire des propositions pour le faire évoluer, vous êtes invités à entrer en contact avec nous.

Lexique : Schémas de données

Les schémas de données (ou simplement schémas) permettent de décrire la structure d'un fichier d'un jeu de données. Ils indiquent clairement quels sont les différents champs, comment sont représentées les données, quelles sont les valeurs possibles, leur format, etc.

La création de données en conformité avec un schéma de données existant apporte plusieurs bénéfices :

  • Les données créées peuvent être facilement croisées avec d’autres données conformes au schéma de données utilisé ;
  • L’interopérabilité des données et leur croisement est simplifié ;
  • Si le jeu de données que vous créez est une agrégation de plusieurs fichiers produits par différents acteurs, la formalisation et le partage d’un schéma de données facilite le travail d’agrégation des données - ce schéma devient donc un standard pour votre communauté ;
  • La formalisation d’un schéma de données assure une pérennité des fichiers dans le temps ;
  • La documentation d’un schéma de données existant est déjà rédigée et accessible.
  • La présence d'un schéma de données existant peut faciliter l'ouverture des données, les producteurs ayant directement une procédure claire à suivre.

Il est également possible de vérifier la conformité d'un fichier vis-à-vis d'un schéma de données, ce qui permet de valider un premier niveau de qualité de votre jeu de données. Par ailleurs, il est aussi possible de générer des jeux de données d’exemple ou de proposer des formulaires de saisie standardisés.

schema.data.gouv.fr

Le site schema.data.gouv.fr est l’initiative de la plateforme data.gouv.fr. L’objectif de ce site est de référencer les schémas de données publiques existants en France.

# À qui s’adresse ce guide ?

Ce guide s’adresse à des personnes susceptibles de créer des schémas de données. Vous pouvez vous trouver dans cette situation si vous envisagez de partager des données avec des partenaires ou à tout le monde en open data.

# À quoi sert-il ?

Ce guide propose de vous accompagner lors des phases nécessaires à la création d’un schéma de données et à son référencement sur schema.data.gouv.fr le cas échéant.

  1. Phase d’investigation : envisager de créer un schéma de données ;
  2. Phase de concertation : rassembler plusieurs parties prenantes pour créer un schéma de données ;
  3. Phase de construction : implémenter le schéma de données obtenu après la phase de concertation;
  4. Phase de maintien et de promotion : faire la promotion d'un schéma auprès d'autres parties prenantes et le faire évoluer si besoin

Il propose un processus à suivre, des bonnes pratiques et des outils.

Conseil de lecture

Nous vous recommandons de lire une première fois ce guide en intégralité afin de prendre connaissance des différentes phases. Vous pourrez ensuite vous référer aux pages pertinentes au fur et à mesure de votre avancée.

# Sources

Ce guide s'inspire du contenu rédigé par de nombreux partenaires, listés par ordre alphabétique :

Merci à eux !