Etape 3 : Phase de construction
Lexique : Phase de construction
La phase de construction consiste à implémenter techniquement le schéma de données obtenu aprÚs la phase de concertation. Pour cela, il est nécessaire de choisir un standard technique, créer les fichiers requis, les tester et les diffuser.
Durant cette phase, il est nécessaire de mobiliser des personnes possédant des compétences techniques. Cette phase consiste à transcrire les décisions prises lors de la phase de concertation en un ou plusieurs schémas de données suivant le découpage en fichiers retenu.
Choisir un standard technique pour la description d'un schéma de données
Lexique : Standard
On utilise les termes « normes » et « standards » pour dĂ©crire un rĂ©fĂ©rentiel commun et documentĂ© destinĂ© Ă harmoniser lâactivitĂ© dâun secteur.
Il existe plusieurs standards techniques pour les schémas de données.
Le standard est Ă choisir en fonction :
de la nature des données concernées ;
des habitudes de lâĂ©cosystĂšme produisant ou rĂ©utilisant les donnĂ©es liĂ©es au schĂ©ma.
Les principaux standards techniques sont les suivants :
Table Schema : adapté pour la description de données tabulaires (sous forme de tableurs ou de CSV). Ce standard technique utilise le format JSON ;
JSON Schema : adapté pour la description de données avec une notion de hiérarchie. Ce standard utilise le format JSON ,
XML Schema Definition (XSD) : adapté pour la description de données avec une notion de hiérarchie. Ce standard utilise le format XML.
Tous ces standards techniques sont supportés par schema.data.gouv.fr.
Conseil : Aller au-delĂ de la documentation texte
Un schéma de données décrit uniquement par du texte ou par un tableau se prive de nombreux avantages, notamment celui de l'interopérabilité entre différents systÚmes informatiques.
Les schĂ©mas de donnĂ©es dĂ©crits par des standards techniques permettent, en plus dâune documentation textuelle ou sous forme dâun tableau, de valider que des donnĂ©es correspondent Ă un modĂšle de donnĂ©es, dâagrĂ©ger des donnĂ©es similaires, de gĂ©nĂ©rer automatiquement des donnĂ©es respectant un schĂ©ma.
Créer un schéma de données
Une fois un standard technique choisi, il faudra créer les fichiers requis pour modéliser les données.
La documentation de chaque standard technique décrit le contenu des fichiers à renseigner. Reportez-vous aux documentations respectives pour tirer parti des fonctionnalités avancées offertes : types de données et contraintes sur les valeurs en particulier.
Il est possible de vĂ©rifier quâun fichier correspond Ă un standard Ă lâaide dâoutils en ligne ou en ligne de commande. Utilisez ces outils pour vĂ©rifier que vos productions correspondent au standard.
Exemples Ă votre disposition
Pour un schéma au format Table Schema, un modÚle de départ est mis à disposition pour créer un dépÎt Git contenant un schéma au format Table Schema.
Pour les autres formats de schémas, il est conseillé de consulter les schémas et dépÎts Git listés sur schema.data.gouv.fr.
Documenter un schéma de données
En complément du fichier du schéma de données, il est recommandé de rédiger a minima deux documents complémentaires :
Une documentation gĂ©nĂ©rale qui indique le contexte, les modalitĂ©s de production des donnĂ©es, le cadre juridique, la finalitĂ©, les cas dâusage etc. Ce fichier est traditionnellement rĂ©digĂ© en Markdown et nommĂ©
README.md;Un fichier rĂ©pertoriant les changements permettant de suivre les modifications, dâune version Ă une autre. Ce fichier est traditionnellement rĂ©digĂ© en Markdown et nommĂ©
CHANGELOG.md.
La présence de ces fichiers représente un package complet (documentation, liste des changements et schéma de données décrit dans un standard technique), apprécié des réutilisateurs. schema.data.gouv.fr se repose sur ces éléments pour intégrer votre documentation et votre liste de changements sur une page web.
Exemple : La documentation et la liste des changements du schéma des lieux de stationnement.
Publier et diffuser un schéma de données
Une fois votre schĂ©ma de donnĂ©es créé, il est nĂ©cessaire de le publier et de le diffuser pour que dâautres personnes puissent en bĂ©nĂ©ficier.
Il est recommandé de publier vos schémas de données en tant que logiciels libres, sur votre forge de développement ou par le biais de GitLab ou GitHub.
Vous bénéficierez alors des avantages habituels des dépÎts de code Git en ligne :
Historique des modifications
Fonctionnalités de tickets
Demandes de modifications.
etc.
Il est conseillĂ© d'utiliser un compte dâorganisation (dĂ©diĂ© Ă votre entreprise, direction, service, ministĂšre) et non un compte personnel afin dâassurer une URL stable dans le temps.
Exemples Ă votre disposition : Plusieurs dĂ©pĂŽts Git de schĂ©mas sont disponibles sur schema.data.gouv.fr (exemple : le dĂ©pĂŽt Git dĂ©crivant les lieux de stationnement Ă lâaide dâun schĂ©ma TableSchema sur GitHub).
Pour faciliter la découverte de votre schéma de données et des données sous-jacentes, il est recommandé de le faire référencer sur schema.data.gouv.fr. La marche à suivre est détaillée ici.
Points de sortie
Ă lâissue de cette phase, vous devriez :
Last updated