Données de forte valeur : métadonnées obligatoires et modalités de rapportage
Précisions pratiques pour les producteurs de données de forte valeur
Last updated
Précisions pratiques pour les producteurs de données de forte valeur
Last updated
Les données de forte valeur (HVD) ont vocation à remonter sur la plateforme data.gouv.fr dans le cadre des obligations de rapportage établies dans . Les modalités techniques définies ici font l'objet d'un travail concerté et itératif avec plusieurs parties prenantes, notamment dans le cadre de groupes de travail portés par le CNIG. Des discussions sont en cours sur ces modalités techniques et de nouvelles précisions sont à venir.
Ce guide présente :
Il a vocation à être enrichi au gré des nouvelles précisions. Une foire aux questions sera également alimentée.
Pour les producteurs concernés (cf. ), la remontée des données de forte valeur sur data.gouv.fr se déroule selon les étapes suivantes :
Les données sont identifiées comme étant de forte valeur et sont classées dans l’une des 6 grandes catégories précisées dans les 6 annexes du règlement d'exécution (géospatiales, météorologiques, etc.). Selon la catégorie associée, les conditions de mise à disposition et les métadonnées obligatoires diffèrent.
Les données ainsi identifiées remontent au niveau national en étant :
soit moissonnées sur (cf. ) et éventuellement le selon leur nature ;
soit publiées directement sur .
Les données sont moissonnées par pour proposer un catalogue européen des données de forte valeur.
Plusieurs métadonnées sont obligatoires dans le cadre des données de forte valeur.
Une métadonnée identifiant le jeu de données comme étant un HVD via l'utilisation d'un mot clé "hvd"*.
Une métadonnée identifiant la catégorie HVD à laquelle la donnée appartient
via les mots clés suivant* :
Météorologiques
Entreprises et propriété d'entreprises
Géospatiales
Mobilité Observation de la terre et environnement Statistiques Les mots clés sur data.gouv.fr sont automatiquement normalisés (mis en minuscule, etc.).
Les Etats membres de l'Union européenne sont soumis à une obligation de rapportage auprès de la Commission européenne, dans le cadre du règlement d'exécution.
Les données géospatiales
Les données sur l’observation de la Terre et l’environnement
Les données de mobilité
Pour éviter une double saisie, les producteurs de données ne produisent et ne maintiennent qu'une seule fiche, répondant aux deux législations. La remontée se fait ensuite de manière automatique au niveau européen pour répondre à ces deux obligations.
Voici une proposition de schéma de rapportage dans le cas de jeux de données concernés à la fois par la directive INSPIRE et le règlement d'exécution se rapportant aux données de forte valeur :
Pour qu’une même fiche de données soit doublement moissonnée mais ne soit pas créée de manière dupliquée au niveau européen, il est important que l’identifiant de la fiche de données soit stable dans le temps et correctement préservé au cours des différents moissonnages.
Les producteurs de données doivent donc être particulièrement vigilants lors de la mise en place des différents moissonnages.
La licence des données. Celle-ci doit être équivalente ou moins restrictive que la . Nous recommandons la . En savoir plus sur les ou sur les .
*Si vous publiez via moissonnage à partir de plateformes géographiques supportant les thèmes de vocabulaires contrôlés (ex: GeoNetwork) les mots clés sont déduits via une URI du vocabulaire issue du ().
Si vous publiez par moissonnage il est préconisé de suivre les bonnes pratiques DCAT-AP, pour disposer d'un identifiant stable dans le temps.
La licence des données. Celle-ci doit être équivalente ou moins restrictive que la . Nous recommandons la . En savoir plus sur les ou sur les .
*Si vous publiez via moissonnage à partir de plateformes géographiques supportant les thèmes de vocabulaires contrôlés (ex: GeoNetwork) les mots clés sont déduits via une URI du vocabulaire issue du ().
Si vous publiez par moissonnage il est préconisé de suivre les bonnes pratiques DCAT-AP, pour disposer d'un identifiant stable dans le temps.
Aujourd’hui, ne permet pas de modéliser et de moissonner les métadonnées d'API comme attendu dans le cadre des HVD. sont en cours sur le sujet.
Les producteurs de données ne sont pas responsables de ce rapportage. Celui-ci se fait par le catalogue via (DCAT).
Les pour la description en DCAT de ces jeux de données de forte valeur ont fait l'objet d’un travail concerté au niveau européen et des Etats membres.
Aujourd’hui, certaines des métadonnées demandées ne sont pas correctement modélisées ou moissonnées dans . C’est le cas des informations de description de service pour les APIs. Ces points sont bien identifiés et seront résolus en amont de l’application du règlement relatif aux données de forte valeur. Ils font l'objet de discussions lors du .
La remontée des données INSPIRE se fait via le , portail national géré par le Bureau de recherches géologiques et minières (BRGM) et dédié aux données géographiques.
La remontée des données de forte valeur, quant à elle, se fait via , la plateforme nationale des données publiques françaises, gérée par la Direction interministérielle du numérique (DINUM).
Cependant, pour 3 catégories d'ensembles de données de forte valeur, et le règlement d'exécution se rapportant aux données de forte valeur se recoupent et se renforcent :
Dans ce cas, les métadonnées doivent également respecter le cadre défini par .
La question des identifiants fait l’objet d’ lors du .