📓
Guide DataSud
  • Bienvenue
  • ❓Foire aux questions
  • Documentation de datasud.fr
    • Créer un compte utilisateur, un groupe et rejoindre une organisation
    • Organisation
      • Créer une organisation
      • Suivre l'activité et modifier son organisation
      • Gérer les membres de son organisation
      • Groupes d’organisations
      • Configuration de permissions particulières des jeux de données
      • Supprimer une organisation
    • Jeux de données
      • Publier un jeu de données
      • Utiliser différents modes de publication de vos ressources
      • Gérer un jeu de données
        • Paramétrer le jeu de donnée
        • Consulter les statistiques de vos jeux de données
      • Explorer un jeu de donnée
      • Indexer un catalogue de données existant
    • Réutilisations
      • Publier une réutilisation
    • Moissonnage
      • Les limites du moissonnage
      • Correspondance des champs entre les catalogues
      • Mettre en place un moissonneur entre DataSud et Data.gouv
      • Analyser le rapport de moissonnage
    • Les Carte : MAPS
      • Consulter les cartes de DataSud
      • Créer une carte dans DataSud
      • Partager sa carte dans un espace de travail
  • Guides open data
    • Guide juridique
      • Producteurs de données
        • Comprendre la notion d'open data
        • Qui est concerné ?
        • Quelles sont les obligations ?
      • Réutilisateurs de données
        • Comprendre la notion d'open data
        • Respecter les conditions de réutilisation
      • Chronologie de l'open data
    • Guide qualité
      • Evaluer le niveau de qualité d'un jeu de données
      • Préparer un jeu de données de qualité
        • Extraire un jeu de données d'un système d'information
        • Structurer un jeu de données
          • Structurer une Base Adresse Locale
        • Lier des données à un référentiel
      • Documenter des données
        • Bien documenter un jeu de données
        • Diffuser la documentation d'un jeu de données
      • Améliorer la qualité d'un jeu de données en continu
        • Améliorer le score de qualité des métadonnées
        • Connaître et suivre les usages d'un jeu de données
        • Mettre en place une stratégie organisationnelle
      • Maîtriser les schémas de données
        • Comprendre les bénéfices d'utiliser un schéma de données
        • Créer un schéma de données
          • Etape 1 : Phase d'investigation
          • Etape 2 : Phase de concertation
          • Etape 3 : Phase de construction
          • Etape 4 : Phase de promotion et de maintien
          • Focus : Construire un schéma TableSchema
        • Intégrer un schéma de données à schema.data.gouv.fr
        • Produire des données en conformité avec un schéma
        • Indiquer et vérifier qu'une ressource respecte un schéma de données
  • Réutiliser des données
    • Utiliser les API géographiques
      • Utiliser l'API Adresse
        • Rappel sur les données adresses
        • Géocoder des adresses - théorie
        • Géocoder des adresses - cas pratiques
        • FAQ Adresse
      • Utiliser l'API Découpage administratif
      • Utiliser les tuiles vectorielles
    • Utiliser les données du cadastre
      • Comprendre les données du cadastre et leurs usages
      • Manipuler les données du cadastre
      • Foire aux questions sur le cadastre
    • Prendre en main l'API "Adresse" portée par l'IGN
  • Autres ressources utiles
    • Lexique de l'open data
    • Données de la commande publique
      • Publier les données essentielles d’attribution des marchés
      • Déclaration d’un profil d’acheteur
    • Données de forte valeur : métadonnées obligatoires et modalités de rapportage
    • Ressources OpenDataFrance
    • Documentation de transport.data.gouv.fr
Powered by GitBook
On this page
  1. Documentation de datasud.fr
  2. Moissonnage

Correspondance des champs entre les catalogues

Le moissonneur utilise l’API de CKAN pour récupérer les métadonnées des publications de DataSud.fr

Ce moissonneur attend l’URL racine de l’instance CKAN et non du portail

Exemple

Spécifications techniques

Ce moissonneur n’est pas compatible avec les changements de modèles qui peuvent être effectués par certains plugins. Les champs d’un jeu de données doivent rester les mêmes, et le format de leur contenu aussi.

Les champs additionnels du modèle sont ignorés.

Correspondance des champs du modèle

Jeu de données

La notion équivalente au jeu de données sur data.gouv.fr (Dataset) est le Package dans DATASUD.

DATA.GOUV.FR
DATASUD
NOTES

Slug

slug

name

Création uniquement, si disponible

Titre

title

title

Acronyme

acronym

❌

Description

description

notes

Mots-clés

tags

tags.name

Date de création

created_at

metadata_created

Date de mise à jour

last_modified

metadata_modified

Licence

license

license_id et license_title

deviné

Couverture spatiale

spatial

extras.spatial et extras.spatial-test

deviné

Couverture temporelle

temporal_coverage

extras.temporal_start et extras.temporal_end

Fréquence de mise à jour

frequency

extras.frequency

Autres métadonnées

Certaines propriétés additionnelles sont conservées dans l’attribut harvest par soucis de traçabilité. Les informations de date sont sauvegardées dans ces métadonnées.

DATA.GOUV.FR HARVEST
DATASUD
NOTES

Identifiant distant

remote_id

id

Slug

ckan_name

name

Car slug peut déjà être pris

URL de consultation

remote_url

url

Conservé dans ckan:source si URL invalide

Tous les attributs extras des métadonnées de DataSud qui ne font pas l’objet d’un traitement particulier sont aussi conservés dans l’attribut extras.

Ressource

La notion équivalente à la ressource sur data.gouv.fr (Resource) est aussi la Resource dans CKAN.

DATA.GOUV.FR
DATASUD
NOTES

Identifiant

id

id

Un UUID valide

Titre

title

name

Description

description

description

URL

url

url

Type

filetype

resource_type

api ou remote

Type MIME

mime

mimetype

Format

format

format

Date de création

harvest.created_at

created

Date de mise à jour

harvest.modified_at

last_modified

Filtrage

La filtrage donne la possibilité d’inclure ou d’exclure un sous-ensemble de jeux de données du moissonnage.

Lorsqu’un ou plusieurs filtres sont déclarés, seuls les jeux de données remplissant toutes les conditions (ET) seront traités.

Portail multiproducteur : restriction à une organisation

Exclusion de mots-clés

Combinaisons multiples

Contribuer

Métadonnées communes

Les jeux de données moissonnés possèdent les attributs suivants dans leur champ extras pour la traçabilité :

ATTRIBUT
CONTENU

harvest:domain

Nom de domaine moissonné

harvest:source_id

Identifiant technique du moissonneur

harvest:remote_id

Identifiant distant du jeu de données

harvest:last_update

Date du dernier moissonnage

Détection des licences par le moissonnage

Cette détection utilise les attributs suivants :

  • id

  • title

  • alternate_titles

  • url

  • alternate_urls

Le meilleur moyen d’assurer une compatibilité parfaite est d’utiliser l’id sur le flux distant lorsque c’est possible.

PreviousLes limites du moissonnageNextMettre en place un moissonneur entre DataSud et Data.gouv

Last updated 1 year ago

Exemple de restriction à une seule organisation
Exemple d'exclusion de mots-clés
Exemple de combinaison de filtres

Le moissonneur CKAN est publié sur github dans le plugin . Vous pouvez donc soumettre des améliorations ou signaler des anomalies.

Lors du moissonnage, la liste de référence de data.gouv.fr, , est utilisée pour détecter la licence du jeu de données distant.

udata-ckan
disponible ici au format json
Dublin Core Frequency