Correspondance des champs entre les catalogues
Le moissonneur utilise l’API de CKAN pour récupérer les métadonnées des publications de DataSud.fr
Ce moissonneur attend l’URL racine de l’instance CKAN et non du portail
Exemple
Spécifications techniques
Ce moissonneur n’est pas compatible avec les changements de modèles qui peuvent être effectués par certains plugins. Les champs d’un jeu de données doivent rester les mêmes, et le format de leur contenu aussi.
Les champs additionnels du modèle sont ignorés.
Correspondance des champs du modèle
Jeu de données
La notion équivalente au jeu de données sur data.gouv.fr (Dataset
) est le Package
dans DATASUD.
Slug
slug
name
Création uniquement, si disponible
Titre
title
title
Acronyme
acronym
❌
Description
description
notes
Mots-clés
tags
tags.name
Date de création
created_at
metadata_created
Date de mise à jour
last_modified
metadata_modified
Licence
license
license_id
et license_title
deviné
Couverture spatiale
spatial
extras.spatial
et extras.spatial-test
deviné
Couverture temporelle
temporal_coverage
extras.temporal_start
et extras.temporal_end
Fréquence de mise à jour
frequency
extras.frequency
Autres métadonnées
Certaines propriétés additionnelles sont conservées dans l’attribut harvest
par soucis de traçabilité. Les informations de date sont sauvegardées dans ces métadonnées.
Identifiant distant
remote_id
id
Slug
ckan_name
name
Car slug
peut déjà être pris
URL de consultation
remote_url
url
Conservé dans ckan:source
si URL invalide
Tous les attributs extras
des métadonnées de DataSud qui ne font pas l’objet d’un traitement particulier sont aussi conservés dans l’attribut extras
.
Ressource
La notion équivalente à la ressource sur data.gouv.fr (Resource
) est aussi la Resource
dans CKAN.
Identifiant
id
id
Un UUID valide
Titre
title
name
Description
description
description
URL
url
url
Type
filetype
resource_type
api
ou remote
Type MIME
mime
mimetype
Format
format
format
Date de création
harvest.created_at
created
Date de mise à jour
harvest.modified_at
last_modified
Filtrage
La filtrage donne la possibilité d’inclure ou d’exclure un sous-ensemble de jeux de données du moissonnage.
Lorsqu’un ou plusieurs filtres sont déclarés, seuls les jeux de données remplissant toutes les conditions (ET) seront traités.
Portail multiproducteur : restriction à une organisation
Exclusion de mots-clés
Combinaisons multiples
Contribuer
Métadonnées communes
Les jeux de données moissonnés possèdent les attributs suivants dans leur champ extras
pour la traçabilité :
harvest:domain
Nom de domaine moissonné
harvest:source_id
Identifiant technique du moissonneur
harvest:remote_id
Identifiant distant du jeu de données
harvest:last_update
Date du dernier moissonnage
Détection des licences par le moissonnage
Cette détection utilise les attributs suivants :
id
title
alternate_titles
url
alternate_urls
Le meilleur moyen d’assurer une compatibilité parfaite est d’utiliser l’id
sur le flux distant lorsque c’est possible.
Last updated