📓
Guide DataSud
  • Bienvenue
  • ❓Foire aux questions
  • Documentation de datasud.fr
    • Créer un compte utilisateur, un groupe et rejoindre une organisation
    • Organisation
      • Créer une organisation
      • Suivre l'activité et modifier son organisation
      • Gérer les membres de son organisation
      • Groupes d’organisations
      • Configuration de permissions particulières des jeux de données
      • Supprimer une organisation
    • Jeux de données
      • Publier un jeu de données
      • Utiliser différents modes de publication de vos ressources
      • Gérer un jeu de données
        • Paramétrer le jeu de donnée
        • Consulter les statistiques de vos jeux de données
      • Explorer un jeu de donnée
      • Indexer un catalogue de données existant
    • Réutilisations
      • Publier une réutilisation
    • Moissonnage
      • Les limites du moissonnage
      • Correspondance des champs entre les catalogues
      • Mettre en place un moissonneur entre DataSud et Data.gouv
      • Analyser le rapport de moissonnage
    • Les Carte : MAPS
      • Consulter les cartes de DataSud
      • Créer une carte dans DataSud
      • Partager sa carte dans un espace de travail
  • Guides open data
    • Guide juridique
      • Producteurs de données
        • Comprendre la notion d'open data
        • Qui est concerné ?
        • Quelles sont les obligations ?
      • Réutilisateurs de données
        • Comprendre la notion d'open data
        • Respecter les conditions de réutilisation
      • Chronologie de l'open data
    • Guide qualité
      • Evaluer le niveau de qualité d'un jeu de données
      • Préparer un jeu de données de qualité
        • Extraire un jeu de données d'un système d'information
        • Structurer un jeu de données
          • Structurer une Base Adresse Locale
        • Lier des données à un référentiel
      • Documenter des données
        • Bien documenter un jeu de données
        • Diffuser la documentation d'un jeu de données
      • Améliorer la qualité d'un jeu de données en continu
        • Améliorer le score de qualité des métadonnées
        • Connaître et suivre les usages d'un jeu de données
        • Mettre en place une stratégie organisationnelle
      • Maîtriser les schémas de données
        • Comprendre les bénéfices d'utiliser un schéma de données
        • Créer un schéma de données
          • Etape 1 : Phase d'investigation
          • Etape 2 : Phase de concertation
          • Etape 3 : Phase de construction
          • Etape 4 : Phase de promotion et de maintien
          • Focus : Construire un schéma TableSchema
        • Intégrer un schéma de données à schema.data.gouv.fr
        • Produire des données en conformité avec un schéma
        • Indiquer et vérifier qu'une ressource respecte un schéma de données
  • Réutiliser des données
    • Utiliser les API géographiques
      • Utiliser l'API Adresse
        • Rappel sur les données adresses
        • Géocoder des adresses - théorie
        • Géocoder des adresses - cas pratiques
        • FAQ Adresse
      • Utiliser l'API Découpage administratif
      • Utiliser les tuiles vectorielles
    • Utiliser les données du cadastre
      • Comprendre les données du cadastre et leurs usages
      • Manipuler les données du cadastre
      • Foire aux questions sur le cadastre
    • Prendre en main l'API "Adresse" portée par l'IGN
  • Autres ressources utiles
    • Lexique de l'open data
    • Données de la commande publique
      • Publier les données essentielles d’attribution des marchés
      • Déclaration d’un profil d’acheteur
    • Données de forte valeur : métadonnées obligatoires et modalités de rapportage
    • Ressources OpenDataFrance
    • Documentation de transport.data.gouv.fr
Powered by GitBook
On this page
  1. Documentation de datasud.fr
  2. Jeux de données

Publier un jeu de données

Le module Publish permet de créer des fiches de métadonnées, de publier des ressources, et de gérer les droits d'accès à ces fiches et aux ressources publiées.

PreviousJeux de donnéesNextUtiliser différents modes de publication de vos ressources

Last updated 5 months ago

En amont de la publication de données sur datasud.fr, il est important de bien préparer le jeu de données. Pour ce faire, nous vous invitons à consulter rédigé par les équipes de Data.gouv.fr

Le module de publication des données est accessible aux utilisateurs authentifiés sur Datasud.fr. Cette capacité d'édition n'est utile qu'aux utilisateurs ayant au moins un rôle d'éditeur au sein d'un groupe/ une organisation, leur permettant de publier des fiches de métadonnées et des ressources pour ce groupe/ cette organisation.

L'éditeur d'un groupe / d'une organisation, peut éditer tous les jeux de données rattachés à son groupe / organisation.

La création d'un nouveau jeu de données se fait soit en cliquant sur le bouton Nouveau jeu de données situé sur la page d'accueil de publish, ou bien situé au-dessus du tableau général des jeux de données de votre organisation.

Une fois le formulaire de création d'un Nouveau jeu de données ouvert, on distingue la publication de la fiche de données, qui concerne toutes les informations attributaires sur la donnée, et la ressource ajoutée.

La saisie des informations se fait en plusieurs grandes étapes :

  • Décrire les métadonnées du jeu de données c'est à dire de toutes les informations utiles à la description du jeu de données : le titre, la description, les mots-clés, la fréquence de mise à jour, la licence applicable, etc.

  • la publication de la ressource principale, qui peut être sous forme d'un fichier, d'une table de base de données, d'un flux cartographique, etc.

  • le chargement de ressources annexes qui viennent compléter le jeu de données : un fichier de licence, une documentation, une carte, etc.

*Les champs identifiés par un astérisque sont obligatoires.

L'étape de description est cruciale pour que vos jeux de données soient bien valorisés

Information
Description de l'information

Nom du jeu de données*

Le titre de votre jeu de données doit être précis et spécifique. Il s'agit du titre de la fiche, qui sera mis en avant dans les résultats de recherche. Lors de la création de la fiche, un code identifiant va être créé à partir de ce titre. Par exemple, pour une fiche dont le nom saisi est "Suivi de la déforestation en 2023", le code créé sera "suivi-de-la-deforestation-en-2023" Cet identifiant unique apparaitra dans l'URL de la fiche de consultation et il ne changera plus jamais, même si le titre de la fiche est modifié ultérieurement. Il est donc important de choisir dès le départ un titre cohérent avec la fiche, au risque d'avoir ensuite une URL sans rapport à la fiche consultée.

Description*

Mots clés*

Les mots clés caractérisent votre jeu de données. Ils apparaissent sur la page de présentation et apportent un meilleur référencement du jeu de données lors d’une recherche utilisateur. Lors de la saisie d'un mot-clé, un système d'autocomplétion propose de sélectionner un mot-clé existant, déjà saisi dans une autre fiche. La suppression d'un mot-clé saisi se fait en cliquant sur la croix à droite du libellé du mot-clé.

Catégories OneGeo Suite

Thématiques*

En complément des Catégories ci dessus, il s'agit d'une liste de 16 thématiques fréquemment utilisées dans les standards et/ou les catalogues de données. Un système de relations entre ces thématiques et celles utilisées par les catalogues amenés à être indexées, afin d'associer aux mieux des fiches provenant de catalogues externes avec les thématiques de DataSud. Choisir la(les) thématique(s) dans laquelle(lesquelles) apparaitront les données.

Type de données*

Le type de données est un élément supplémentaire de qualification de la donnée décrite. Choisir le(les) type(s) de données parmi 2 proposition Données géographiques ou autre

Préconisation d'usage

Texte libre permettant d'indiquer d'éventuelles préconisations à l'usage de la donnée

Limite d'utilisation

Texte libre avec une proposition d'options prédéfinies pour faciliter la saisie

Nom de l'organisation ou du groupe d'utilisateurs*

Cette section permet de sélectionner l'organisation ou le groupe d'utilisateurs auquel sont rattachés la fiche et la donnée publiée. Elle n'est présente que lors de la création de la fiche. Rechercher un(e) organisation/groupe d'utilisateurs dans la barre de recherche.

  • le choix est définitif, une fois la fiche créée, il n'est plus possible de modifier le groupe de rattachement que l'on peut voir dans la colonne de droite.

En mode édition, le nom du groupe est uniquement visible en lecture seule dans la colonne de droite.

Contacts

Il est possible de créer un nouveau contact ou de sélectionner un contact existant pour permettre aux utilisateurs de vos données de joindre directement le producteur. Un contact se compose à minima d'un nom et d'un email. Il est obligatoirement associé à une organisation. Il peut être complété par un numéro de téléphone et le nom d'un service. Lorsqu'un contact est sélectionné ou créé dans la fiche, il faut lui associer un rôle pour la fiche, parmi la liste de rôles prédéfinie. Par défaut, le rôle utilisé est "Point de contact".

Licence

Copyright

Granularité de la couverture géographique

Vous pouvez choisir la granularité de la couverture géographique parmi une liste prédéfinie sur le niveau de détail géographique le plus fin que peut couvrir vos données. La granularité correspond au niveau administratif minimum auquel est défini les enregistrements composant la donnée. Par exemple pour des données INSEE, il peut s'agir le plus souvent de l'IRIS ou de la commune.

Liste des granularités possibles

Couverture géographique

Le choix de la couverture géographique parmi 3 options aura un impact sur le calcul de l'emprise de la donnée :

  • le calcul automatique de l'emprise à partir des données : ne fonctionne qu'avec des données géographiques, il s'agit de l'emprise effective des données publiées. Il y a essentiellement 2 limites à cette option :

    • les données non géographiques, mais qui concerne un territoire particulier

    • les données ayant une occurrence non homogène sur un territoire. Par exemple, l'emprise d'un jeu de données sur les établissements sur une région se réduira généralement à quelques points alors que le jeu de données couvre toute la région.

  • le territoire de compétence de l'organisation qui publie. Ce choix permet de forcer l'emprise sur celle du territoire sur lequel compétente l'organisation, quelle que soient les données publiées.

  • la région : pour les jeux de données couvrant l'ensemble de la zone concernée par la plateforme.

Dates de création et de dernière révision

Il s'agit de dates systèmes, non éditables par le contributeur. La date de création correspond à la création de la fiche et celle de dernière révision correspond au dernier enregistrement de cette fiche.

Date de publication et de dernière mise à jour*

Il s'agit de dates saisies manuellement par le contributeur, qui peuvent être mises à jour à chaque édition.

Fréquence de mise à jour*

La fréquence de mise à jour correspond à la fréquence à laquelle vous prévoyez de mettre à jour les données publiées. Cette fréquence de mise permet d'informer l'utilisateur sur l'éventuelle prochaine mise à jour de la donnée.

Liste des fréquences de mise à jour

Millésime

Le millésime désigne l'année couverte par le jeu de donnée

Mode de constitution

Ce champ permet de renseigner le contexte de production des données, tel que le service ou les différentes organisations qui ont contribué à la création de ces données.

Autres informations

Le formulaire permet, depuis la colonne de droite de renseigner 2 informations supplémentaires :

  • une vignette de prévisualisation, qui sera affichée dans la liste de résultats

  • la possibilité d'associer la fiche à un jeu de données parent parmi tous les autres jeu de données déjà publiés pour l'organisation

Publier vos ressources principales et documentation associées (annexes)

Un jeu de données peut contenir plusieurs types de ressources (Fichier principal, documentation, code source, API, lien, Table en BDD, etc.). Lorsque les champs concernant les métadonnée ont été renseignés, vous pouvez publier vos ressources depuis le même formulaire. Soit vous enregistrez la fiche de métadonnée une première fois et vous publiez la ressource plus tard, soit vous publiez la donnée directement avant le premier enregistrement.

Vous avez la possibilité d’importer vos fichiers sur datasud.fr selon différents modes de mise à disposition.

La publication d'une donnée peut être effectuée depuis 4 différents types de sources :

1/ depuis un fichier plat (Shape, GeoJSON, Excel, CSV, PDF, image, etc.) téléversé depuis votre ordinateur vers le serveur de DataSud,

2/ depuis une URL du fichier à téléverser dans l'entrepôt des données de DataSud

3 / depuis un entrepôt sFTP connecté à DataSud (pour les fichiers volumineux, difficilement téléversables)

4 / depuis une URL, vous pouvez créer un lien vers une ressource distante existante (référencement d'un site web ou d'une ressource en ligne) : Les informations contenues dans le fichier resteront hébergées sur le serveur distant fléché.

La description complète des différents mode de publication avec des captures écran sera disponible prochainement

Publier vos ressources associées (annexes)

L'édition des annexes s'effectuent de la même façon que les fichiers principaux mais leur previsualisation n'est jamais possible. DataSud ne permet que le téléchargement des annexes, et non leur prévisualisation!

Lorsque la fiche de données a été enregistrée, le message suivant s’affiche : « Succès publish-dataset ». Lorsque la ressource a été ajoutée (cela peut prendre quelques minutes), le message suivant s’affiche : « Succès geospatial-creation-scenario » :

Une fois le jeu de données créé, il sera automatiquement accessible dans le module Explorer.

Toutes les informations ( métadonnées, fichier principaux et annexes) pourront ensuite être modifiées à tout moment, voire supprimées.

La description de votre jeu de données permet aux personnes qui le consultent d’obtenir des informations sur le contenu et la structure des ressources publiées. Ce champ libre permet d'indiquer une description longue du jeu de données. La syntaxe markdown est supportée. Il existe de nombreux guides sur l'usage du markdown, par exemple sur

Ces catégories sont utilisées dans une facette de recherche du module de consultation des fiches de données (Explorer). Choisir la(les) catégorie(s) dans laquelle(lesquelles) apparaitront les données dans les univers de DataSud

Les licences définissent les règles de réutilisation des jeux de données publiés. En choisissant une licence de réutilisation, vous vous assurez que le jeu de données publié sera réutilisé selon les conditions d’usage que vous avez définies. Afin d’éviter la multiplication des licences, la a prévu la création d’une liste de licences qui peuvent être utilisées par les administrations. Vous pouvez choisir la licence parmi une liste prédéfinie.

Pour gérer l'affichage de votre jeu de données,

Commune
Département
Intercommunalité (EPCI)
Indéfinie
IRIS (quartiers INSEE)
Parcelle cadastrale
Point d'intérêt (POI)
Région
Continue
Quotidienne
Hebdomadaire
Bi-mensuelle
Mensuelle
Trimestrielle
Semestrielle
Annuelle
Lorsque nécessaire
Irrégulière
Non planifiée
Inconnue
consulter la documentation dédiée
https://www.markdownguide.org/cheat-sheet/
https://www.datasud.fr/portal/univers
loi pour une République numérique
guide qualité