> For the complete documentation index, see [llms.txt](https://guide.datasud.fr/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://guide.datasud.fr/guides-open-data/guide-qualite/evaluer-le-niveau-de-qualite-dun-jeu-de-donnees.md).

# Evaluer le niveau de qualité d'un jeu de données

## Définir la qualité d'un jeu de données

Pour une donnée, **la notion de qualité dépend grandement de l'usage qui en est fait**.

Les jeux de données publiés sont généralement produits dans un contexte propre à un processus métier et pour un usage particulier. Cet environnement métier n'est pas toujours familier aux tiers, qu'ils soient internes ou externes à l'organisation.

> Exemple : [La *base de données des demandes de valeur foncière*](https://www.data.gouv.fr/fr/datasets/demandes-de-valeurs-foncieres/) est historiquement produite par la Direction générale des finances publiques pour tenir un fichier immobilier et collecter l'impôt.

Les réutilisateurs peuvent alors rencontrer des difficultés lorsqu'ils souhaitent s'approprier des données ouvertes :

* **Difficultés dans la compréhension de la structure du jeu de données** ;
* **Difficultés dans la compréhension des données elles-mêmes** ;
* **Qualité non adaptée aux usages voulus** (mise à jour, documentation insuffisante ou inexacte, etc.).

Il est donc indispensable de **prendre en compte les pratiques des réutilisateurs** en amont de la production des jeux de données.

## Evaluer le niveau de qualité d'un jeu de données

Plusieurs critères permettent d'évaluer le niveau de qualité d'un jeu de données, notamment :

<details>

<summary>Des éléments sur les données elles-mêmes et leur structure</summary>

* **Le format de fichier,** qui doit permettre de facilement récupérer les données pour les réutiliser de la manière souhaitée (CSV, JSON plutôt que des formats propriétaires comme Excel) ;
* **La structure du fichier**, avec notamment des propriétés au nom explicite, compréhensible rapidement et interprétable facilement par des machines ;
* **Le contenu**, qui doit être le plus épuré possible, avec un type de donnée simple (un nombre, un pourcentage, une chaîne de caractère, une date, etc.) et un sens "métier" le plus clair possible.

</details>

<details>

<summary><strong>Des éléments attestant du potentiel de réutilisation et de croisement des données</strong></summary>

* **Le respect de standards**, référentiels et schémas déjà établis ;
* **La présence de données et colonnes pivots** pour lier les données à un référentiel (par exemple le SIRET).

</details>

<details>

<summary><strong>Des éléments qui accompagnent les données</strong></summary>

* **Une documentation** claire et rigoureuse avec des métadonnées sur le format du fichier, les versions et les référentiels ;
* **La gestion des versions et des mises à jour des données** ;
* **Des échanges entre producteurs et réutilisateurs du jeu de données** avec si possible des mécanismes de contribution aux données.

</details>


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://guide.datasud.fr/guides-open-data/guide-qualite/evaluer-le-niveau-de-qualite-dun-jeu-de-donnees.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
