> For the complete documentation index, see [llms.txt](https://guide.datasud.fr/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://guide.datasud.fr/guides-open-data/guide-qualite/maitriser-les-schemas-de-donnees/creer-un-schema-de-donnees/etape-1-phase-dinvestigation.md).

# Etape 1 : Phase d'investigation

{% hint style="info" %}
**Lexique : Phase d’investigation**

La phase d’investigation est la première phase de la création d’un schéma de données. Elle permet de s’assurer que la création d’un schéma est pertinente et en confirme la nécessité.
{% endhint %}

## Marche à suivre <a href="#etapes-a-suivre" id="etapes-a-suivre"></a>

Pour déterminer s’il est nécessaire de créer ou non un schéma de données, il est recommandé de suivre les étapes suivantes :

1. **Lire attentivement les différentes sections de ce guide** ;
2. **Organiser une réunion réunissant des acteurs métiers, techniques et de potentiels réutilisateurs** : vous débattrez de la pertinence de la création de votre schéma de données ;
3. **Référencez votre schéma pour entrer en contact avec les équipes d'Etalab et leurs partenaires** et bénéficier de conseils pour sa création, d'une visibilité accrue et d'une assistance d'experts.

## Exemples d'illustration <a href="#exemples" id="exemples"></a>

### :white\_check\_mark: Situations favorables à la création d’un schéma de données <a href="#situations-favorables-a-la-creation-d-un-schema-de-donnees" id="situations-favorables-a-la-creation-d-un-schema-de-donnees"></a>

> Exemple 1 : Le ministère chargé des transports souhaite consolider une base nationale des lieux pouvant servir de points de covoiturage. Les collectivités territoriales sont en charge de la création, du recensement et de l'aménagement de ces lieux.
>
> \--> Il est pertinent de créer un schéma de données car un grand nombre de producteurs de données doivent produire des données dans un format homogène. Un schéma facilitera la diffusion des prérequis, permettra la validation des données et facilitera l’agrégation nationale.

> Exemple 2 : L’INSEE souhaite diffuser le Code Officiel Géographique. Il rassemble des données sur des communes, des cantons, des arrondissements, des départements, des régions et des pays. Ce fichier est actualisé tous les ans.
>
> \--> Il est pertinent de créer un schéma car ces données sont des données de référence. Un grand nombre de réutilisateurs est susceptible d’utiliser ces données. Il est primordial que ces réutilisateurs aient accès à une documentation de qualité, que la structure des fichiers des données reste stable dans le temps et que les données publiées soient de bonne qualité.

> **Le cas des schémas de données en interne**\
> Bien qu’il ne paraisse pas nécessaire dans certaines situations de créer et de diffuser un schéma, vous pouvez choisir de le faire. En effet, les schémas de données comportent de nombreux avantages (documentation, montée en qualité, réutilisations, etc.) qui sont bénéfiques, même lorsque les données sont utilisées uniquement en interne.

### ❌ Situations dans lesquelles la création ou la diffusion d'un schéma de données ne semble pas nécessaire <a href="#situations-ou-le-referencement-d-un-schema-sur-schema-data-gouv-fr-ne-semble-pas-necessaire" id="situations-ou-le-referencement-d-un-schema-sur-schema-data-gouv-fr-ne-semble-pas-necessaire"></a>

> Une administration centrale diffuse des statistiques d’activité d’un bureau, en open data, de manière annuelle.
>
> \--> Avec ces seules informations, il ne semble pas nécessaire de créer un schéma : il n’y a qu’un seul producteur et le potentiel de réutilisation semble limité.

## Points de sortie <a href="#points-de-sortie" id="points-de-sortie"></a>

À l’issue de cette phase, vous devriez :

* [ ] Connaître les schémas de données ;
* [ ] Être en mesure de décider si votre projet requiert la création d’un schéma de données ;
* [ ] Savoir si votre schéma de données devra être référencé à terme sur schema.data.gouv.fr.\\


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://guide.datasud.fr/guides-open-data/guide-qualite/maitriser-les-schemas-de-donnees/creer-un-schema-de-donnees/etape-1-phase-dinvestigation.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
