📓
Guide DataSud
  • Bienvenue
  • ❓Foire aux questions
  • Documentation de datasud.fr
    • Créer un compte utilisateur, un groupe et rejoindre une organisation
    • Organisation
      • Créer une organisation
      • Suivre l'activité et modifier son organisation
      • Gérer les membres de son organisation
      • Groupes d’organisations
      • Configuration de permissions particulières des jeux de données
      • Supprimer une organisation
    • Jeux de données
      • Publier un jeu de données
      • Utiliser différents modes de publication de vos ressources
      • Gérer un jeu de données
        • Paramétrer le jeu de donnée
        • Consulter les statistiques de vos jeux de données
      • Explorer un jeu de donnée
      • Indexer un catalogue de données existant
    • Réutilisations
      • Publier une réutilisation
    • Moissonnage
      • Les limites du moissonnage
      • Correspondance des champs entre les catalogues
      • Mettre en place un moissonneur entre DataSud et Data.gouv
      • Analyser le rapport de moissonnage
    • Les Carte : MAPS
      • Consulter les cartes de DataSud
      • Créer une carte dans DataSud
      • Partager sa carte dans un espace de travail
  • Guides open data
    • Guide juridique
      • Producteurs de données
        • Comprendre la notion d'open data
        • Qui est concerné ?
        • Quelles sont les obligations ?
      • Réutilisateurs de données
        • Comprendre la notion d'open data
        • Respecter les conditions de réutilisation
      • Chronologie de l'open data
    • Guide qualité
      • Evaluer le niveau de qualité d'un jeu de données
      • Préparer un jeu de données de qualité
        • Extraire un jeu de données d'un système d'information
        • Structurer un jeu de données
          • Structurer une Base Adresse Locale
        • Lier des données à un référentiel
      • Documenter des données
        • Bien documenter un jeu de données
        • Diffuser la documentation d'un jeu de données
      • Améliorer la qualité d'un jeu de données en continu
        • Améliorer le score de qualité des métadonnées
        • Connaître et suivre les usages d'un jeu de données
        • Mettre en place une stratégie organisationnelle
      • Maîtriser les schémas de données
        • Comprendre les bénéfices d'utiliser un schéma de données
        • Créer un schéma de données
          • Etape 1 : Phase d'investigation
          • Etape 2 : Phase de concertation
          • Etape 3 : Phase de construction
          • Etape 4 : Phase de promotion et de maintien
          • Focus : Construire un schéma TableSchema
        • Intégrer un schéma de données à schema.data.gouv.fr
        • Produire des données en conformité avec un schéma
        • Indiquer et vérifier qu'une ressource respecte un schéma de données
  • Réutiliser des données
    • Utiliser les API géographiques
      • Utiliser l'API Adresse
        • Rappel sur les données adresses
        • Géocoder des adresses - théorie
        • Géocoder des adresses - cas pratiques
        • FAQ Adresse
      • Utiliser l'API Découpage administratif
      • Utiliser les tuiles vectorielles
    • Utiliser les données du cadastre
      • Comprendre les données du cadastre et leurs usages
      • Manipuler les données du cadastre
      • Foire aux questions sur le cadastre
    • Prendre en main l'API "Adresse" portée par l'IGN
  • Autres ressources utiles
    • Lexique de l'open data
    • Données de la commande publique
      • Publier les données essentielles d’attribution des marchés
      • Déclaration d’un profil d’acheteur
    • Données de forte valeur : métadonnées obligatoires et modalités de rapportage
    • Ressources OpenDataFrance
    • Documentation de transport.data.gouv.fr
Powered by GitBook
On this page
  • Qu'est-ce que le géocodage ?
  • Les indispensables pour réaliser un géocodage
  • Le fonctionnement d'un géocodeur
  • Les limites du géocodage
  1. Réutiliser des données
  2. Utiliser les API géographiques
  3. Utiliser l'API Adresse

Géocoder des adresses - théorie

PreviousRappel sur les données adressesNextGéocoder des adresses - cas pratiques

Last updated 1 year ago

Qu'est-ce que le géocodage ?

Lexique : Géocodage Le géocodage consiste à affecter des coordonnées géographiques (longitude/latitude) à une adresse postale (Wikipédia).

Il permet ainsi de positionner des adresses sur une carte ou encore de trouver les points de départ et d’arrivée pour déterminer votre trajet lorsque vous voyagez par exemple.

Les indispensables pour réaliser un géocodage

Pour réaliser un géocodage, il est nécessaire de disposer :

  • des données de référence contenant numéro, nom de rue, , code postal, nom de commune ;

  • des coordonnées géographiques x et y qui sont généralement la longitude(x) et la latitude(y) ;

  • une entrée correspondant à l’adresse recherchée.

Le fonctionnement d'un géocodeur

Un géocodeur transforme une donnée textuelle des données de référence en utilisant des algorithmes qui séparent l’adresse en syllabes, mots et groupes de mots.

Les différents éléments sont indexés, puis en s’appuyant sur des algorithmes relatifs à du traitement textuel, le géocodeur compare la similarité entre les mots constituant l’adresse à rechercher et ceux qui sont indexés depuis les données de référence.

Un algorithme permet généralement d’ordonner les résultats. Il s’agit par exemple de faire apparaitre en premier les résultats ayant les coordonnées fixes les plus proches ou encore ceux dont la population est la plus forte.

Il est également possible de filtrer selon des critères comme le pays (si le géocodeur a une vocation internationale, comme ) ou encore par type de résultat.

En pratique, un certain nombre de géocodeurs visent à réaliser des recherches de communes et de POIs (Points Of Interest ou points d’intérêts) et pas seulement des adresses.

Le géocodage peut aussi se faire de façon inverse, c’est-à-dire retourner une adresse en envoyant une coordonnée. Dans ce cas de figure, il s’agit de trouver la donnée de référence la plus proche des coordonnées envoyées.

Les limites du géocodage

La qualité des données de référence

Les données textuelles de l’adresse de référence ne sont pas toujours uniformes.

Exemple : "rue" peut être représenté par les lettres "r" ou "R" ou "rue" ou "Rue".

Il s’agit donc en premier lieu d’uniformiser les différentes manières de décrire le type de voie.

Il s’agit également d’omettre les articles lors d’une comparaison.

Exemple : chercher "rue métanies" au lieu de "rue des métanies".

D’un autre côté, les coordonnées géographiques peuvent manquer de précision. Dans certains cas, il arrive de disposer uniquement du centroïde de la commune, de la voie ou du lieu dit (point d’une zone géographique choisi au voisinage de son centre de gravité et dont les coordonnées servent de localisant pour cette zone).

Dans d’autres cas, les coordonnées peuvent avoir été interpolées : les adresses ont été positionnées en fonction du nombre de numéros dans une voie et la longueur de celle-ci.

Les principales problématiques liées aux adresses

Plusieurs communes pour un code postal.

Cette problématique se pose par exemple lorsqu’on met le nom de la commune dans une adresse. En effet, 68,9% des codes postaux sont associés à plus d’une commune et jusqu’à 46 communes sont rattachées à un même code postal.

Plusieurs codes postaux pour une commune.

1,5% des communes ont plus d’un seul code postal sur leur territoire. On compte même jusqu’à 9 codes postaux pour une même commune pour le cas extrême !

Des communes ont des noms identiques.

10,6% des communes ont une ou plusieurs communes homonymes.

Des codes postaux n’ont pas le même code que celui du département.

Ces cas de figure sont très rares (quelques dizaines).

Plusieurs noms de voie avec un nom identique sont situés à différents endroits pour une même commune.

Cette situation s’explique en particulier avec la création des communes nouvelles qui a encouragé le regroupement de communes. Ce problème peut être réglé en ajoutant le nom de la commune déléguée dans l’adresse postale, en renumérotant les rues ou en les renommant. Or les géocodeurs ne gèrent pas forcément bien (voir pas du tout) l’ajout d’adresse de la commune déléguée.

Plusieurs coordonnées pour une même adresse.
  • Il peut exister des différences liées à la vision sur la position du numéro de l’adresse (entrée principale, boîte aux lettres, bâtiment, cage d’escalier, logement, parcelle, position dérivée du segment de la voie de rattachement, point d’accès technique, etc.) ;

  • Des référentiels différents selon les acteurs même si la BAN (Base Adresse Nationale) et les BAL (Bases Adresses Locales) amènent à une amélioration et une uniformisation des référentiels : données héritées de la Poste, de l’IGN, du cadastre, des opérateurs réseaux (fibre, etc.).

Nous nous concentrons ici sur les cas liés aux adresses, le géocodeur utilisé par étant spécifiquement conçu pour répondre à ce besoin.

code INSEE
Nominatim
adresse.data.gouv.fr