Bien géocoder nécessite de disposer de trois éléments complémentaires : un moteur de géocodage bien paramétré, un référentiel adapté et des adresses à géocoder propres. Le premier élément ayant été traité dans l'article précédent, penchons nous maintenant sur la qualité du référentiel BD Adresse et les outils permettant de l'améliorer et donc de géocoder plus précisemment.
Dans les paragraphes suivants, nous regardons en détail les particularités de la BD Adresse et vous proposons de télécharger des outils pour automatiser les traitements qui doivent être réalisés. Ces outils fonctionnent à partir de la version 9.3 d'ArcGIS.
La BD ADRESSE est la somme des produits POINT ADRESSE et ROUTE ADRESSE présentant tout deux des informations permettant de géocoder :
- POINT ADRESSE propose un point par adresse, des informations inédites comme les "indices de répétition" (BIS, TER, ...) ainsi qu'une grande précision géographique (car déduite des informations cadastrales).
- ROUTE ADRESSE donne accès aux tronçons de voies avec leur nom et les bornes de début et de fin ainsi qu'aux lieux-dits habités ce qui rapproche beaucoup ce dernier des produits concurrents de TeleAtlas et Navteq.
Ces produits ont donc des caractéristiques particulières qu'il convient de bien avoir en tête pour pouvoir géocoder au mieux.
Etude des différents produits de l'IGN et améliorations possibles pour un bon géocodage
POINT ADRESSE :
Si vous avez acheté POINT ADRESSE, vous ne disposez que du fichier des adresses ponctuelles. Ce fichier présente tous les champs intéressants pour le géocodage (Numéro dans la voie, indice de répétition, nom de la voie, Code INSEE, Code Postal et nom de commune).
Notez toutefois que les points d'adresses ne présentent pas tous le même niveau de précision géographique en fonction de la manière d'acquisition de ces points par l'IGN. La précision est indiquée dans le champ TYPE_LOC pour chacun des points. Dans sa documentation, l'IGN indique que l'on retrouve les valeurs suivantes :
- Projection plaque : l’adresse est mise en relation avec une parcelle de la BD PARCELLAIRE® pour laquelle la position de la plaque adresse est connue. Cette position est alors projetée le long de l’axe routier (du bon côté).
- Projection centroïde : l’adresse est mise en relation avec une parcelle de la BD PARCELLAIRE® pour laquelle la position de la plaque adresse n’est pas connue. Le centroïde de la parcelle est alors projeté sur le tronçon routier correspondant (du bon côté).
- Tronçon route : grâce aux informations "Bornes de départ" et "Bornes de fin" des tronçons qui constituent la voie nommée dans l'adresse, le tronçon correspondant à l'adresse est localisé. L'adresse est alors positionnée par interpolation linéaire le long de ce tronçon précis.
- Voie : lorsque les informations sur les bornes ne permettent pas une localisation au tronçon, l'adresse est positionnée de façon arbitraire sur un des tronçons de la voie.
- Zone adressage : l'adresse est positionnée sur une zone d'adressage (lieu-dit habité, hameau, carrefour nommé, ZAC, etc.) dont le toponyme figure dans l'adresses.
- Commune : lorsqu’aucune des localisations précédentes n'a pu être mise en place, l'adresse est positionnée au centre administratif de la commune (mairie ou chef-lieu de commune).
Cette information est importante. Cela conduit à la conclusion qu'un géocodage sur POINT ADRESSE qne conduit pas forcemment à un géocodage "à l'adresse" ! En effet, les trois derniers niveaux de précision conduisent à un positionnement "à la voie", au "POI" et à la commune.
Pour ne pas perdre cette information importante, nous vous conseillons de construire des localisateurs d'adresse différents en dissociant les points en fonction de leur précision géographique. Pour cela, vous devez créer autant de couches de points qu'il y a de niveaux de précisions.

Un géotraitement en téléchargement vous aidera à le faire facilement.
Avec cette méthode, le fichier résultant de votre géocodage intègrera alors le nom du localisateur simple qui a permis le géocodage et donc le niveau de précision de celui-ci. Ce travail n'est à faire qu'une seule fois et vous disposez alors de l'information de précision de géocodage aussi bien lors du géocodage fd fichiers que de géocodages disctinc.
ROUTE ADRESSE :
Si vous avez acheté uniquement ROUTE ADRESSE, vous disposez de plusieurs fichiers utiles au géocodage.
Le thème ROUTE_ADRESSE_NOMMEE intègre uniquement les tronçons de voies qui comportent un nom dans la base de l'IGN. Les champs présentent, en plus du nom de la voie, les numéros d'adresses aux extrémités ainsi que le code INSEE de la commune. Ce thème n'intègre pas le code postal ni le nom de la commune. Il présente également la particularité, inédite dans les référentiels des autres fournisseurs, de proposer un nom de voie à droite et à gauche. Aussi, géocoder sur ce thème en l'état n'est pas aisé.
Le thème COMMUNE intègre le nom et le code INSEE de la commune en plus d'autres informations administratives. Il n'indique pas le code postal.
En conséquence, si vous ne disposez pas du code INSEE, ROUTE ADRESSE est un référentiel mal adapté en l'état pour faire du géocodage. Néanmoins, il est possible de l'améliorer par des traitements. Nous vous proposons ainsi un outil de construction d'un référentiel de géocodage amélioré à partir de ROUTE ADRESSE. Il s'agit d'un script Python qui est proposé en téléchargement également sur cette page.
Cet outil traite vos données afin de tirer le meilleur parti de ROUTE ADRESSE en réalisant nombre de traitemement dont :
- Ajout du nom de la commune sur chaque tronçon
- Ajout du code postal sur chaque tronçon
- Duplication des tronçons comportant des noms de voies différents à gauche et à droite pour être adapter au modèle de localisateur d'ArcGIS
- Duplication des tronçons en limite communale

Après ces traitements, vous aurez alors la possibilité d'utiliser des adresses avec un code postal.
Notez que, pour les communes dites "pluri-distribuées" c'est-à-dire qui disposent de plusieurs codes postaux, le script ajoute uniquement un seul des codes postaux à tous les tronçons de la commune. Cela peut avoir une importance si votre territoire comporte une de ces communes. Pour le vérifier, une liste en est donnée à la fin de la documentation de contenu fournie par l'IGN avec votre livraison.
BD ADRESSE :
La BD Adresse est la combinaison de POINT ADRESSE et de ROUTE ADRESSE. Les remarques faites plus haut pour ces deux composantes concernent donc aussi la BD ADRESSE. Notez que, même si vous disposez des adresses ponctuelles, l'utilisation conjointe des thèmes ADRESSE et ROUTE_ADRESSE_NOMMEE peut vous permettre d'améliorer la qualité du géocodage par rapport à l'utilisation unique du thème ponctuel ADRESSE.
Cela est dû à des incohérences entre les thèmes ADRESSE et ROUTE_ADRESSE.

Dans l'exemple précédent, POINT ADRESSE ne référence les points qu'au lieu-dit et non à la voie alors que ROUTE ADRESSE dispose des noms de voies.
Afin de vous simplifier le traitement de la BD ADRESSE, nous vous proposons un géotraitement qui intègre les deux traitements de POINT ADRESSE et ROUTE ADRESSE.
Construction des localisateurs
Après avoir téléchargé (voire retéléchargé car ils ont été complétés ce jour) les modèles de localisateurs et les styles d'adresses présentés dans l'article précédent et réalisés les traitements présentés ci-dessus, vous pourrez construire les localisateurs sur votre référentiel.
Pour cela, nous mettons à votre disposition des scripts qui permettent d'automatiser cette étape. Deux scripts différents sont proposés :
- sur le Code INSEE : le premier construit les localisateurs en utilisant le code INSEE. Il est à utiliser si vous disposez du code INSEE pour géocoder.
- sur le Code Postal : le second construit les localisateurs en utilisant le Code Postal. Il est à utiliser uniquement si vous ne disposez pas du code INSEE dans les adresses que vous voulez géocoder.

Il faut préférer construire vos localisateurs avec le code INSEE, car ce dernier est plus discriminant que le code postal. En effet, on ne compte que quelques milliers de codes postaux différents en France pour plus de 36000 codes INSEE.
Une fois cette étape franchie, nous n'aurez plus qu'à créer manuellement un localisateur composite référençant tous les autres localisateurs. La documentation fournie avec les autres éléments évoqués dans cet article explique comment faire. Vous serez alors prêt à géocoder au mieux avec vos données.
