Vous êtes iciBlog
 Blog - Dernières actualités
Réduire
févr. 10

Rédigé par David Laruelle
10/02/2010 10:35

Bien géocoder nécessite de disposer de trois éléments complémentaires : un moteur de géocodage bien paramétré, un référentiel adapté et des adresses à géocoder propres. Le premier élément ayant été traité dans l'article précédent, penchons nous maintenant sur la qualité du référentiel BD Adresse et les outils permettant de l'améliorer et donc de géocoder plus précisemment.

Dans les paragraphes suivants, nous regardons en détail les particularités  de la BD Adresse et vous proposons de télécharger des outils pour automatiser les traitements qui doivent être réalisés. Ces outils fonctionnent à partir de la version 9.3 d'ArcGIS.

La BD ADRESSE est la somme des produits POINT ADRESSE et ROUTE ADRESSE présentant tout deux des informations permettant de géocoder :

  • POINT ADRESSE propose un point par adresse, des informations inédites comme les "indices de répétition" (BIS, TER, ...) ainsi qu'une grande précision géographique (car déduite des informations cadastrales).
  • ROUTE ADRESSE donne accès aux tronçons de voies avec leur nom et les bornes de début et de fin ainsi qu'aux lieux-dits habités ce qui rapproche beaucoup ce dernier des produits concurrents de TeleAtlas et Navteq.

Ces produits ont donc des caractéristiques particulières qu'il convient de bien avoir en tête pour pouvoir géocoder au mieux.

Etude des différents produits de l'IGN et améliorations possibles pour un bon géocodage

POINT ADRESSE :

Si vous avez acheté POINT ADRESSE, vous ne disposez que du fichier des adresses ponctuelles. Ce fichier présente tous les champs intéressants pour le géocodage (Numéro dans la voie, indice de répétition, nom de la voie, Code INSEE, Code Postal et nom de commune).

Notez toutefois que les points d'adresses ne présentent pas tous le même niveau de précision géographique en fonction de la manière d'acquisition de ces points par l'IGN. La précision est indiquée dans le champ TYPE_LOC pour chacun des points. Dans sa documentation, l'IGN indique que l'on retrouve les valeurs suivantes :

  • Projection plaque : l’adresse est mise en relation avec une parcelle de la BD PARCELLAIRE® pour laquelle la position de la plaque adresse est connue. Cette position est alors projetée le long de l’axe routier (du bon côté).
  • Projection centroïde : l’adresse est mise en relation avec une parcelle de la BD PARCELLAIRE® pour laquelle la position de la plaque adresse n’est pas connue. Le centroïde de la parcelle est alors projeté sur le tronçon routier correspondant (du bon côté).
  • Tronçon route : grâce aux informations "Bornes de départ" et "Bornes de fin" des tronçons qui constituent la voie nommée dans l'adresse, le tronçon correspondant à l'adresse est localisé. L'adresse est alors positionnée par interpolation linéaire le long de ce tronçon précis.
  • Voie : lorsque les informations sur les bornes ne permettent pas une localisation au tronçon, l'adresse est positionnée de façon arbitraire sur un des tronçons de la voie.
  • Zone adressage : l'adresse est positionnée sur une zone d'adressage (lieu-dit habité, hameau, carrefour nommé, ZAC, etc.) dont le toponyme figure dans l'adresses.
  • Commune : lorsqu’aucune des localisations précédentes n'a pu être mise en place, l'adresse est positionnée au centre administratif de la commune (mairie ou chef-lieu de commune).

Cette information est importante. Cela conduit à la conclusion qu'un géocodage sur POINT ADRESSE qne conduit pas forcemment à un géocodage "à l'adresse" ! En effet, les trois derniers niveaux de précision conduisent à un positionnement "à la voie", au "POI" et à la commune.

Pour ne pas perdre cette information importante, nous vous conseillons de construire des localisateurs d'adresse différents en dissociant les points en fonction de leur précision géographique. Pour cela, vous devez créer autant de couches de points qu'il y a de niveaux de précisions.

Extrait des traitements sur POINT ADRESSE

Un géotraitement en téléchargement vous aidera à le faire facilement.

Avec cette méthode, le fichier résultant de votre géocodage intègrera alors le nom du localisateur simple qui a permis le géocodage et donc le niveau de précision de celui-ci. Ce travail n'est à faire qu'une seule fois et vous disposez alors de l'information de précision de géocodage aussi bien lors du géocodage fd fichiers que de géocodages disctinc.

ROUTE ADRESSE :

Si vous avez acheté uniquement ROUTE ADRESSE, vous disposez de plusieurs fichiers utiles au géocodage.

Le thème ROUTE_ADRESSE_NOMMEE intègre uniquement les tronçons de voies qui comportent un nom dans la base de l'IGN. Les champs présentent, en plus du nom de la voie, les numéros d'adresses aux extrémités ainsi que le code INSEE de la commune. Ce thème n'intègre pas le code postal ni le nom de la commune. Il présente également la particularité, inédite dans les référentiels des autres fournisseurs, de proposer un nom de voie à droite et à gauche. Aussi, géocoder sur ce thème en l'état n'est pas aisé.

Le thème COMMUNE intègre le nom et le code INSEE de la commune en plus d'autres informations administratives. Il n'indique pas le code postal.

En conséquence, si vous ne disposez pas du code INSEE, ROUTE ADRESSE est un référentiel mal adapté en l'état pour faire du géocodage. Néanmoins, il est possible de l'améliorer par des traitements. Nous vous proposons ainsi un outil de construction d'un référentiel de géocodage amélioré à partir de ROUTE ADRESSE. Il s'agit d'un script Python qui est proposé en téléchargement également sur cette page.

Cet outil traite vos données afin de tirer le meilleur parti de ROUTE ADRESSE en réalisant nombre de traitemement dont :

  • Ajout du nom de la commune sur chaque tronçon
  • Ajout du code postal sur chaque tronçon
  • Duplication des tronçons comportant des noms de voies différents à gauche et à droite pour être adapter au modèle de localisateur d'ArcGIS
  • Duplication des tronçons en limite communale

Amlioration du référentiel

Après ces traitements, vous aurez alors la possibilité d'utiliser des adresses avec un code postal.

Notez que, pour les communes dites "pluri-distribuées" c'est-à-dire qui disposent de plusieurs codes postaux, le script ajoute uniquement un seul des codes postaux à tous les tronçons de la commune. Cela peut avoir une importance si votre territoire comporte une de ces communes. Pour le vérifier, une liste en est donnée à la fin de la documentation de contenu fournie par l'IGN avec votre livraison.

BD ADRESSE :

La BD Adresse est la combinaison de POINT ADRESSE et de ROUTE ADRESSE. Les remarques faites plus haut pour ces deux composantes concernent donc aussi la BD ADRESSE. Notez que, même si vous disposez des adresses ponctuelles, l'utilisation conjointe des thèmes ADRESSE et ROUTE_ADRESSE_NOMMEE peut vous permettre d'améliorer la qualité du géocodage par rapport à l'utilisation unique du thème ponctuel ADRESSE.

Cela est dû à des incohérences entre les thèmes ADRESSE et ROUTE_ADRESSE.

Dans l'exemple précédent, POINT ADRESSE ne référence les points qu'au lieu-dit et non à la voie alors que ROUTE ADRESSE dispose des noms de voies.

Afin de vous simplifier le traitement de la BD ADRESSE, nous vous proposons un géotraitement qui intègre les deux traitements de POINT ADRESSE et ROUTE ADRESSE.

Construction des localisateurs

Après avoir téléchargé (voire retéléchargé car ils ont été complétés ce jour) les modèles de localisateurs et les styles d'adresses présentés dans l'article précédent et réalisés les traitements présentés ci-dessus, vous pourrez construire les localisateurs sur votre référentiel.

Pour cela, nous mettons à votre disposition des scripts qui permettent d'automatiser cette étape. Deux scripts différents sont proposés :

  • sur le Code INSEE : le premier construit les localisateurs en utilisant le code INSEE. Il est à utiliser si vous disposez du code INSEE pour géocoder.
  • sur le Code Postal : le second construit les localisateurs en utilisant le Code Postal. Il est à utiliser uniquement si vous ne disposez pas du code INSEE dans les adresses que vous voulez géocoder.

 Création automatique des localisateurs

Il faut préférer construire vos localisateurs avec le code INSEE, car ce dernier est plus discriminant que le code postal. En effet, on ne compte que quelques milliers de codes postaux différents en France pour plus de 36000 codes INSEE.

Une fois cette étape franchie, nous n'aurez plus qu'à créer manuellement un localisateur composite référençant tous les autres localisateurs. La documentation fournie avec les autres éléments évoqués dans cet article explique comment faire. Vous serez alors prêt à géocoder au mieux avec vos données.

Tags:

Nombre de commentaires : 3

Merci

Merci David, vraiment très intéressant cette série d'article...
Nous avons régulièment la problèmatique de localisation sur BDADRESSE, nous avons pour l'instant souvent privilégié un développement maison. Ces articles me montrent bien les possibilités offertes par les outils ESRI.

posté par Jérémy le   11/02/2010 10:20

Re : Géocoder sur la BD Adresse (3/4)

Bonjour,
et merci pour les scripts. J'attends avec impatience ma dernière version de BD adresse pour tester la méthode.

posté par Jérôme le   16/02/2010 09:56

Re : Géocoder sur la BD Adresse (3/4)

L'outil est intéressant et me plaît.

Toutefois, il me paraît nécessaire, dans le processus d'amélioration de la BD ADRESSE, d'ajouter une étape préalable de suppression des doublons.

Par exemple, sur les 18 000 adresses de mon territoire, j'ai du épuré plus de 1 600 adresses qui avaient les mêmes :
- [NUMERO] numéro d'adresse,
- [REP] indice de répétition,
- [NOM_VOIE] nom de voie,
- [CODE_INSEE] code INSEE,
- [TYPE_LOC] type de localisation,
- X que j'ai calculé pour ne pas supprimer des points avec attributs identiques mais à des coordonnées différentes,
- Y (pareil).

J'ai donc amélioré la qualité du géocodage et supprimé les résultats multiples.
Je ne suis pas un as de la programmation; j'ai donc effectué la manipulation suivante :
- création d'un champ X et Y (si nécessaire si les doublons n'ont pas les mêmes coordonnées géographiques),
- export de la table vers un DBF édité ensuite sous EXCEL,
- création d'une clé par concaténation comprenant : [NUMERO][REP][NOM_VOIE][CODE_INSEE][TYPE_LOC][COTE][X][Y],
- tri de la table par ordre alphabétique de la colonne de la clé,
- création d'une nouvelle colonne pour détecter les doublons avec la fonction suivante à saisir en cellule B2 : =si(A3=A2;"doublon";"") --- avec A = colonne de la clé, B = colonne d'identification des doublons et la ligne 1 qui conserve les titres des colonnes --- puis à copier-coller sur tous les enregistrements,
- jointure de la couche ADRESSE de la BD ADRESSE avec la table améliorée contenant les doublons à partir du champ clé [OBJECTID],
- sélection et suppression des enregistrements contenant la valeur "doublon".

J'imagine qu'un esprit bienveillant saurait répliquer ce mécanisme dans le script.


posté par AYMERIC CHAPILLON le   05/03/2010 11:57

Nom :
Titre :
Commentaire :
Code de sécurité
Retaper ce code ci-dessous
Ajouter mon commentaire    Annuler  
 S'abonner
 Archives
Cheap Ugg Boots Sheepskin Boots Cheap Winter Boots Ugg Shoes Discount Boots Winter Shoes Moncler jacket Cheap Moncler Jackets
Discount UGG Boots Columbia Coat Canada Goose Outlet Spyder Jackets cheap nhl jerseys