Vous êtes iciForum
 Bienvenue sur l'espace collaboratif du Programme arcOpole

Cet espace de Forums est ouvert à tous et doit vous permettre d'echanger que ce soit au sujet du programme arcOpole ou des templates métier qui sont à votre disposition.

N'hésitez pas à partager vos impressions et proposer des idées pour rechercher de nouvelles solutions métier qui pourront être utile à cette communauté.

 Forum
 
  Forum  Métiers  General  Suppression des doublons
Précédente Précédente
 
Suivante Suivante
Nouveau message 05/03/2010 12:01
  AYMERIC CHAPILLON
12 messages 
Contributeur de niveau 8


Suppression des doublons 

Ceci est un copier/coller du commentaire que j'ai posté sur le fil : Géocoder sur la BD Adresse (3/4)

 

L'outil est intéressant et me plaît.

Toutefois, il me paraît nécessaire, dans le processus d'amélioration de la BD ADRESSE, d'ajouter une étape préalable de suppression des doublons.

Par exemple, sur les 18 000 adresses de mon territoire, j'ai du épuré plus de 1 600 adresses qui avaient les mêmes :
- [NUMERO] numéro d'adresse,
- [REP] indice de répétition,
- [NOM_VOIE] nom de voie,
- [CODE_INSEE] code INSEE,
- [TYPE_LOC] type de localisation,
- X que j'ai calculé pour ne pas supprimer des points avec attributs identiques mais à des coordonnées différentes,
- Y (pareil).

J'ai donc amélioré la qualité du géocodage et supprimé les résultats multiples.
Je ne suis pas un as de la programmation; j'ai donc effectué la manipulation suivante :
- création d'un champ X et Y (si nécessaire si les doublons n'ont pas les mêmes coordonnées géographiques),
- export de la table vers un DBF édité ensuite sous EXCEL,
- création d'une clé par concaténation comprenant : [NUMERO][REP][NOM_VOIE][CODE_INSEE][TYPE_LOC][COTE][X][Y],
- tri de la table par ordre alphabétique de la colonne de la clé,
- création d'une nouvelle colonne pour détecter les doublons avec la fonction suivante à saisir en cellule B2 : =si(A3=A2;"doublon";"")   --- avec A = colonne de la clé, B = colonne d'identification des doublons et la ligne 1 qui conserve les titres des colonnes --- puis à copier-coller sur tous les enregistrements,
- jointure de la couche ADRESSE de la BD ADRESSE avec la table améliorée contenant les doublons à partir du champ clé [OBJECTID],
- sélection et suppression des enregistrements contenant la valeur "doublon".

J'imagine qu'un esprit bienveillant saurait répliquer ce mécanisme dans le script.

 
Précédente Précédente
 
Suivante Suivante
  Forum  Métiers  General  Suppression des doublons
Cheap Ugg Boots Sheepskin Boots Cheap Winter Boots Ugg Shoes Discount Boots Winter Shoes Moncler jacket Cheap Moncler Jackets
Discount UGG Boots Columbia Coat Canada Goose Outlet Spyder Jackets cheap nhl jerseys