29 geocoder en masse donnees 1Il existe aujourd'hui de nombreux outils de cartographie qui permettent d'imaginer et de créer toutes sortes de présentations géolocalisées de données. Cependant pour cartographier des informations, il faut qu'elles soient préalablement géolocaliser et donc obtenir pour chacune d'elles les coordonnées géographiques (latitude et longitude).

La plateforme opendata de l'Etat propose un outil très efficace pour géocoder en masse des données à partir d'un fichier CSV : adresse.data.gouv.fr. Cette plateforme est le fruit d'une collaboration entre l'IGN, La Poste et Openstreetmap.

Prenons comme exemple la liste des vétérinaires de la Seine en 1913, réalisée à partir d'une affiche de 1913. Le relevé contient les colonnes suivantes : nom, prénoms, lieu de réception [école vétérinaire], date de réception, adresse [d'exercice], commune. 

 

 Afin d'optimiser la reconnaissance automatique des lieux par l'outil de géocodage, il faut que les données contiennent a minima des colonnes de localisation comme : adresse, commune, et si possible une colonne permettant d'exclure les éventuels homonymes (département, code insee, code postal).

Le choix ici a été fait de rajouter une colonne avec le colonne Insee de chaque commune. Attention, pour Paris, indiquer dans la colonne "Commune" le numéro d'arrondissement pour que ça fonctionne, sur la forme "Paris 19e arrondissement"

 

29 geocoder en masse donnees 2

Le document doit ensuite être "enregistrer sous" au format CSV (voir aussi le tutoriel Valoriser un relevé nominatif sur Geneanet / Enregistrer au format CSV).

 

29 geocoder en masse donnees 3

Aller sur l'outil de géocodage CSV : adresse.data.gouv.fr, télécharger le fichier CSV obtenu précédemment et paramétrer le traitement.

  • Encodage des caractères : les caractères "spéciaux" (accents, tréma) ne sont pas reconnus par défaut, il est donc conseillé d'encoder en iso-8859-1.
  • Choix des entêtes de colonne permettant de construire les adresses : glisser-déposer sur la ligne inférieure les entêtes de colonne du fichier qui permettront le traitement de géocodage.
  • Si une colonne contient le code postal ou le code INSEE (conseillé), l'indiquer en 4. Paramètres avancés.
  • Lancer le traitement.

 

29 geocoder en masse donnees 4 

L'outil retourne un fichier CSV complété de nombreuses colonnes supplémentaires, dont la latitude, la longitude, le degré de confiance de la géolocalisation obtenu et le type de précision de la géolocalisation. Ces colonnes permettent d'identifier facilement les données dont les coordonnées géographiques sont manquantes ou pourraient éventuellement être affinées. Ainsi sur l'image ci-dessous, on remarque que

  • que l'essentiel des données sont géolocalisées au numéro de rue (housenumber)
  • que la ligne 46 est géolocalisée à la rue (street) et non au numéro (explication : l'outil de géolocalisation a fait la concordance entre la rue Parmentier qui est aujourd'hui une avenue, mais n'a pas poussé jusqu'à chercher le 6 avenue Parmentier)
  • que la ligne 44 est vide (explication : le 135 quai de Valmy actuel n'est pas dans le 9e mais dans le 10e arrondissement)

 

29 geocoder en masse donnees 5

Les colonnes peuvent être filtrées pour corriger rapidement les manques ou les imprécisions. Parmi les nombreux outils pour trouver rapidement les coordonnées géographiques d'un lieu, en voici deux :

  • GoogleMaps : une fois le lieu localisé, il suffit de repérer la latitude et la longitude qui figurent dans l'url

29 geocoder en masse donnees 6

  •  Utiliser un site comme Coordonnees-gps qui fournit rapidement les coordonnées d'un lieu demandé.

 

>> A suivre : cartographier des données.

 

Attention : votre nom de fichier CSV ne doit pas contenir d'accent !

Enregistrer


Comments est propulsé par CComment

À propos

Le numérique c’est fantastique (et non dramatique), surtout quand on travaille dans le domaine du patrimoine.

« C’est compliqué… ». « Je n’ose pas… ». « Je ne sais pas comment faire… »

Nul besoin d’années de code pour se simplifier la vie et le boulot sur un ordinateur. Archiviste et formatrice sur les outils et la médiation numérique, j'ai créé en 2015 ce blog pour partager et diffuser auprès des acteurs des archives et du patrimoine des tutoriels et des outils simples, pratiques et gratuits.

Idées, requêtes, questions, contributions sont les bienvenues.

Maïwenn Bourdic