Exploration des outils Géomatiques pour le Traitement et l’Analyse des données Géolinguistiques : application à la dialectologie

Le projet GeoDialect s’intéresse à l’amélioration de la gestion des documents cartographiques utilisés dans le traitement et l’analyse des données géolinguistiques, au moyen de méthodes géomatiques innovantes. Plus précisément, nous nous concentrons sur un outil de la dialectologie - les Atlas Linguistiques - et la manière avec laquelle nous pouvons transférer ces travaux de leur support initial papier, vers un support numérique et informatisé. Nous nous focalisons sur le premier grand chantier dialectologique de France, l’Atlas Linguistique de la France (Gilliéron et Edmont, 1902-1910) et à la façon dont nous pouvons réorganiser les données qui le composent par le biais de moyens informatisés et plus particulièrement des outils de type Système d’Information Géographique. L'objectif est de définir les spécifications méthodologiques et technologiques permettant l’extraction des données sémantiques et géographiques contenus dans les cartes géolinguistiques anciennes de l’Atlas Linguistiques de France (ALF), et leur intégration au sein d’un système d’information géographique. Notre proposition consiste : i) à repérer les caractéristiques des données de l’ALF ainsi que le processus de traitement et d’analyse de données mis en place pour cet atlas ; ii) définir les spécifications d’un processus de numérisation adapté aux caractéristiques des données géolinguistiques; iii) à spécifier des méthodes d’extraction par vectorisation de contenus des cartes anciennes ; iv) à élaborer un modèle de données géolinguistiques permettant leur intégration dans un système d’information géographique ; v) à proposer des méthodes et traitements d’analyse spatiale, ainsi que vi) des modes de représentations cartographiques favorisant les analyses géolinguistiques. 

Le projet Geodialect regroupe deux équipes de recherche du Labex Persyval :

  • l’équipe SLD du Gipsa-Lab spécialisée en dialectolgie et Système Linguistique;
  • l’équipe STeamer du LIG spécialisée dans le traitement informatique des données géographique et la géomatique.

Ce projet bénéficie d'un financement complémentaire de la Mission Inter-disciplinaire du CNRS dans le cadre des appels à projets exploratoires PEPS HuMain 2013 (Projet CartoDialect). Dans ce contexte de nouvelles équipes de recherche sont venues renforcer le consortium

  • L’équipe ASPIC du Laboratoire 3i de la Rochelle et l’équipe IMAGINE du LIRIS de Lyon toutes deux spécialisées dans le traitement d’image bas niveau et la reconnaissance des formes et leur vectorisation,
  • Le Laboratoire Jean Kuntzmann de Grenoble spécialisé en géostatistique.

Equipes

LIG-STeamer GIPSA-Lab LJK L3i La Rochelle LIRIS Lyon
Paule-Annick Davoine Didier Demolin Philippe Garat Mickael Coustaty Stephane Bres
Marlène Villanova-Oliver Silvia Gally   Jean-Marc Ogier Véronique Eglen
Jérôme Gensel Carole Chauvin   Jean-Christophe Burie  
Xiaoyu Yu Michel Contini   Marwa Mansri (Stagiaire)  
Oton Copi (Stagiaire) Julie Jouanneaux (Stagiaire)      
Camille Briend (stagiaire)        

Publications et valorisation

–Davoine P-A, Chauvin C., Gally S., Garat Ph, Oton C., « New approach to explore and to study cartographic heritage in dialectology : application to the Linguistic Atlas of France », International Cartographic Conference, ICC 2015, Rio de Janeiro, Brasil August 23-28, 2015 –Quoc Bao, Dang, Muhammad Muzzamil Luqman, Mickaël Coustaty, Cao De Tran, Jean-Marc Ogier SRIF: Scale and Rotation Invariant Features for Camera-Based Document Image Retrieval - ICDAR 2015 (soumis) –Gally S., Chauvin C., Davoine P.-A., Demolin D., Contini C., GeoDialect : exploration des outils géomatiques pour le traitement et l’analyse des données géolinguistiques , Revue « Géolinguistique », vol. 14-2014, ELLUG, Grenoble –Mickael Coustaty, Nibal Nayef, Cao De Tran, Jean-Marc Ogier - A multi-layer approach for camera-based complex map image retrieval and spotting system, IEEE IPTA 2014   http://cartodialect.imag.fr http://navidomass.univ-lr.fr/MapDataset/