L'Agence nationale de la recherche Des projets pour la science

Translate this page in english

Le numérique au service des arts, du patrimoine, des industries culturelles et éditoriales (DS0703) 2015
Projet ECLATS

Extraction automatisée des Contenus géoLinguistiques d'ATlas et analyse Spatiale: application à la Dialectologie

Le projet ECLATS s’attache à la valorisation et l’analyse des documents cartographiques anciens, un patrimoine historique et culturel reconnu comme source d’information particulièrement riche mais difficilement exploitable. Nous nous intéressons plus particulièrement à l'Atlas Linguistique de France (ALF), élaboré entre 1902 et 1910, qui fournit les données de premier ordre en dialectologie.
La dialectologie s’intéresse à l’étude des traits linguistiques caractéristiques des langues à tradition orale comme les parlers locaux (patois ou dialectes). Ces traits peuvent être de natures différentes - phonétique, morpho-syntaxique, lexicale, sémantique ou prosodique - et évoluent dans l’espace géographique, au cours du temps, au contact de la société. Pour étudier les parlers locaux, la dialectologie s’est spécialisée dans la constitution de corpus de données phonétiques transcrites dans des atlas linguistiques. Ces ouvrages regroupent un ensemble de cartes sur lesquelles sont inscrites, pour une notion donnée, les formes phonétiques collectées en des points géographiques d’enquête. Composé de 1900 cartes représentant 639 points d’enquête, l’ALF qui représente un des atlas linguistiques les plus emblématiques, constitue un corpus de 1.214.100 données lexicales sur papier, fiables, notées de façon homogène, à partir d'un seul questionnaire, avec précision des lieux, des dates, des circonstances.
En géolinguistique et dialectologie, l'approche théorique utilisée lors de la construction des atlas est structurée, fiable et homogène. En revanche, l'outillage logiciel et méthodologique destiné à l'exploitation des données cartographiques est très en retard : le relevé des données issues d’atlas et la réalisation des cartes interprétatives s’effectuent de façon manuelle, ce qui est particulièrement chronophage; la dématérialisation des cartes anciennes n’est pas systématique; les systèmes d'information géographique et les méthodes d'analyse spatiale sont peu utilisés, limitant le traitement et l’interprétation des données. Ce retard constitue un frein à une diffusion et une exploitation efficaces des données anciennes et à la valorisation du patrimoine linguistique.
Le projet ECLATS propose d’apporter un outillage logiciel et méthodologique innovant facilitant l’extraction, l'analyse, la visualisation et la diffusion des données contenues dans les atlas linguistiques anciens afin de permettre des recherches novatrices en dialectologie. Il s'attache à :
- définir des modèles de représentation des données géolinguistiques en vue de leur intégration dans un système d’information, ainsi que des formats d’échange favorisant l’interopérabilité des données ;
- proposer un processus de stockage des cartes numérisées afin de faciliter leur exploitation et leur diffusion;
- développer des méthodes d'extraction de contenus et d’annotation de cartes anciennes. Le caractère générique des propositions doit permettre leur application à d’autres documents cartographiques anciens;
- proposer des méthodes d'analyse spatiale et de géovisualisation facilitant la production de cartes interprétatives et l'extraction de connaissances géolinguistiques ;
- promouvoir une démarche collaborative de mutualisation et de partage des données géolinguistiques.
Ce projet pluridisciplinaire se positionne dans le domaine de la géomatique à l’interface entre l’informatique, les sciences de l’information géographique et la géolinguistique. Il associe des équipes de recherche en informatique spécialisées en géomatique (LIG), en numérisation de documents anciens (LIRIS) et en extraction automatique de contenus (LIRIS, Li3), et une équipe experte en dialectologie (Gipsa-lab). Il se place dans le domaine des humanités numériques pour lequel il entend proposer une chaîne de traitement géomatique adaptée à la valorisation des données difficilement exploitables que constituent les supports cartographiques anciens.

Partenaires

INSA Lyon - LIRIS Institut National des Sciences Appliquées de Lyon - Laboratoire d'Informatique en Image et Systèmes d'Information

LIG Laboratoire d'Informatique de Grenoble

GIPSA-Lab Laboratoire Grenoble Images Parole Signal Automatique

L3I Laboratoire Informatique, Image et Interaction

Aide de l'ANR 529 433 euros
Début et durée octobre 2015 - 48 mois

 

Programme ANR : Le numérique au service des arts, du patrimoine, des industries culturelles et éditoriales (DS0703) 2015

Référence projet : ANR-15-CE38-0002

Coordinateur du projet :
Madame Paule-Annick Davoine (Laboratoire d'Informatique de Grenoble)

 

Revenir à la page précédente

 

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.