Blanc SHS 2 - Sciences humaines et sociales : Développement humain et cognition, langage et communication

Acquisition précoce du langage : approches expérimentales et computationnelles – BootLang

Résumé de soumission

Les enfants dans toutes les cultures apprennent de façon rapide et fiable la ou les langues parlées dans leur environnement. Bien que les grandes étapes de l'acquisition du langage au cours des premières années de vie soient décrites avec un niveau de détail croissant, les mécanismes responsables de ces acquisitions restent mal compris. En effet, la complexité du problème d'apprentissage est redoutable dans la mesure où plusieurs niveaux de description linguistique doivent être acquis simultanément: la structure sonore des mots et des phrases (phonologie), l'association entre les sons et le sens (le lexique), la structure interne des mots et leurs fonctions grammaticales (la morphologie), l'organisation des mots dans des phrases (syntaxe et sémantique). De plus, ces niveaux sont fortement interdépendants de sorte qu'apprendre un de ces niveaux semble impossible à moins d'avoir déjà préalablement appris un ou plusieurs autres niveaux. Ces interdépendances sont à la source d'un problème « d'initialisation » fondamental s'appliquant à toute théorie de l'apprentissage linguistique: d'une part, le lexique est nécessaire pour l'apprentissage de la phonologie et de la syntaxe, d'autre part, la phonologie et la syntaxe sont nécessaires pour l'apprentissage du lexique. Enfin, contrairement à l'apprentissage d'une seconde langue à l'école ou à l'apprentissage de la lecture, l'apprentissage d'une première langue se produit spontanément, de façon non supervisée, par le biais de l'immersion dans un environnement linguistique.

Notre hypothèse générale est que l'apprentissage du langage s'appuie sur une architecture globale reliant plusieurs niveaux de représentation spécialisés: les niveaux acoustique, phonétique, prosodique, morphologique, syntaxique, etc. Chez le nourrisson, cette architecture est en place, mais n'est pas spécifiée pour une langue particulière. L'apprentissage se produit initialement sur la base des informations disponibles, c'est-à-dire le signal acoustique, et sera donc nécessairement imparfait. Cependant, au fur et à mesure que l'apprentissage progresse, les informations mêmes imparfaites des niveaux linguistiques élevés seront utilisés pour contraindre l'apprentissage aux niveaux plus proches du signal, et aider la convergence vers des représentations parfaitement adaptées à la langue. Pour simplifier, l'apprentissage serait initialement piloté par des processus ascendants (‘bottom-up’), puis passerait à une phase de réglage fin sur la base des interactions entre niveaux. En utilisant la modélisation computationnelle et l'expérimentation chez des nourrissons, des enfants et des adultes, nous explorons cette hypothèse d'initialisation en deux étapes, en nous focalisant sur deux niveaux bien étudiés sur le plan développemental: la phonologie et la syntaxe. Plus spécifiquement, nous nous focalisons sur l'acquisition des catégories phonologiques et grammaticales qui émergent pendant les deux premières années de vie.

Notre projet est nouveau à plusieurs titres. L'approche générale intègre pour la première fois une expertise en linguistique, psychologie cognitive, et modélisation computationnelle. Les objectifs sont ambitieux: aboutir à une architecture intégrée pour l'initialisation du langage. La méthode constitue une innovation significative par rapport aux travaux antérieurs: plutôt que de tester des algorithmes sur des mini-corpus ou des corpus dont le contenu a été artificiellement enrichi (annotations linguistiques), nous entreprenons de les tester sur des grand corpus de vraie parole (signal acoustique). De plus, plutôt que de se restreindre à l'étude d'indices locaux et de niveaux de traitement isolés, nous nous intéressons systématiquement aux interactions multiples entre composants au sein d'une architecture intégrée.

Coordination du projet

Sharon Peperkamp (Ecole Normale Supérieure)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LSCP Ecole Normale Supérieure

Aide de l'ANR 230 000 euros
Début et durée du projet scientifique : - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter