L'Agence nationale de la recherche Des projets pour la science

Translate this page in english

Corpus, données et outils de la recherche en sciences humaines et sociales (Corpus)
Edition 2012


MEGALEX


Méga-études de la reconnaissance des mots écrits et parlés

Méga-études de la reconnaissance des mots écrits et parlés - MEGALEX
Ce projet a pour objectif principal de mieux comprendre les processus cognitifs impliqués dans la lecture et la perception de la parole chez l'adulte.

Comprendre les facteurs en jeu dans la lecture et la parole.
Le projet MEGALEX a pour objectif principal de mieux comprendre les processus cognitifs impliqués dans la reconnaissance des mots écrits et parlés. Jusqu'à présent, presque tous les travaux se sont cantonnés à des études impliquant un nombre limité de mots monosyllabiques et de variables lexicales. Le projet MEGALEX a pour objectif de compléter les études précédentes grâce à une nouvelle approche, l'approche méga-étude. Cette nouvelle approche consiste à tester un très grand nombre de mots complexes (plusieurs dizaines de milliers).

Notre premier objectif est d'appliquer l'approche psychophysique développée par Keuleers et al. (2012) au français (décision lexicale visuelle), en testant 28 000 mots et 28 000 pseudomots à travers 100 participants qui réaliseront 20 heures d’expérience. Cela permettra de réaliser de nouvelles analyses et également d’augmenter la puissance de ces analyses (modèles mixtes). Par ailleurs, cela permettra de mieux comprendre les similarités et les différences entre l'anglais, le français et le néerlandais. De plus, les temps de réaction recueillis seront indispensables pour les simulations des modèles computationnels de la lecture qui utilisent le français comme langue. Enfin, ce corpus permettra d'étudier le traitement des mots polysyllabiques et polymorphémiques.

Notre deuxième objectif est de tester, pour la première fois à cette échelle, plusieurs dizaines de milliers de mots en présentation auditive (les mêmes mots que ceux utilisés en modalité visuelle seront testés). Il n’existe aucune méga-étude dans le domaine de la reconnaissance des mots parlés. Il est donc crucial de fournir une étude auditive équivalente à ce qui existe déjà dans la modalité visuelle.

Grâce à ces deux méga-études, nous comparerons les similitudes et les différences de traitement entre les modalités visuelle et auditive et nous identifierons l'importance relative des variables lexicales influençant les performances dans ces deux modalités.

Approche méga-étude.
L’approche méga-étude sera utilisée. Elle consiste à tester un très grand nombre de mots et de pseudomots (plusieurs dizaines de milliers) sur un petit nombre de participants (une centaine).

La tâche utilisée dans les deux études (lecture et parole) est la tâche de décision lexicale (tâche classiquement utilisée en psycholinguistique).

Dans cette tâche, les participants reçoivent des mots et des pseudomots présentés de façon aléatoire et ils doivent décider (à l’aide d’un boitier réponse) le plus rapidement possible et sans faire d’erreur si le stimulus présenté (visuellement ou auditivement) est un mot de la langue française ou non. Nous mesurons les temps de réponse (à la milliseconde prés), ainsi que les pourcentages d’erreurs.

Dans notre projet, nous testons deux tâches de décision lexicale, l’une dans la modalité visuelle (lecture), l’autre dans la modalité auditive (parole).

Résultats

En cours d'analyse.

Perspectives

Le projet MEGALEX doit avoir d'importantes retombées théoriques dans le domaine de la reconnaissance des mots écrits et parlés. Par ailleurs, MEGALEX permettra de mieux comprendre quels sont les facteurs lexicaux importants dans les deux modalités testées, auditive et visuelle. Le projet MEGALEX permettra également de conduire des expériences virtuelles et de tester la robustesse des effets expérimentaux obtenus avec l'approche factorielle classique. Enfin, les résultats de ce projet seront cruciaux pour le développement des modèles de la perception des mots écrits et parlés.

Par ailleurs, les résultats du projet MEGALEX seront accessibles librement et gratuitement sur le site LEXIQUE (www.lexique.org). De plus, afin de garantir une plus grande diffusion, une plus grande pérennité et un stockage sécurisé de MEGALEX, nous l'archiverons et la diffuserons également sur ADONIS (http://www.tge-adonis.fr).

Productions scientifiques et brevets

A venir.

Partenaires

CNRS DR12 - LPC Centre National de Recherche Scientifique Délégation Provence et Corse - Laboratoire de Psychologie Cognitive

LAPSCO Laboratoire de Psychologie Sociale et Cognitive (CNRS UMR 6024)

LPNC Laboratoire de Psychologie et NeuroCognition (CNRS UMR 5105)

UNICOG Unité INSERM 992 de Neuroimagerie Cognitive

Aide de l'ANR 199 067 euros
Début et durée du projet scientifique janvier 2013 - 36 mois

Résumé de soumission

Depuis plus d'un siècle, les chercheurs en psycholinguistique, psychologie cognitive et sciences cognitives essayent de comprendre les processus cognitifs impliqués dans la reconnaissance des mots écrits et parlés (voir Adelman, 2011; Balota, Yap & Cortese, 2006; Ferrand, 2007; Ferrand, New, Brysbaert, Keuleers, Bonin, Méot, Augustinova & Pallier, 2010; Grainger & Holcomb, 2009; Grainger & Ziegler, 2011; Spinelli & Ferrand, 2005; Dahan & Magnuson, 2006; Pisoni & Levi, 2007). Jusqu'à présent, presque tous les travaux se sont cantonnés à de petites études impliquant un nombre limité de mots monosyllabiques, sélectionnés selon des plans factoriels, avec un nombre limité de variables indépendantes. Le projet MEGALEX a pour objectifs de compléter les études précédentes grâce à une nouvelle approche, l'approche "méga-étude", (1) en utilisant les techniques de régressions multiples impliquant un très grand nombre de stimuli ; (2) en étudiant les processus cognitifs sous-tendant la reconnaissance visuelle et auditive de mots plus complexes tels que les mots polysyllabiques et polymorphémiques ; et (3) en utilisant l'approche psychophysique (plan à mesures répétées) développée récemment par Keuleers, Lacey, Rastle, et Brysbaert (2011).

Le projet consiste en deux phases principales. Dans la Phase 1, nous recueillerons les temps de réaction et les pourcentages d'erreurs dans la tâche de décision lexicale visuelle sur environ 28000 mots français et 28000 pseudomots, avec un petit groupe de participants (n=100). Les 28000 mots (pour la plupart polysyllabiques et polymorphémiques, de longueurs et de fréquences variables) seront sélectionnés parmi les 130000 entrées lexicales disponibles dans Lexique (www.lexique.org ; New, Pallier, Brysbaert, & Ferrand, 2004). Nous inclurons également des formes fléchies (formes au féminin, au pluriel, et formes verbales). Grâce à ce méga-corpus, nous pourrons répondre à des questions théoriques importantes non résolues en lecture. Les temps de réaction recueillis seront soumis à des analyses de régressions multiples (modèles mixtes linéaires : Baayen, Davidson, & Bates, 2008) afin d'étudier l'influence de variables continues habituellement traitées comme des variables catégorielles dans les plans factoriels.

Dans la Phase 2, nous recueillerons les temps de réaction et les pourcentages d'erreurs sur le même nombre de mots et de pseudomots, dans une modalité jamais testée auparavant à une telle échelle, la modalité auditive. Les méga-études sont quasiment inexistantes dans le domaine de la reconnaissance des mots parlés, et la littérature dans ce domaine a été dominée par les études factorielles. Il nous semble donc crucial de fournir une telle méga-base de données en modalité auditive. La présentation de stimuli auditifs demande beaucoup plus d'efforts que la présentation de stimuli visuels, mais cela est fondamental car certaines variables influencent spécifiquement la reconnaissance des mots parlés (par exemple, la densité du voisinage phonologique, la durée du stimulus, le point d'unicité, etc.) en plus des variables habituelles trouvées dans la reconnaissance des mots écrits (par exemple, la fréquence, la longueur en nombres de lettres et syllabes, le voisinage sémantique, etc.).

Les temps de réaction recueillis et les analyses sophistiquées (modèles mixtes) qui en découleront nous permettront (1) de mieux comprendre l'architecture fonctionnelle des différents niveaux de traitements impliqués dans la reconnaissance des mots écrits et parlés ; (2) de préciser la nature des représentations sur lesquelles s'effectuent ces traitements ; et (3) de spécifier le codage (orthographique, phonologique, morphologique, sémantique) accompli par ces différents niveaux de traitement. Ces travaux seront cruciaux pour les modèles de la reconnaissance des mots écrits et parlés. Dans l'ensemble, ces travaux permettront une meilleure compréhension des facteurs en jeu dans la reconnaissance des mots écrits et parlés.

 

Programme ANR : Corpus, données et outils de la recherche en sciences humaines et sociales (Corpus) 2012

Référence projet : ANR-12-CORP-0001

Coordinateur du projet :
Monsieur Ludovic FERRAND (Laboratoire de Psychologie Sociale et Cognitive (CNRS UMR 6024))
Ludovic.Ferrand@nulluniv-bpclermont.fr

Site internet du projet : https://sites.google.com/site/flpmegalex/

 

Revenir à la page précédente

 

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.