L'Agence nationale de la recherche Des projets pour la science

Translate this page in english

Défi des autres savoirs (DS10) 2016
Projet NaijaSynCor

Corpus pour une Etude Macro-Syntaxique du Naija (Pidgin du Nigéria)

NaijaSynCor entreprend une étude exhaustive et approfondie de la structure du Naija (Nigerian Pidgin) tel qu’il est parlé aujourd’hui au Nigéria. Une étude faite publiée en 2005 par I. Deuber a prouvé que cette langue, telle qu’elle est aujourd’hui parlée par les intellectuels Nigérians, a été est devenue à Lagos une langue autonome, distincte de la variété d’anglais utilisée au Nigéria. Le projet NaijaSynCor se propose de déterminer si cela est vrai pour le reste du Nigeria où le Naija est parlé par plus 75 millions de locuteurs. Grâce à la création d'un corpus finement annoté pour la morphologie, la micro- et la macro-syntaxe, ainsi que l’intonation, le projet documente l'émergence de cette langue comme une langue au niveau national, en contestant les théories existantes du développement des créoles et des langues en contact. Il examine les variations diachroniques, diatopiques, diaphasiques, diastratiques, et fonctionnelles.
Ce projet est le résultat de la collaboration de deux unités de recherche qui ont prouvé leur savoir-faire dans l'annotation de corpus dans des programmes précédents : le Llacan, sur des langues peu décrites (Corpafroas et Cortypo) ; Modyco, sur l'interaction de la prosodie et de la syntaxe en français (ANR Rhapsodie) et le développement de grandes treebanks (ANR Orféo) et de deux éminents experts nigérians sur Naija (F. Egbokhare & C. Ofulue). Le cadre de description macrosyntaxique développé par le projet ANR Rhapsodie (Lacheret, Kahane et coll. 2014) s'est avéré particulièrement efficace en ce qui concerne les spécificités des corpus oraux, par exemple les empilages, répétitions, marqueurs de discours, chevauchements, co-énonciations, disfluences, faux départs, réparations et des troncatures. Cette méthode est inductive, pilotée par les données (les unités pertinentes sont identifiées grâce à l'annotation) et modulaire.
Les outils développés par l'équipe de recherche dans les précédents programmes d'étude du corpus (sont robustes et suffisamment développés pour se concentrer sur le problème linguistique posé par le Naija: dans son expansion géographique et fonctionnelle, le Naija maintient son statut comme langue autonome par rapport à l’anglais du Nigéria, ou subit-il une décréolisation ? Tout en répondant à cette question, le programme de recherche vise à surmonter les deux défis technologiques que sont (i) l’identification automatique des unités illocutoires basée sur les paramètres fournis par les données intonatives (ii) la construction d’un analyseur syntaxique intégrant les données intonatives dans son fonctionnement.
Capitalisant sur ces derniers développements dans le domaine de l'annotation de corpus, cette approche novatrice de la dynamique du contact et du changement dans les domaines du comportement humain et de la sociologie du langage impactera fortement la méthodologie et la technologie de la recherche sur les langues émergentes

Partenaires

LLACAN Langage, langues et cultures d'Afrique noire

Modyco Modèles, Dynamiques, Corpus, UMR7114

Aide de l'ANR 356 643 euros
Début et durée du projet scientifique février 2017 - 42 mois

 

Programme ANR : Défi des autres savoirs (DS10) 2016

Référence projet : ANR-16-CE27-0007

Coordinateur du projet :
Monsieur Bernard CARON (Langage, langues et cultures d'Afrique noire)

 

Revenir à la page précédente

 

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.