FRAL - Programme franco-allemand en Sciences humaines et sociales

La phraséologie du roman – PHRASEOROM

PHRASEOROM

La phraséologie du roman contemporain français, anglais et allemand

Vers une analyse des genres littéraires contemporains, à travers leurs expressions lexico-syntaxiques spécifiques

Le principal objectif du projet PhraseoRom a été d’élaborer une typologie structurelle et fonctionnelle des constructions lexico-syntaxiques (CLS) spécifiques au discours romanesque francophone, anglophone et germanophone à partir des années 1950. Nous avons exploré, à partir de grands corpus littéraires trilingues et avec des méthodes lexicométriques, la pertinence des phénomènes phraséologiques, et en particulier du motif textuel, pour la caractérisation de la langue littéraire. Les œuvres constitutives de ces corpus ont été réparties en 6 sous-genres : littérature générale (ou « blanche »), romans sentimentaux, policiers, historiques, de science-fiction, fantasy. L’enjeu a été d’identifier et de décrire les genres littéraires non pas en termes de rhétorique ou de style individuel des auteurs, comme c’est souvent le cas en stylistique classique, mais à travers des patrons lexico-syntaxiques récurrents extraits automatiquement avec des outils du Traitement automatique du langage (TAL). Plus généralement, il a été montré que la linguistique de corpus aide à découvrir les stéréotypes langagiers généraux qui sous-tendent le genre romanesque.

Les méthodes lexicométriques ont permis d’extraire et de regrouper automatiquement plusieurs milliers de constructions lexico-syntaxique, à partir des corpus littéraires trilingues. Les récurrences significatives de ces expressions ont été établies par rapport à un corpus de contraste (textes journalistique, scientifiques). Un système original d’annotation sémantique et stylistique de ces expressions a été élaboré. L’analyse des données sur les plans sémantique et syntaxique a été systématiquement articulée à une analyse discursive stylistique dans un but comparatif (inter-genres et inter-langues). Le motif n’est plus un élément fictionnel symbolique ou constitutif de l'imaginaire d'une œuvre, mais un observable phraséologique, composée d’unités continues ou discontinues combinant plusieurs éléments: formes de mots, catégories morpho-syntaxiques, mots-outils. Les résultats de ce projet interdisciplinaire en Humanités numériques auront des retombées en linguistique et en stylistique contrastives, en traductologie, en écriture créative.

Le projet a révélé la pertinence de la notion de motif textuel pour la caractérisation des genres littéraires et a permis de l’ « exporter » vers la communauté de chercheurs anglo-saxons en Humanités numériques. Il a complété l’étude des genres littéraires par une approche originale fondée sur la linguistique de corpus. Il a contribué à la réflexion méthodologique sur l’émergence de la stylistique « outillée » (numérique). Des contacts scientifiques ont été établis avec des chercheurs travaillant sur des problématiques proches.
PhraseoRom constitue aussi une contribution à l'élaboration d'une «théorie opérationnelle des genres«(Rastier 2011: 72), différente de la définition thématique à travers les univers de référence.Les membres des équipes françaises et allemandes ont réalisé au total 90 travaux (individuels et collectifs), dont 2 ouvrages internationaux.
Une base de données open source a été mise à la disposition de la communauté de chercheurs, d’enseignants, d’étudiants et de doctorants en linguistique, en stylistique et en TAL :
phraseotext.univ-grenoble-alpes.fr/phraseobase/index.html

Les équipes du projet PhraseoRom souhaitent poursuivre les études contrastives (français-anglais-allemand) dans le domaine de l’étude de la phraséologie dans la langue littéraire. Les apports méthodologiques du projet seront publiés, début 2021, dans la revue en ligne Corpus. Cette publication servira de référence pour l’utilisation de notre base de données PhraseoBase phraseotext.univ-grenoble-alpes.fr/phraseobase/index.html. Nous souhaitons étendre l’expérience acquise lors des ateliers d’écriture PhraséoLit / PhraseoRom à de nouveaux ateliers, en collaboration avec la SFR Création (UGA), l’UMR Litt&Arts (UGA), l’Association Les Mots voyageurs lesmotsvoyageurs.com.
Il est aussi envisagé de développer des études en traductologie, en nous appuyant sur nos corpus parallèles multilingues, en partenariat avec des chercheurs de l’UMR Litt&Arts (UGA). Par ailleurs, les résultats du projet seront étendus à l’exploration des motifs textuels dans une perspective diachronique dans le cadre d’un projet (jeunes chercheurs) émergent, qui couvrira une vaste période de l’histoire et de l’évolution du français. Enfin, nous envisageons de mettre en place une nouvelle collaboration avec des collègues de l’Université de Lausanne dans le domaine de la stylistique historique, qui aura pour but d’appliquer les approches numériques aux textes littéraires du XIXe et du XXe s.
Plus généralement, les résultats du projet pourront être utilisés en narratologie cognitive, en traductologie, dans des ateliers d’écriture créative, etc. Les outils créés dans le cadre du projet auront un impact dans le domaine de l’apprentissage automatique des textes (deep learning) et des nouvelles technologies pour la fouille des textes.

Le projet a réuni 32 participants de 10 universités. Il a donné lieu à plus de 90 communications, publications, conférences invitées. Parmi les faits marquants, on citera le Colloque Phraseology and Stylistics of Literary language, en mars 2019 à l’Université d’Erlangen-Nuremberg (45 participants de 15 pays) et l’ouvrage Phraseology and Style in Subgenres of the Novel, Palgrave MacMillan. La PhraseoBase, réunissant les corpus, les manuels méthodologiques et les données annotées du projet a été inaugurée en décembre 2019.

Le principal objectif de ce projet est d’élaborer, dans une démarche inductive corpus-driven, une typologie structurelle et fonctionnelle des constructions lexico-syntaxiques spécifiques (CLS) au discours romanesque francophone, anglophone et germanophone du XXe siècle, le roman constituant le genre littéraire qui touche le lectorat le plus large. Sur la base de cette typologie, on procédera à deux types de comparaison :
a) entre littérature et paralittérature (angl. popular literature, all. Trivialliteratur ; science-fiction ; roman policier ; roman sentimental) ;
b) entre les pratiques stylistiques observables dans des traditions littéraires de pays différents (Royaume Uni, France, Allemagne).
Dans un premier temps, nous effectuerons des calculs statistiques qui permettront d’établir les récurrences significatives des constructions lexico-syntaxiques au sein des textes littéraires par rapport à un corpus de contraste (journalistique, scientifiques). Nous chercherons ensuite à établir, sur de grands corpus textuels, dans quelle mesure ces unités lexicales étendues jouent-elles un rôle dans la construction du texte littéraire et proposerons une typologie de ces unités. L’analyse linguistique des données sur les plans sémantique, syntaxique et discursif sera articulée à une analyse stylistique au sein de différents genres romanesques dans un but comparatif. Il s’agit de jeter les fondements d’un « lexique-grammaire » des constructions spécifiques au roman, avec des retombées en linguistique et en stylistique contrastives, ainsi qu’en traductologie.
Il s’agit d’un projet interdisciplinaire au croisement de la linguistique et des études littéraires et, en particulier, de la phraséologie, de la stylistique, de la théorie des genres, de la linguistique de corpus et du traitement automatique du langage (TAL). Par son objet de recherche (les phraséologismes du roman) et sa méthodologie (celle de la linguistique de corpus outillée), le projet relève du domaine des Humanités numériques en Sciences humaines et sociales.

Coordination du projet

Iva NOVAKOVA (Université Grenoble Alpes, Laboratoire de Linguistique et Didactique des Langues Etrangères et Maternelles)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

Uiversität Bonn, Anglistik Uiversität Bonn, Institut für Anglistik, Amerikanistik und Keltologie
Universität Erlangen, Romanistik Universität Erlangen, Institut für Romanistik
Universität Osnabrück, Anglistik (coord.) Universität Osnabrück,Institut für Anglistik und Amerikanistik
Université Grenoble Alpes, Litt&Arts Université Grenoble Alpes, Litt&Arts. Arts et pratiques du texte, de l’image, de l’écran et de la scène
Université Grenoble Alpes, Lidilem Université Grenoble Alpes, Laboratoire de Linguistique et Didactique des Langues Etrangères et Maternelles

Aide de l'ANR 325 208 euros
Début et durée du projet scientifique : mai 2016 - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter