L'Agence nationale de la recherche Des projets pour la science

Suivi bilanEditions 2013 et antérieuresSciences et Technologies de l'Information et de la CommunicationContenus Numériques et InteractionsFiche projet - CONTINT

Edition 2013 et antérieures / Archives

Cette rubrique n'est plus actualisée. Pour connaître notre offre de financement, consultez la rubrique "Financer votre projet".

Contenus et Interactions (CONTINT) 2012
Projet CRISTAL

Contextes RIches en connaissanceS pour la TrAduction terminoLogique

La globalisation des échanges commerciaux rend primordial pour chaque entreprise d'être capable d'échanger avec ses partenaires, clients, employés dans leur langue maternelle et de donner à ses employés la possibilité de communiquer aisément dans une langue étrangère, en particulier dans leur domaine d'expertise. Dans ce contexte, la maîtrise de la terminologie (qu'elle soit multilingue ou monolingue) devient cruciale et permet de délivrer des contenus textuels cohérents tout en réduisant leur temps de production. Or, il est très rare de trouver des ressources linguistiques adaptées au domaine technique de l'entreprise. Qui plus est, les connaissances techniques, tout comme les dénominations utilisées pour désigner ces connaissances, évoluent très rapidement ce qui rend caduque et financièrement inabordable toute tentative de création manuelle de telles ressources.

Pour répondre à cette problématique, des outils de Traduction Assistée par Ordinateur et de gestion terminologique innovants existent pour répondre aux besoins des entreprises et organismes publics en termes de gestion de l’écrit multilingue et monolingue. À l’heure actuelle, ces outils sont capables d'extraire automatiquement à partir des textes de l'entreprise un véritable dictionnaire de l'entreprise, qui documente, traduit et facilite l'accès à toutes les expressions propres à cette entreprise et aux termes techniques liés à son domaine d'activité.

Si l'accès aux expressions, termes techniques et à leurs traductions s'avère indispensable à tout processus de communication, leur compréhension peut être potentialisée au moyen de la « contextualisation » de ces termes et expressions. En effet, avoir accès à un terme ou à sa traduction ne suffit pas, encore faut-il être capable (1) de l'employer correctement et (2) d'en appréhender le sens exact. Cette contextualisation a donc lieu à deux niveaux : 1) dans les textes : l'utilisateur doit avoir accès à des informations concernant l'usage des termes. Pour cela, il faut pouvoir extraire automatiquement des contextes riches en connaissances linguistiques (CRCL) ; 2) dans le domaine conceptuel : l'utilisateur doit avoir accès aux relations sémantiques ou conceptuelles entre termes afin de mieux en saisir le sens. Pour cela, il faut pouvoir extraire automatiquement des contextes riches en connaissances conceptuelles (CRCC).

L’objectif du projet CRISTAL est justement de développer une technologie d'extraction de contextes riches en connaissances (CRC) permettant de produire ces nouveaux dictionnaires. Ces derniers présenteront, pour chaque terme et ses traductions éventuelles, une fiche terminologique listant les CRC et explicitant les connaissances qu'ils contiennent. L'extraction de tels contextes nécessite a conception d'algorithmes avancés d'extraction de connaissances, capables d'analyser automatiquement et de façon robuste le contenu linguistique et sémantique de textes bruts et non-structurés et ce, quelle qu'en soit la langue. C’est donc une nouvelle génération d'outils d'aide à la traduction et à la gestion terminologique que nous visons lesquels favoriseront la communication multilingue par l'enrichissement sémantique des ressources proposées.

Partenaires

CLLE Cognition, Langues, Langage, Ergonomie

LINA Laboratoire d'Informatique de Nantes-Atlantique

L&M Lingua et Machina

ETI UNIGE - Ecole de traduction et d'interprétation

Aide de l'ANR 576 608 euros
Début et durée du projet scientifique septembre 2012 - 36 mois

 

Programme ANR : Contenus et Interactions (CONTINT) 2012

Référence projet : ANR-12-CORD-0020

Coordinateur du projet :
Monsieur Emmanuel Morin (Laboratoire d'Informatique de Nantes-Atlantique)
emmanuel.morin@nulluniv-nantes.fr

 

Revenir à la page précédente

 

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Programmes "STIC"

  • INFRA (Infrastructures pour la société numérique)
  • INS (Ingénierie Numérique et Sécurité)
  • CONTINT (Contenus Numériques et Interactions)
  • MN (Modèles Numériques)
  • CHIST-ERA (Long-term CHallenges in Information and Communication Sciences and Technologies)