Emergence - Emergence

TRAduction: Outils Unifiés, Intégrables, Embarquables, et Ressources Opérationnelles – Traouiero

Résumé de soumission

Le projet Traouiero vise à permettre l'opérationnalisation d'outils logiciels et de techniques et ressources linguicielles développés jusqu'ici par le GETALP du LIG en tant que prototypes opérationnels.

Dans le contexte du Web 2.0, le GETALP a proposé de remplacer le paradigme traditionnel de la traduction, produit cher payé une fois livré, par celui d'accès multilingue, service peu cher sous forme d'abonnement, permettant l'augmentation collaborative de la qualité de "prétraductions" produites automatiquement.

Une jeune pousse a été créée autour de ce concept, AXiMAG, BU de Floralis (UJF-filiale) depuis septembre 2009, et en voie de constitution en SAS. AXiMAG commence à valoriser les produits de la recherche du GETALP, et a besoin rapidement de versions "opérationnalisées" et de ressources "passant à l'échelle".

D'autre part, le GETALP travaille sur la TA multimodale de livres de phrases, sur smartphones, pour des couples de langues peu dotés, et a anticipé la possibilité de faire de la TA embarquée dans le projet Ariane-Y.

Ce projet comporte 3 parties principales, nommées Ariane++, iMAG++, et LING++. Il se trouve que, pour chacune d'elles, nous disposons de produits ou ressources résultant de travaux menés depuis longtemps, et d'autres développés dans des thèses récentes. Il y a actuellement une opportunité unique d'opérationnaliser le tout, en faisant appel à la fois à des permanents de grande expérience, et à 3 postdoctorants très intéressés par l'opérationnalisation des logiciels créés pour leur thèse.

La partie Ariane++ du projet Traouiero concerne (1) la finalisation des langages spécialisés (LSPL) d'Ariane-Y et les tests sur iPad/iPod et autres smartphones, (2) l'intégration de SECTra_w comme serveur de corpus de TA, (3) l'intégration de PIVAX comme serveur lexical de TA, (4) l'adaptation smartphone des LSPL Héloïse (ATEF-H, ROBRA-H…) et aux iPad/iPod, (5) la création d'un EDL unifié acceptant les LSPL d'Ariane-Y (+SysQ-Y) et d'Héloïse, (6) l'intégration et les tests sur smartphones.

La partie iMAG++ concerne (1) la modularisation du logiciel-iMAG et la création du relais-iMAG, (2) l'organisation en agents avec contrôle par tableau blanc et tâches en boucles infinies, (3) l'amélioration de l'outil TRADOH d'appel paramétré à plusieurs systèmes de TA, (4) la création de SegDoc, un segmenteur-normaliseur propriétaire meilleur que ceux de Google et autres, (5) la génération automatique spécialisée de systèmes de TA empiriques, spécialisés aux sous-langages des sites Web accédés par iMAG.

La partie LING++ concerne (1) la consolidation de systèmes de TA "experts" existants (russe-français, anglais-français, français-anglais), (2) la mise en forme de modules de systèmes de TA pour qu'ils soient utilisables séparément (lemmatiseurs pour russe, français, anglais, allemand; transcripteurs), (3) le passage à l'échelle de la technique OMNIA d'étiquetage sémantique interlingue de textes spontanés (par des lexèmes interlingues UW++ d'UNL), (4) le passage à l'échelle de l'actuelle base lexicale multilingue liée à des UW++: de 200K à 1-2M entrées (avec extraction monolingue et bilingue d'expresssions multimots).

Chacune de ces 3 parties sera accompagnée par le partenaire de valorisation, qui s'occupera des aspects liés à la propriété intellectuelle, et de la valorisation. Il est important que ce projet débouche sur des produits permettant le développement collaboratif ouvert de ressources linguicielles, et que les logiciels produits puissent être utilisés librement pour la recherche tout en donnant lieu à des rétributions de services associés par les utilisateurs commerciaux.

Coordination du projet

Christian BOITET (UNIVERSITE GRENOBLE I [Joseph Fourier]) – Christian.Boitet@imag.fr

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LIG-GETALP UNIVERSITE GRENOBLE I [Joseph Fourier]

Aide de l'ANR 346 515 euros
Début et durée du projet scientifique : - 24 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter