L'Agence nationale de la recherche Des projets pour la science

Translate this page in english

Programme Technologies Logicielles (TLOG) 2006
Projet PIITHIE

Plagiat et Impact de l'Information Textuelle recHerchée dans un contexte InterlinguE

Le projet Piithie s´inscrit dans un mouvement de plus en plus important de maîtrise de l´information diffusée. Il vise premièrement la détection de plagiats de textes. Les techniques de traitement automatique des langues (TAL), devraient permettrent d'améliorer les performances et d'accroître le potentiel de recherche des outils d'Advestigo et de Sinequa. Le deuxième objectif concerne le suivi d´impact : les diffuseurs d'information sont très intéressés par la possibilité d´évaluer l´impact de leur production. Aujourd´hui cette évaluation est faite par une étude manuelle alors que des méthodes automatiques sont possibles. Les traitements nécessaires à ces deux applications sont de même nature , ils demandent seulement un paramétrage différent selon que l´on cherche une copie illégale de l´information ou une utilisation parfaitement légale et dont le contenu peut être très divergent. Les principaux verrous de ce projet concernent 1. la capacité à évaluer la proximité de deux contenus textuels en tenant compte des différents phénomènes de réécriture 2. l'extraction de termes suffisamment représentatifs d'un document pour pouvoir retrouver des documents similaires sur Internet en posant des requêtes à un moteur classique 3. la détection de citations dot il faut tenir compte pour l'évaluation d'impact et qui perturbent la détection de plagiat. Afin de gérer l'ensemble des phénomènes impliqués (réécriture, paraphrase, imitation, etc.) plusieurs types d'analyses linguistiques seront appliqués et testés afin de déterminer quel est leur apport.

Partenaires

TPE

 UNIVERSITE D'AVIGNON ET DES PAYS DU VAUCLUSE

 UNIVERSITE DE NANTES

PME

Aide de l'ANR 661 051 euros
Début et durée du projet scientifique - 24 mois

 

Programme ANR : Programme Technologies Logicielles (TLOG) 2006

Référence projet : ANR-06-TLOG-0013

Coordinateur du projet :
SINEQUA (SINEQUA)

 

Revenir à la page précédente

 

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.