L'Agence nationale de la recherche Des projets pour la science

Suivi bilanEditions 2013 et antérieuresSciences et Technologies de l'Information et de la CommunicationCHIST-ERAThèmes et sujets de rechercheFrom Data to New Knowledge

Edition 2013 et antérieures / Archives

Cette rubrique n'est plus actualisée. Pour connaître notre offre de financement, consultez la rubrique "Financer votre projet".

  •  Description de la thématique 3 - From Data to New Knowledge

L’enjeu de cette thématique, proposée aux chercheurs lors du second appel de l’ERA-Net (en 2011), est de produire de nouveaux concepts informatiques, modèles, outils et méthodologies pour extraire automatiquement et de manière fiable des connaissances nouvelles à partir de grandes quantités de données hétérogènes et non structurées. Ces données comprennent, typiquement, des données multilingues et multimédias telles que l’on peut les trouver sur le web (texte, parole, image, vidéo, ...) et les données générées par les organisations humaines dans le cadre d'activités scientifiques, industrielles ou de service (données médicales, représentations d'objet 3D, données de production avancée...). Les données sont traitées pour produire de nouvelles connaissances, de niveau supérieur : généralement une description sémantique du contenu des données, ou des modèles élaborés, des scripts ou des savoirs expérimentaux, qui pourront à leur tour être utilisés pour traiter d'autres données. Une telle production de nouvelles connaissances implique des systèmes de traitement complexes, dont la fiabilité ne peut être déterminée analytiquement, mais peut être estimée par la confrontation à des ensembles de données représentatifs.

Bien que de nombreuses activités soient déjà en cours dans ce domaine, les systèmes existants sont loin d'offrir l’acquisition de connaissances suffisamment fiable à partir de tout type de données, et la recherche fondamentale est encore nécessaire. L'objectif de l'appel est de favoriser la recherche de long terme hautement innovante et de cibler de nouvelles applications.

Les projets concernent un ou plusieurs des sujets suivants:

1.    Nouveaux concepts et modèles pour les tâches ambitieuses telles que le« Machine Reading ».
2.    Nouveaux modèles et systèmes pour le traitement de données difficiles telles que les données à fort bruit, les données non-stationnaires, les données hautement multilingues; et méthodes pour donner du sens à des données encore inexploitées et ce de façon non supervisée.
3.    Modèles et systèmes génériques pour le traitement de données très hétérogènes, en particulier impliquant différents niveaux/échelles.
4.    Systèmes capables de savoir quand ils ne savent pas et capable de gérer dynamiquement des données d’entrée imprévues.
5.    Tâches radicalement nouvelles, émergentes qui ont jusqu'ici reçu peu d'attention de la part de la recherche.
6.    Méthodologies, outils et formats génériques facilitant l'échange des données et des modèles.

Dans tous les cas, les projets doivent s’attacher à mesurer les progrès vers les applications envisagées et fournir une description détaillée de la façon dont les idées et les systèmes seront testés expérimentalement (données d'évaluation, mesures et protocoles). Les projets sont aussi encouragés à prévoir les moyens pour mettre en œuvre des expériences objectives, significatives et reproductibles lorsque ceux-ci ne sont pas déjà disponibles par ailleurs.

Les projets financés devraient sensiblement faire progresser l'état de l’art dans le domaine de l'extraction de connaissances à partir de données en réalisant un ou plusieurs des objectifs suivants:

1.    Développer une compréhension plus profonde des fondements du traitement des connaissances.
2.    Renforcer la collaboration interdisciplinaire afin d'être en mesure de répondre à un très large éventail de types de données et de connaissances.
3.    Identifier de nouvelles opportunités issues de ces technologies et, éventuellement le transfert de celles-ci des laboratoires à l’industrie.
4.    Fortement accélérer l'émergence d’applications utiles et attendues pour la gestion efficace et fiable d'informations ou permettre l'émergence d’applications complètement nouvelles.

  • Projets de la thématique 3

La liste des projets financés dans le cadre de cette thématique est accessible depuis le moteur de recherche des projets de l’ERA-Net CHIST-ERA sur son site officiel : www.chistera.eu/projects-list

Programmes "STIC"

  • INFRA (Infrastructures pour la société numérique)
  • INS (Ingénierie Numérique et Sécurité)
  • CONTINT (Contenus Numériques et Interactions)
  • MN (Modèles Numériques)
  • CHIST-ERA (Long-term CHallenges in Information and Communication Sciences and Technologies)