L'Agence nationale de la recherche Des projets pour la science

Translate this page in english

Fondements du numérique (DS0705)
Edition 2014


MAD


Inpainting de données audio manquantes

Reconstruction de données audio manquantes (MAD)
Le projet MAD (2014-2018) est dédié aux problèmes de reconstruction de données audio manquantes

Enjeux et objectifs du projet MAD
Le concept d'inpainting audio est un cadre unifié pour plusieurs problèmes en traitement du signal audio tels que la suppression de clics, la restauration de CD abîmés, le declipping, la reconstruction pour la perte de paquets, la reconstruction de source dans le domaine temps-fréquence et l'extension de spectre. Alors que ces tâches ont été étudiées séparément par le passé, la formulation unifiée d'inpainting audio est une abstraction prometteuse afin de factoriser les principales difficultés partagées par ces tâches, de fournir des méthodes dépassant les performances de l'état de l'art sur les tâches existantes et d'aborder de nouveaux problèmes où la reconstruction de données manquantes a été un défi trop difficile jusqu'ici. Le projet MAD se concentre sur l'inpainting audio pour toute tâche impliquant des données audio manquantes.

Les principaux objectifs sont : a) le déploiement du concept d'inpainting audio à travers la communauté scientifique via la proposition de nouvelles approches, via l'étude de nouveaux problèmes et via la création et l'animation d'un réseau scientifique dédié ; b) le lancement de travaux novateurs pour l'inpainting temps-fréquence, c'est-à-dire la reconstruction de coefficients manquants dans un domaine transformé ; c) le renforcement du concept d'inpainting audio et des techniques associées en développant des connexions avec l'apprentissage automatique.

Aperçu de l'approche
Le projet établit des relations fortes entre traitement du signal et apprentissage automatique. Elles ne consistent pas seulement à appliquer les techniques d'apprentissage à des signaux mais vise aussi à reformuler les problèmes de traitement de signal d'un point de vue de l'apprentissage et à intégrer la dimension computatiomnelle sous forme de compromis dans les algorithmes. Le projet établit également des liens entre traitement des sons et des images. Il implique des interactions fortes entre théorie et applications. Ces aspects originaux se retrouvent dans la composition de l'équipe et visent à fournir des approches puissantes pour des applications réelles.

Résultats

Voir publications

Perspectives

À venir.

Productions scientifiques et brevets

Les publications du projet sont disponibles sur le site http://mad.lif.univ-mrs.fr/wp/?page_id=6

Partenaires

LIF Laboratoire d'Informatique Fondamentale de Marseille

Aide de l'ANR 198 938 euros
Début et durée du projet scientifique octobre 2014 - 36 mois

Résumé de soumission

Le concept d'inpainting audio, récemment proposé par le coordinateur et ses coauteurs, est une rupture conceptuelle en traitement du signal audio, unifiant dans un même cadre les problèmes de données audio manquantes tels que la suppression de clics, la restauration de CD abîmés, le declipping, la reconstruction pour la perte de paquets, la reconstruction de source dans le domaine temps-fréquence et l'extension de spectre. Alors que ces tâches ont été étudiées séparément par le passé, la formulation unifiée d'inpainting audio est une abstraction prometteuse afin de factoriser les principales difficultés partagées par ces tâches, de fournir des méthodes dépassant les performances de l'état de l'art sur les tâches existantes et d'aborder de nouveaux problèmes où la reconstruction de données manquantes a été un défi trop difficile jusqu'ici. Le projet MAD développe l'inpainting audio pour toute tâche impliquant des données audio manquantes.

Les principaux objectifs sont : a) le déploiement du concept d'inpainting audio à travers la communauté scientifique via la proposition de nouvelles approches, via l'étude de nouveaux problèmes et via la création et l'animation d'un réseau scientifique dédié ; b) le lancement de travaux novateurs pour l'inpainting temps-fréquence, c'est-à-dire la reconstruction de coefficients manquants dans un domaine transformé ; d) le renforcement du concept d'inpainting audio et des techniques associées en développant des connexions avec l'apprentissage automatique.

Le projet établit des relations fortes entre traitement du signal et apprentissage automatique. Elles ne consistent pas seulement à appliquer les techniques d'apprentissage à des signaux mais vise aussi à reformuler les problèmes de traitement de signal du point de vue de l'apprentissage et à intégrer la dimension computatiomnelle sous forme de compromis coût/précision dans les algorithmes. Le projet établit également des liens entre traitement des sons et des images. Il implique des interactions fortes entre théorie et applications avec des relations top/down aussi bien que bottom/up. Ces aspects originaux se retrouvent dans la composition de l'équipe et visent à fournir des approches puissantes pour des applications réelles.

La proposition MAD est soumise dans le cadre du programme ANR JCJC sous la direction de Valentin Emiya et constitue le plus vaste projet que celui-ci ait coordonné. Afin de couvrir ses objectifs ambitieux et variés, MAD implique une équipe étendue, composée de onze membres, rassemblant une solide expérience de recherche théorique et finalisée, académique et industrielle, en traitement du signal et apprentissage automatique. Sept membres de l'équipe sont localisés sur le même site, les quatre membres restants étant répartis sur trois autres sites, dont deux membres de Technicolor.

 

Programme ANR : Fondements du numérique (DS0705) 2014

Référence projet : ANR-14-CE27-0002

Coordinateur du projet :
Monsieur Valentin Emiya (Laboratoire d'Informatique Fondamentale de Marseille)

Site internet du projet : http://mad.lif.univ-mrs.fr/

 

Revenir à la page précédente

 

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.