L'Agence nationale de la recherche Des projets pour la science

Translate this page in english

Le numérique au service des arts, du patrimoine, des industries culturelles et éditoriales (DS0703) 2015
Projet KAMoulox

Démixage en ligne de larges archives sonores

Le projet KAMoulox, d'une durée de 36 mois, vise à développer des techniques de pointe en restauration audio et en démixage, ainsi qu'à les intégrer aux architectures logicielles en license libre qui opèrent les vastes Archives du CNRS - Musée de l'Homme. Le but du projet est donc de rendre disponibles des outils d'édition audio de nouvelle génération à une large audience, qui pourra les utiliser à des fins scientifiques, éducatives et artistiques. L'hypothèse sous-jacente est que de telle possibilités offertes dans l'édition d'enregistrements historiques pourra participer à faire émerger de nouvelles pratiques relatives à notre patrimoine immatériel. Il s'inscrit de ce fait dans la thématique de l'axe 3 : “Le numérique au service des arts, du patrimoine, des industries culturelles et éditoriales”.

D'un point de vue général, KAMoulox comprend des enjeux scientifiques importants dans le domaine du traitement probabiliste du signal, et plus particulièrement sur le sujet de la séparation de sources. Sa spécificité est d'intégrer ces enjeux dans une démarche méthodologique orientée vers une application précise, qui est le transfert de ces méthodes vers un large public. De récentes percées en traitement du signal ont en effet pour la première fois rendu possible des outils d'édition audio qui soient utilisables par un novice en ingénierie du son. Alors que de tels outils sont désormais courants en traitement d'image, le public ne bénéficie pas encore de leurs équivalents en débruitage et édition audio.

La recherche proposée dans ce projet concerne l'exploitation de deux avancées récentes que j'ai grandement contribué à promouvoir. La première porte sur l'utilisation de modèles probabilistes à queues lourdes, dits alpha-harmonisables, en traitement du signal audio. De tels modèles ont la particularité d'offrir une grande robustesse aux opérations de séparation et de restauration. La seconde est l'introduction de modèles flexibles et réalistes pour la modélisation de signaux audios, qui contraste notamment avec les approches paramétriques utilisées dans le domaine. En abordant ces deux thèmes de front, KAMoulox porte les germes de nombreuses contributions au domaine du traitement probabiliste du signal audio.

D'un point de vue applicatif, ce projet va mener au développement d'un serveur de calcul pour la séparation de sources, contrôlé par une application client qui sera utilisable par le grand public. Tous les logiciels produits dans le cadre du projet seront diffusés sous la licence libre Afféro GPL et les programmes implémentés par les chercheurs seront compatibles avec la plateforme logicielle Telemata, en licence libre, qui opère les Archives du CNRS - Musée de l'Homme. Le rajout des fonctionnalités nécessaires dans Telemata fera l'objet d'une prestation de service effectuée par la startup Française qui a développé la plateforme : Parisson. Ces fonctionnalités concernent notamment le protocole d'interaction client-serveur.

Enfin, le projet présente une dimension forte de médiation scientifique. En premier lieu, l'application web d'édition du son, à usage du novice, sera réalisée en collaboration étroite avec ses utilisateurs (des chercheurs en humanités numériques) dans une démarche de conception dite “centrée sur l'utilisateur”. Nous seront assistés dans ce but par des professionnels de l'interaction homme-machine, ainsi que par la prestation d'un développeur web. En deuxième lieu, des contenus pédagogiques de vulgarisation scientifique seront produits, qui permettront de promouvoir les mathématiques appliquées auprès des jeunes générations, ainsi que de susciter l'intérêt du public et des chercheurs en humanités numériques aux nouvelles possibilités qu'ouvre l'édition audio dans leurs pratiques professionnelles, éducatives ou créatives.

Partenaires

INRIA Institut National de Recherche en Informatique et en Automatique

Aide de l'ANR 282 828 euros
Début et durée du projet scientifique octobre 2015 - 36 mois

 

Programme ANR : Le numérique au service des arts, du patrimoine, des industries culturelles et éditoriales (DS0703) 2015

Référence projet : ANR-15-CE38-0003

Coordinateur du projet :
Monsieur Antoine Liutkus (Institut National de Recherche en Informatique et en Automatique)

 

Revenir à la page précédente

 

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.