L'Agence nationale de la recherche Des projets pour la science

Translate this page in english

JCJC : Sciences de l'information, de la matière et de l'ingénierie : Sciences de l’information, simulation (JCJC SIMI 2) 2010
Projet HiCoRe

Representations Hierarchiques Compositionelles pour la Vision par Ordinateur

En dépit des avancées realisees lors de la dernière décennie, la reconnaissance
d’objets déformables à partir de différentes vues reste un problème
largement ouvert. Le problème de reconnaissance inclut les tâches
suivantes : dire si un objet d’une catégorie particulière, telle qu’un
visage ou une voiture, est contenu dans l’image, préciser sa position,
détourer la région de l’image le contenant et estimer sa pose et la
pose de ses parties. Peu de méthodes s’attachent à tous ces aspects,
tandis que le problème de leur réalisation simultanée pour des
centaines ou des milliers de catégories, ce que font les êtres
humains, n’a pas été abordés du tout.

Notre but dans ce projet est d’introduire une approche hiérarchique et
probabiliste pour la “vision haut-niveau”, en développant les
représentations d’objets et d’images appropriées. Notre objectif est
la polyvalence, i.e. la construction de modèles pouvant assurer
plusieurs tâches, et la « scalabilité », i.e. proposer une approche
pouvant s’appliquer la reconnaissance automatique à grande échelle.

Nous proposons d’utiliser les Hierachical Compositional
Representations (HCR), qui tiennent compte de la nature hiérarchique
des objets visuels en les modélisant de manière récursive : à chaque
niveau hiérarchique, les structures sont obtenues par une combinaison
probabiliste des structures du niveau inférieur ; au plus bas niveau,
ces structures modélisent l’image elle-même.

Correctement développés, les HCR satisfont à la fois l’exigence de
polyvalence et de scalabilité : leur nature hiérarchique leur permet
de résoudre un grand nombre de problèmes en vision. En effet, leurs
niveaux les moins détaillés correspondent à l’information au niveau de
l’image et peuvent ainsi réaliser une tâche segmentation. A l’opposé,
les hautes échelles peuvent être construites à des niveaux
d’abstraction permettant la modélisation complète de catégories
d’objets, au lieu de simples instances de ces objets, afin de réaliser
les tâches de reconnaissance.

Dans le même temps, la modélisation récursive des HCR permet le
partage entre plusieurs objets de certaines de leurs parties à une
échelle donnée. Un tel partage de composantes peu amener à des
algorithmes de détection dont la complexité est sub-linéaire en le
nombre d’objets considérés.

Nous souhaitons donc développer une approche similaire à celle ayant
mené aux systèmes de reconnaissance de parole à grande échelle :
extraction de représentations génériques bas-niveau, recherche d’un
ensemble réduit de composantes communes aux niveaux intermédiaires et
apprentissage pour les combiner de manière probabiliste au sein de
structures haut-niveau.

Nous allons aborder tous les aspects de ce problème, dont ceux du
développement de représentations appropriées de niveaux
intermédiaires, de l’apprentissage de modèles hiérarchiques et de la
détection d’objets dans les images. Nous mettrons l’accent sur les
techniques garantissant l’efficacité et la scalabilité de notre
système. Parmi ces techniques, nous verrons les représentations de
niveaux intermédiaires, fondées sur des chaines de caractères, qui
seront exploitées durant les étapes d’inférence et d’apprentissage.
Nous présenterons également des algorithmes efficaces d’inférence,
reposant sur une optimisation combinatoire, et des techniques de
machine learning pouvant s’appliquer à des représentations
hiérarchiques.

Ainsi, nous prétendons développer un système capable de reconnaître
efficacement et simultanément plusieurs catégories d’objets, tout en
nécessitant peu d’images d’apprentissage.

Partenaires

ECP ECOLE CENTRALE DES ARTS ET MANUFACTURES DE PARIS

Aide de l'ANR 163 680 euros
Début et durée du projet scientifique - 48 mois

 

Programme ANR : JCJC : Sciences de l'information, de la matière et de l'ingénierie : Sciences de l’information, simulation (JCJC SIMI 2) 2010

Référence projet : ANR-10-JCJC-0205

Coordinateur du projet :
Monsieur Iason KOKKINOS (ECOLE CENTRALE DES ARTS ET MANUFACTURES DE PARIS)
Iasonas.kokkinos@nullecp.fr

 

Revenir à la page précédente

 

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.