CONTINT - Contenus numériques et interactions

Apprentissage Adaptatif pour le Crowdsourcing Intelligent et l’Accès à l'Information – ALICIA

Apprentissage Adaptatif pour le Crowdsourcing Intelligent et l’Accès à l'Information

Le but de notre projet est d'étudier des modèles et des algorithmes qui reposent sur des techniques d'apprentissage adaptatif pour améliorer l'efficacité, la performance, le passage à l'échelle des applications centrées utilisateurs.

Dans ce projet, nous nous intéressons à deux familles d'applications centrées sur les utilisateurs : l'accès à l'information et le crowdsourcing intelligent.

Nous assistons à l'émergence d'une pléthore de systèmes, en particulier sur le Web, auxquels les utilisateurs contribuent, dans lesquels ils accèdent à de l'information et l'évaluent, collaborent et interagissent dans des environnements complexes, soit explicitement soit implicitement. Des exemples proéminents de tels systèmes incluent les réseaux sociaux, les plates-formes de blog, de microblog ou de favoris sociaux, les systèmes d'annotations et de notation, les tâches d'évaluations en crowdsourcing ou la publicité en ligne. Quand les utilisateurs interagissent avec ces systèmes, ils laissent des empreintes qui peuvent être exploitées pour développer des applications utiles. Un aspect en commun à ces applications est le besoin de définir, récupérer, et maintenir des profils d'utilisateurs. Ces profils sont la clef du succès des applications et doivent constamment être affinés pour conserver des applications de qualité. Pour l'accès à l'information, par exemple la recherche et la recommandation, des profils de préférences aident à mieux personnaliser le contenu fourni aux utilisateurs comme résultat d'une requête ou comme recommandation. Quand on considère les utilisateurs comme des consommateurs d'information, les applications peuvent ainsi devoir satisfaire des critères variés quant aux préférences sur la pertinence des résultats de requêtes. Pour le crowdsourcing intelligent, comme l'acquisition de donnés et la complétion de micro-tâches, les profils d'utilisateurs aident à mieux affecter des tâches aux utilisateurs ; quand l'on recherche des utilisateurs experts, les niveaux d'expertise peuvent être très divers et difficiles à comprendre. Dans ces scénarios, les préférences et l'expertise des utilisateurs ne peuvent être connues à l'avance; on peut également rarement s'attendre à ce qu'elles soient déclarées explicitement par les utilisateurs de manière fiable ou à ce qu'elles restent stables sur le long terme.

Methodes / Approches

Étant donné le taux de croissance des contenus riches et divers et de la base d'utilisateurs, une approche par apprentissage est inévitable. En s'associant à d'importants fournisseurs d'applications centrées sur les utilisateurs (Xerox – crowdsourcing, Vodkaster – réseau social, évaluation collaborative de films, AlephD – publicité sur le Web personnalisée, recommandation d'images), notre consortium inclut des chercheurs des domaines dans lequel le projet s'inscrit: gestion de données, recherche d'information, apprentissage, algorithmes distribués. Les buts de notre projet sont ambitieux : nous avons l'intention de contribuer au développement de mécanismes d'apprentissage fortement adaptatifs pour des sources et besoins en information dynamiques et fortement contextualisés – des composants clefs des applications sociales et centrées sur les utilisateurs – tout en promouvant la pertinence de l'information, la complétude et la diversité de la manière dont les contenus et les utilisateurs sont sélectionnés en réponse aux besoins. Pour atteindre ce but, nous allons nous concentrer sur des algorithmes d'apprentissage adaptatif qui ont le potentiel de bien se comporter dans les conditions des environnements en ligne, tels que la famille des bandits manchots (multi-armed bandits).

Résultats

We obtained important results in several key areas of the project:

- Models for social data management
- Search in social media
- Crowd-augmented social-aware search
- Movie summarization
- Bandits with multiple plays
- Online nonparametric regression
- Mechanism design for intelligent crowdsourcing
- Adaptive recommender systems
- Adaptive movie recommendation

Perspectives

We are currently investigating several directions from improving the way information needs are handled in social media, based on adaptiveness. On one hand, we strive to learn how to evaluate query relevance based on the social and textual dimensions, in a generic framework that is user-centric but independent of the queries being formulated. On another hand, we strive to understand “query nature”, and to chose the right relevance ingredients for each incoming query. Furthermore, we consider other levels of service in the style of as-you-type-search, with lean more towards the recommendation paradigm. First, in the initial stages of the as-you-type search scenarios, the answers that can be produced are more ameanable to a recommendation approach, since the input query is under-specified. Second, instead of showing actual documents as results, we can also suggest / recommend queries, exploiting also the social dimension of the data; we plan to study these problems both without learning mechanisms and based on an adaptive approach with multi-armed bandits.

Productions scientifiques et brevets

[CIKM’15] Building Representative Composite Items. V. Leroy, E. Gaussier, S. Amer-Yahia, H. Mirisaee, “, CIKM 2015
[CIKM-2’15] A Network-Aware Approach for Searching As-You-Type in Social Media. Paul Lagrée, Bogdan Cautis, Hossein Vahabi. CIKM 2015.
[COLT'15] A Chaining Algorithm for Online Nonparametric Regression. Pierre Gaillard and Sébastien Gerchinovitz. Proceedings of the 28th Conference on Learning Theory (COLT 2015), pp. 764–796, 2015.
[CORIA'15] Algorithmes de bandit pour la recommandation à tirages multiples. Jonathan Louëdec, Max Chevalier, Aurélien Garivier, and Josiane Mothe. 12ème Conférence en Recherche d’Information et Applications, Paris, mars 2015
[ECIR’15] Time-Sensitive Collaborative Filtering through Adaptive Matrix Completion. Julien Gaillard, Jean-Michel Renders ECIR 2015.
[FLAIRS'15] A Multiple-Play Bandit Algorithm Applied to Recommender Systems. Jonathan Louëdec, Max Chevalier, Josiane Mothe, Aurélien Garivier, and Sébastien Gerchinovitz. The 28th International Flairs Conference
[JDS'15] Systèmes de recommandations : algorithmes de bandits et évaluation expérimentale. Jonathan Louëdec, Max Chevalier, Aurélien Garivier, Josiane Mothe. 47èmes Journées de Statistique de la SfdS, Lille, Juin 2015
[PVLDB’15] Worker Skill Estimation in Team-Based Tasks. H. Rahman, S.B. Roy, S. Thirumuruganahan, S. Amer-Yahia, G. Das, VLDB 2015
[UPSud’15] CANTO: Crowd Augmented Network-Aware TOp-k Search. Bogdan Cautis, Soudip Roy Chowdhury, under submission
[VLDBJ’15] Task-Assignment Optimization in Knowledge Intensive Crowdsourcing. S.B. Roy, I. Lykourentzou, S. Thirumuruganahan, S. Amer-Yahia, G. Das, VLDB Journal 2015.
[WWW’15] From Complex Object Retrieval?to Complex Crowdsourcing. S. Amer-Yahia, S.B. Roy, WWW Tutorial 2015

Résumé de soumission

La gestion de données devient de plus en plus centrée sur les utilisateurs, ceux-ci devenant, de purs consommateurs de contenu, des producteurs et juges de contenus. Nous assistons à l'émergence d'une pléthore de systèmes, en particulier sur le Web, auxquels les utilisateurs contribuent, dans lesquels ils accèdent à de l'information et l'évaluent, collaborent et interagissent dans des environnements complexes, soit explicitement soit implicitement. Des exemples proéminents de tels systèmes incluent les réseaux sociaux, les plates-formes de blog, de microblog ou de favoris sociaux, les systèmes d'annotations et de notation, les tâches d'évaluations en crowdsourcing ou la publicité en ligne.
Quand les utilisateurs interagissent avec ces systèmes, ils laissent des empreintes qui peuvent être exploitées pour développer des applications utiles. Dans ce projet, nous nous intéressons à deux familles d'applications centrées sur les utilisateurs : l'accès à l'information et le crowdsourcing intelligent. Un aspect en commun à ces applications est le besoin de définir, récupérer, et maintenir des profils d'utilisateurs. Ces profils sont la clef du succès des applications et doivent constamment être affinés pour conserver des applications de qualité. Pour l'accès à l'information, par exemple la recherche et la recommandation, des profils de préférences aident à mieux personnaliser le contenu fourni aux utilisateurs comme résultat d'une requête ou comme recommandation. Quand on considère les utilisateurs comme des consommateurs d'information, les applications peuvent ainsi devoir satisfaire des critères variés quant aux préférences sur la pertinence des résultats de requêtes. Pour le crowdsourcing intelligent, comme l'acquisition de donnés et la complétion de micro-tâches, les profils d'utilisateurs aident à mieux affecter des tâches aux utilisateurs ; quand l'on recherche des utilisateurs experts, les niveaux d'expertise peuvent être très divers et difficiles à comprendre.
Dans ces scénarios, les préférences et l'expertise des utilisateurs ne peuvent être connues à l'avance; on peut également rarement s'attendre à ce qu'elles soient déclarées explicitement par les utilisateurs de manière fiable ou à ce qu'elles restent stables sur le long terme. Par conséquent, elles doivent être découvertes au fur et à mesure à travers des interactions simples avec les utilisateurs, par une approche bien fondée. Étant donné le taux de croissance des contenus riches et divers et de la base d'utilisateurs, une approche par apprentissage est inévitable. Le but de notre projet est d'étudier des modèles et des algorithmes qui reposent sur des techniques d'apprentissage adaptatif pour améliorer l'efficacité, la performance, le passage à l'échelle des applications centrées utilisateurs.
En s'associant à d'importants fournisseurs d'applications centrées sur les utilisateurs (Skyrock – réseau social, plate-forme de blog, Xerox – crowdsourcing, Vodkaster – réseau social, évaluation collaborative de films, AlephD – publicité sur le Web personnalisée, recommandation d'images), notre consortium inclut des chercheurs des domaines dans lequel le projet s'inscrit: gestion de données, recherche
d'information, apprentissage, algorithmes distribués.
Les buts de notre projet sont ambitieux : nous avons l'intention de contribuer au développement de mécanismes d'apprentissage fortement adaptatifs pour des sources et besoins en information dynamiques et fortement contextualisés – des composants clefs des applications sociales et centrées sur les utilisateurs – tout en promouvant la pertinence de l'information, la complétude et la diversité de la manière dont les contenus et les utilisateurs sont sélectionnés en réponse aux besoins. Pour atteindre ce but, nous allons nous concentrer sur des algorithmes d'apprentissage adaptatif qui ont le potentiel de bien se comporter dans les conditions des environnements en ligne, tels que la famille des bandits manchots (multi-armed bandits).
l

Bogdan Cautis (UNIVERSITE DE PARIS SUD / Laboratoire de Recherche en Informatique)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

PSUD/LRI UNIVERSITE DE PARIS SUD / Laboratoire de Recherche en Informatique
NAVER NAVER France - (Labs Europe)
Vodkaster Vodkaster
AlephD AlephD
LIG Laboratoire d'Informatique de Grenoble
UPS/IMT UNIVERSITE PAUL SABATIER/INSTITUT DE MATHEMATIQUES DE TOULOUSE
XEROX XEROX SAS
Télécom ParisTech Institut Mines Télécom/Télécom ParisTech

Aide de l'ANR 808 318 euros
Début et durée du projet scientifique : janvier 2014 - 42 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.