Équipe de recherche TEXMEX
Techniques d'exploitation des documents multimédias
Exploration, indexation, navigation et recherche dans de très grandes bases

Sujet de thèse de doctorat - Début à l'automne 2011

Systèmes de recherche d'information multimédia à base de logique floue

Mots clés

recherche d'information, multimédia, logique floue

Environnement

La recherche d'information (RI) dans des documents textuels, comme celle effectuée par les moteurs de recherche sur le web (par exemple Google, Yahoo, Exalead...), se fait en deux grandes étapes. La première étape consiste à représenter (indexer) les documents à l'aide de descripteurs (par exemple des mots, éventuellement transformés et pondérés). La deuxième étape consiste à comparer la requête de l'utilisateur (elle aussi indexée) aux descriptions des documents, et à attribuer un score à chaque document. La réponse du système est (le début de) la liste ordonnée des documents, du score le plus élevé au plus faible.

En simplifiant, un document est jugé pertinent s'il contient les mots de la requête, donc si la requête "implique" le document. Lorsque les descripteurs du document et de la requête sont pondérés, cet opérateur d'implication n'est plus booléen. D'où l'idée d'exploiter les bases théoriques de la logique floue (LF), extension de la logique classique, qui prend les valeurs de vérité dans tout l'intervalle réel [0,1]. Les fondements mathématiques de la logique floue apportent alors un cadre théorique clair aux systèmes qui, en RI, sont souvent ad hoc.

Suite à cette idée, un moteur de RI flou a été développé dans l'équipe Texmex. Il a été testé et validé dans le cas de la RI textuelle. Les premiers résultats expérimentaux ont souligné le grand potentiel de cette nouvelle approche théorique. La logique floue semble ainsi tout à la fois : 1) apporter d'excellents résultats expérimentaux, 2) offrir une assise théorique solide souvent absente des travaux en RI, et 3) permettre une meilleure interaction avec l'utilisateur grâce aux opérateurs de logique floue qu'il est possible d'utiliser dans les requêtes.

Missions

Dans un premier temps, l'étudiant travaillera dans un cadre de recherche d'information textuelle. Il sera amené à explorer différentes pistes proposées, et encouragé à en développer de nouvelles. Les liens entre cette modélisation en logique floue des systèmes de RI et les modèles existants (modèles vectoriels, modèles de langues, modèles probabilistes...) pourront notamment être explorés, de même que l'utilisation d'opérateurs flous dans les requêtes (ET/OU flous pour la représentation de requêtes complexes, opérateurs d'anti-division pour les requêtes négatives...).

Dans un deuxième temps, une extension de ces travaux aux problématiques de la recherche d'information multimédia devra être menée. Nous souhaitons en particulier étendre notre moteur de RI au cas de la recherche d'images. La recherche par similarité sur les images est souvent basée sur la notion de "mots visuels" (petites portions caractéristiques de l'image). Dans ce contexte, une image requête contient un nombre de mots comparable aux images recherchés, alors qu'en recherche textuelle, les requêtes contiennent très peu de mots par rapport aux textes cibles. Cette différence, qui peut avoir une grande influence sur notre approche par logique floue, devra être étudiée.

Enfin, l'étudiant devra étudier l'extension du moteur à la recherche d'informations multimodales. Les connaissances développées de longue date en logique floue sur la représentation de données complexes et leur agrégation devront permettre de manipuler ces données multimédia (par exemple de la vidéo) comme un tout et non plus media par media. Le système de RI visé devra donc là encore allier une bonne assise théorique, d'excellentes performances en pratique et permettre une interaction naturelle avec l'utilisateur.

Aucune connaissance préalable en logique floue ou en recherche d'information n'est requise pour effectuer ce sujet de thèse, mais le candidat devra savoir allier travail théorique (définition, justification des mécanismes à mettre en oeuvre) et pratique (programmation, expérimentations, évaluation sur des données réelles).

La thèse se déroulera au sein de l'équipe Texmex à l'IRISA Rennes ; des rencontres régulières seront organisées avec l'équipe Pilgrim à l'IRISA à Lannion.

Bibliographie

Encadrement