TEXMEX
Équipe de recherche TEXMEX
Techniques d'exploitation des documents multimédias
Exploration, indexation, navigation et recherche dans de très grandes bases

Présentation

L'explosion de la quantité de documents multimédias numériques a engendré un très fort dynamisme de la recherche dans le domaine de l'indexation multimédia. Cependant, la portée des travaux menés par les spécialistes des médias est limitée par leur aspect monomédia et par la quantité de documents que ces personnes manipulent, quelques milliers d'images par exemple, alors que les applications professionnelles demanderaient d'en manipuler bien plus (quelques millions).

De telles quantités de documents posent des problèmes de structuration et de stockage sur disque, problèmes qui sont hors de l'expertise des spécialistes de médias. à l'inverse, les spécialistes des bases de données, coutumiers de ce problèmes, ne considèrent que des techniques très rudimentaires de description des documents, faute de savoir-faire dans le domaine.

Pour remédier à cela, nous proposons la création d'une équipe réunissant en son sein à la fois des spécialistes des médias et des spécialistes des techniques d'utilisation de ces documents telles les bases de données, la recherche d'information ou les statistiques. L'objectif de l'équipe est donc de se situer à l'intersection des deux axes de travail suivants :

L'originalité de notre approche vient de la prise en compte simultanée des contraintes liées aux médias et aux documents et des contraintes liées à l'exploitation de ces données, qui sont deux aspects d'un même problème. Cette approche pluridisciplinaire doit permettre de dépasser les limites des systèmes actuels et d'arriver à gérer finement et efficacement des quantités de documents très importantes.

Mots-clés : exploration, indexation et recherche par le contenu, grandes bases de données, multimédia.

Axes de recherche

Notre travail s'organise en deux axes de travail que nous appliquons à l'étude de trois problèmes. Les axes de travail sont :

Nous appliquons ces outils à trois problèmes :

  1. la recherche d'images dans de grandes bases d'images ;
  2. la description conjointe texte - image de documents comportant ces deux médias ;
  3. l'ajout de capacités sémantiques aux moteurs de recherche textuels.

Domaines d'application

Collaborations

Soutiens pour la création de l'équipe

Nous avons été soutenus par le ministère de la recherche (programme ACI jeunes chercheurs) et le département STIC du CNRS (programme JemSTIC).

Collaborations internationales

À côté des projets européens cités ci-dessous, nos partenaires principaux sont :

Projets européens

Projets nationaux

Nous participons à de nombreux projets nationaux avec des partenaires académiques et industriels. En ce moment, sont actifs :

Contrats industriels

Nous avons de contacts privilégiés avec la société Thomson sur les outils pour l'indexation de la vidéo, avec l'Institut national de l'audiovisuel, et avec France Télécom R&D.