Équipe de recherche TEXMEX
Techniques d'exploitation des documents multimédias
Exploration, indexation, navigation et recherche dans de très grandes bases

Sujet de thèse 2010

Description Vidéo

Environnement

La thèse se déroulera au sein de l'équipe-projet Texmex. Le candidat sera intégré dans un environnement confortable et stimulant.

Description

Nous considérons le problème de la représentation et la reconnaissance de vidéos. Ce problème reçoit une attention grandissante, en raison de l'émergence des appareils de capture numériques, -appareils photos et caméras-, et de la production résultante de grandes bases de vidéos personnelles et industrielles.

L'objective de la thèse est d'améliorer la représentation des vidéos, afin d'obtenir une capacité de reconnaissance maximale pour plusieurs applications, en particulier la détection de copies et l'interprétation de vidéos. Un autre objectif (contradictoire) est d'obtenir une complexité réduite pour l'indexation et la recherche, ce qui nécessite de mettre au point des représentations à la fois compactes et discriminantes.

À cette fin, le doctorant étudiera différentes étapes de la chaîne de description et d'indexation de vidéos. En premier lieu, comment convertir au mieux le signal en une représentation vectorielle, ou un ensemble, ou une séquence, de représentations vectorielles ? De nombreuses approches existent [1,2,3,4], en particulier la représentation par sac-de-mots et ses dérivés [1,3,4]. Cependant, elles traitent, en essence, la vidéo comme une suite d'images, et les extensions temporelles, par exemple [4], ne sont pas satisfaisantes. En second lieu, sur les traces d'une thèse récente effectuée dans l'équipe-projet Texmex, l'étudiant investigera la manière de comparer efficacement des représentations temporelles.

Mots-clés

Description et recherche de vidéo, vision par ordinateur, multimédia, indexation multi-dimensionnelle

Références

  1. Video Google : A Text Retrieval Approach to Ob ject Matching in Videos. J. Sivic and A. Zisserman. International Conference on Computer Vision, 2003
  2. Content-Based Copy Detection using Distortion-Based Probabilistic Similarity Search. A. Joly, O. Buisson and C. Frelicot. IEEE Transactions on Multimedia, 2007
  3. An image-based approach to video copy detection with spatio-temporal filtering. M. Douze, H. Jegou and C. Schmid. to appear in IEEE Transactions on Multimedia
  4. On Space-Time Interest Points. I. Laptev. International Journal on Computer Vision, 2005

Encadrement