Équipe de recherche TEXMEX
Techniques d'exploitation des documents multimédias
Exploration, indexation, navigation et recherche dans de très grandes bases

Mise à jour :
22 septembre 2009

Patrick.Gros [at] inria.fr
© Copyright INRIA 2012

Sujet de master 2 recherche en informatique pour l'année 2009 / 2010

Titre : Pour une navigation facile, pertinente et individualisée dans une base de documentaires vidéos

Les progrès dans le traitement des vidéos laissent penser que celles-ci ne seront plus consommées, dans un avenir proche, comme elles le sont actuellement. La tendance est a une consultation qui ne soit plus uniquement linéaire où le seul axe de visualisation est le temps. Plutôt, on peut vouloir visualiser uniquement certaines séquences, où apparaît tel acteur, où est discuté tel thème, où se passe telle ou telle action, et cela dans un ordre non forcément chronologique. L'idée poursuivie est de permettre à un spectateur de définir a tout moment une multitude de centres d'intérêts, d'éventuellement les combiner, de les raffiner, de les modifier, de les organiser, et de permettre ensuite la consultation de vidéos selon ces préférences.

Réaliser un système informatique autorisant cela demande de croiser des expertises en traitement des vidéos et en systèmes d'information. Au sein de l'Irisa, l'équipe TEXMEX possède une longue expertise en matière de vidéos et s'est dotée de nombreux outils de visualisation et d'analyse automatiques structurant une vidéo en scènes, séquences, etc... De manière complémentaire, l'équipe LIS développe des modèles formels pour des systèmes d'information permettant de rechercher, naviguer, structurer de manière extrêmement souple des corpus de données.

Le but du stage est de créer une passerelle entre les expertises de ces deux projets. À partir d'une petite collection de vidéos, probablement de type documentaire, il s'agira d'utiliser les outils de TEXMEX pour tirer des information de structure. Ces informations, souvent d'assez bas niveau, seront enrichies manuellement. Elles seront ensuite injectées dans les outils de LIS, rendant possible recherches, navigations, consultations.

Ce sujet comporte une dimension recherche originale puisque des informations numériques et symboliques devront être combinées de manière inédite, alimentant ainsi une logique de description à concevoir. La partie mise en oeuvre s'appuiera fortement sur un systeme de navigation dans une collection de photos où de nouveaux modules devront être développés pour extraire et représenter les propriétés cibles des vidéos. Idéalement, ce developpement se fera en OCaml, sans que cela soit exclusif, d'autres langages pouvant être utilisés.

Mots-clés

vidéo, accès non linéaire, personalisation, navigation

Référence

Encadrement :