Analyser automatiquement les flux de télévision, c'est se donner la possibilité de réutiliser ces flux, et donc de développer de nouveaux services basés sur ces contenus : créer des résumés, des parcours ne suivant pas la stricte séquentialité temporelle des vidéos... Ce dont on a besoin, c'est de retrouver automatiquement la structure du flux : où se trouvent les programmes, les publicités... De manière plus générale, structurer un flux audiovisuel, c'est trouver les éléments structurants de ce flux et les segments qu'ils délimitent, puis caractériser ces segments, par exemple en leur associant une étiquette de genre (bande annonce, reportage, plateau, interview, publicité...).
Une première manière de faire est de définir a priori la structure que l'on recherche en utilisant un modèle, puis de chercher à identifier cette structure dans le flux. Le calcul du modèle nécessite malheureusement l'annotation manuelle de très nombreuses données pour être capable de calculer les paramètres du modèle. On propose donc dans ce stage de partir à l'inverse : chercher quels sont les éléments structurants du flux, et limiter l'intervention de l'utilisateur à l'annotation de classes de tels éléments.
Le stage comportera donc plusieurs aspects :
D'un point de vue classification, l'intérêt du sujet vient du fait que l'on a des données de longueur variable, ce que peut de méthodes savent traiter. Par ailleurs, définir une distance entre de telles données est aussi un problème ouvert. Le stage vide à proposer des algorithmes pour résoudre ces problèmes et à les tester sur des données télévisuelles de grande taille (flux continu de 6 mois).