Logiciel MD-Shots de découpage d'une vidéo en plans
Le logiciel MD-shots, pour ``Motion-based Detection of shots'', de découpage d'une vidéo en plans élémentaires a été développé en langages C-ANSI et C++. Préalablement à une indexation des informations contenues dans une vidéo, il est nécessaire de bâtir une représentation temporelle structurée de cette vidéo, correspondant au découpage en plans élémentaires. Il s'agit de détecter les ``cuts'' et les transitions progressives marquant les changements de plans. Par transition progressive, on entend des effets spéciaux comme le fondu, le fondu enchaîné, le volet,...

La méthode proposée pour réaliser le découpage de la vidéo en plans élémentaires [1] s'appuie sur la cohérence temporelle au sein d'un même plan d'une information liée au mouvement global dominant entre deux images successives (Fig. 1). Ce dernier , représenté par un modèle paramétrique 2D, est estimé à l'aide du logiciel Motion-2D [2]. Nous nous intéressons en fait à l'évolution temporelle de la taille normalisée du support associé au mouvement dominant estimé. Lors d'un ``cut'', aucun modèle de mouvement ne peut correctement décrire la transformation entre ces deux images, ce qui entraîne une chute soudaine de cette valeur. Lors de transitions progressives, cette chute est moins nette mais plus prolongée. Cette détection de sauts est réalisée à l'aide d'un test de Hinkley, dont l'implantation est simple et efficace. Un atout original de la méthode est d'appréhender la détection des différentes transitions selon le même schéma qui ne comprend qu'un seul paramètre à fixer par l'utilisateur. Une même valeur de ce paramètre est de plus utilisée pour les deux types de transitions traitées.

Pour agir directement sur la cadence de traitement du logiciel, il est possible de spécifier le premier et le dernier niveau considérés dans les pyramides d'images multi-résolutions utilisées. Il est également possible de retenir un sous-échantillonnage temporel de la séquence à traiter. Selon les options retenues, le logiciel atteint actuellement des cadences de traitement comprises entre 0,6 Hz et 2,6 Hz sur station Ultra-Creator à 300 MHz. Ce logiciel a été déposé à l'APP. Il a fait l'objet d'une mise à disposition auprès de Alcatel-CRC et de l'Ina. D'autre part, un contrat de licence d'exploitation commerciale a été conclu avec la société Arts Vidéo Interactive (insertion dans le produit commercialisé MOVIDEO-2 STUDIO).
 
 

Evolution de la variable zeta et plans détectés
Figure 1: Découpage en plans de la vidéo ``Ajax'' (fournie par l'Ina) : (a) Le graphique montre l'évolution temporelle de la taille normalisée du support d'estimation du mouvement dominant. Les bandeaux permettent de comparer les détections obtenues à une vérité-terrain déterminée manuellement. (b) Chaque plan détecté est représenté par une imagette dans le tableau du bas.

 
Références 
[1] P. Bouthemy, M. Gelgon, F. Ganansia. A unified approach to shot change detection and camera motion characterization.   Publication interne no 1148, Irisa, dovembre 1997, http://www.irisa.fr/bibli/publi/pi/1997/1148/1148.html, version révisée à paraître dans IEEE Trans. on Circuits and Systems for Video Technology, décembre 1999.

[2] J.-M. Odobez, P. Bouthemy. Robust multiresolution estimation of parametric motion models.  Journal of Visual Communication and Image Representation, 6(4):348-365, décembre 1995.
 


Webmaster : vista_webmaster@irisa.fr
Last modified: Wed Jul 16 14:30:34 MET DST 2003
Logo Vista Logo Irisa