Directeur de recherche INRIA.
Responsable scientifique de l'équipe TEXMEX.
INRIA
Campus de Beaulieu
35042 RENNES Cedex
France
tél : 02 99 84 74 28
fax : 02 99 84 71 71
mél. Patrick.Gros [at] inria.fr
Assistant : Loïc Lesage, 02 99 84 74 37, Loic.Lesage [at] inria.fr
J'ai effectué ma thèse dans l'équipe MOVI sous la direction de de Roger Mohr, équipe commune au laboratoire GRAVIR de l'IMAG à Grenoble et à l'INRIA Rhône - Alpes, ceci de 1990 à 1993. Je suis ensuite resté dans cette même équipe comme chercheur CNRS de 1993 à 1999. En 1996/1997, j'ai passé un an comme chercheur invité au centre de vision de l'Institut de robotique de l'Université Carnegie Mellon à Pittsburgh, Pennsylvanie, aux États Unis. Je suis habilité à diriger des recherches depuis décembre 1998. De juillet 1999 à décembre 2001, j'ai travaillé au sein du projet VISTA de l'IRISA à Rennes. Depuis le 1er janvier 2002, je suis responsable de l'équipe TEXMEX de l'IRISA. Depuis le 1er septembre 2006, je suis directeur de recherche à l'INRIA.
Au sein du centre INRIA de Rennes - Bretagne Atlantique :
- je suis vice-président du comité des projets (instance scientifique du centre),
- je suis président de la commission du personnel scientifique non permanent,
- je suis membre de l'équipe de direction du centre
- je suis membre du comité de centre et de son bureau.
Je représente le centre :
- au conseil scientifique de l'université européenne de Bretagne.
Au sein de l'INRIA :
- je suis membre suppléant nommé de la commission d'évaluation
Je travaille sur la description d'images compressées sans décompression de celles-ci. Pour cela, nous utilisons des transformations de la famille ondelettes. La difficulté est de concilier le besoin de représentations critiques en compression et la n'ecessité de représentation redondantes pour la description. Ce travail a fait l'objet de la thèse de Francois Tonnin.
Je travaille aussi sur la gestion des descripteurs en très grand nombre. Ces recherches portent en particulier sur les algorithmes de recherche de plus proches voisins ou de recherche `a epsilon dans des espaces de grande dimension, lorsque l'on dispose de centaines de millions de descripteurs. Ces travaux ont fait l'objet de la thèse de Sid-Ahmed Berrani et celui de notre collaboration avec l'université de Reykjavik.
Pour ce travail, nous avons rassemblé une collection de plus d'un million d'images fixes, qui représente plus d'un milliard de descripteurs locaux de ces images. Cette base va être utilisée pour mettre au point, en collaboration avec l'université de British Columbia à Vancouver, un test de comparaison des algorithmes d'indexation et de recherche rapide dans les espaces de grande dimension.
Comment décrire des documents contenant plusieurs médias (images, son, parole, texte) en tenant compte de toutes ces modalités ? Avec la collaboration de Guillaume Gravier de l'équipe METISS et du centre de recherche Thomson de Rennes, nous travaillons sur les modèles stochastiques qui permettent une telle description. Après l'étude des modèles de Markov cahés hiérarchiques dans la thèse d'Ewa Kijak, nous avons étudié les modèles segmentaux lors de la thèse de Manolis Delakis et nous débutons celles des réseaux bayésiens dynamiques avec la thèse de Siwar Baghdadi. Notre domaine d'application privilégié est celui des vidéos de sport, de tennis en particulier.
En ce qui concerne la description de très ongues vidéos, nous nous intéressons, avec Xavier NATUREL, à la mise à jour automatique de guide de programmes de télévision. Ceux-ci sont inexacts et imprécis (tout n'est pas décrit, les horaires ne sont pas respectés, des émissions sont supprimées et remplacées...) À partir de l'observation du flux et d'un guide de départ, nous calculons un guide exact.
Jusqu'à présent, a parole et le texte ne sont pas bien pris en compte dans nos travaux : leur information est de nature très différente de celle des images ou des sons. Avec Vincent CLAVEAU, nous avons rassemblé une collection de plusieurs milliers de dépêches contenant chacune une ou plusieurs images et du texte. Le but est alors d'utiliser conjointement les images et les textes. Dans un deuxième temps, nous visons à étendre ce travail à la vidéo.
|
Étudiants en thèse (co-encadrants) Julien FAYOLLE (F. Moreau, C. Raymond) Thanh Toan DO (L. Amsaleg, T. Furon, E. Kijak) Gylfi GUDMUNDSSON (L. Amsaleg) Mihir JAIN (H. Jégou) Cédric PENET, (Technicolor : C.H. Demarty, G. Gravier) |
Anciens thésards Bart LAMIROY, maître de conférences, Institut national polytechnique de Lorraine Sylvaine PICARD Ewa KIJAK, maître de conférence, université de Rennes 1 Sid-Ahmed BERRANI, chercheur, Orange Labs, Cesson-Sévigné, Rennes Anthony REMAZEILLES, chercheur, Fatronik François TONNIN, professeur de mathématiques Manolis DELAKIS, ingénieur, Anevia Xavier NATUREL, consulatant en logiciel et vision par ordinateur, Intitek Nguyen Khang PHAM, maître de conférence, université de Cantho, Vietnam Siwar BAGHDADI, ingénieur chez Artimia Gaël MANSON, ingénieur, Twenga Pierre TIRILLY, post-doctorant, université de Milwaukee, USA Romain TAVENARD, post-doctorant, IDIAP, Suisse |