METISS
Modélisation et expérimentation pour le traitement des informations et des signaux sonores
Contexte et objectifs
Projet de l'IRISA commun avec l'INRIA, le CNRS, l'INSA de Rennes, l'université de Rennes 1
Les domaines d'application de Metiss sont centrés sur le signal sonore
et comportent trois volets :
la caractérisation du locuteur (notamment pour la vérification vocale
d'identité), le suivi de locuteur et de classes de sons pour
l'indexation d'enregistrements sonores et le traitement " avancé " de
signaux sonores (par exemple, la séparation de sources dans le cas
sous-déterminé).
Les fondements scientifiques de nos activités s'inscrivent dans le cadre
des mathématiques
appliquées, du traitement du signal, de la modélisation probabiliste, de
l'estimation statistique et de
la théorie de la décision. Nous nous appuyons sur les outils de
traitement de signal au niveau de la
représentation du signal (représentations adaptatives), de sa
paramétrisation (analyse spectrale) et de sa décomposition (séparation
de sources). Les approches probabilistes interviennent au niveau de la
modélisation acoustique (modèles de distribution) et de la
classification (tests d'hypothèses et reconnaissance). Nos travaux font
également appe à des algorithmes de décodage et de poursuite tels que
l'algorithme de Viterbi et le Matching Pursuit.
Les principaux secteurs industriels concernés sont le secteur des
télécommunications, celui de
l'Internet et du multimédia, et sont susceptibles de s'étendre aux
domaines de la production musicale et audiovisuelle et à celui des
logiciels éducatifs et des jeux.
Axes de recherche
- Caractérisation, identification et vérification du locuteur
- Modélisation, détection d'informations et indexation
d'enregistrements audio.
- Séparation de sources et traitement avancé du son.
Relations internationales et industrielles
- Laboratoire d'informatique d'Avignon (LIA), ENST, Lyon II - DDL,
EPFL,... : consortium ELISA (Participation annuelle aux évaluations
NIST en reconnaissance et suivi du locuteur [1997-...]
- l'INA, les sociétés CS-Systèmes d'Information, Arts Vidéo
Interactive et Mémodata, et des équipes de l'IRIT, du CLIP-IMAG, de
l'INT, et du LIP6 : projet RNRT AGIR (développement d'un système
d'indexation audio-visuelle et de recherche par le contenu)
[1998-2001]
- Ibermatica, BBVA, Oberthur, Thalès Communication, et les
laboratoires de l'EPFL, l'IDIAP,Université Carlos III, Université
du Surrey : projet BANCA (vérification du locuteur dans les
transactions bancaires) [1999-2002]
- CP8 (ex-Bull) : Vérification du locuteur sur carte à puce, rapide
et distribuée [1999-2001]
- Thomson MultiMédia, IRCCyn, INA, SFRS : projet RNRT Domus Videum
(Génération de résumés audio-visuels pour les plates-formes
multimédia domestiques [2001-2004].
Dernière modification
22.02.2007 17h20
|
|
Responsable scientifique
Frédéric
Bimbot
+33 2 99 84 75 06
Secrétariat
+33 2 99 84 72 52
À propos de l'équipe
Site web
Rapport d'activité
Thème
Signaux et images numériques
Les projets du même thème
Adresse
IRISA - Campus universitaire de Beaulieu - 35042 Rennes Cedex
|