Équipe de recherche TEXMEX
Techniques d'exploitation des documents multimédias
Exploration, indexation, navigation et recherche dans de très grandes bases

Proposition de post-doctorat - mars 2011

Offre post-doctorale en reconnaissance de la parole. IRISA, Rennes.

Dans le cadre du projet "Attelage de Systèmes Hétérogènes" (ASH), financé par l'ANR, l'IRISA souhaite recruter un chercheur post-doctorant dans le domaine du traitement automatique de la parole. Le thème de recherche principal portera sur les paradigmes de points d'ancrage pour la reconnaissance de la parole grand vocabulaire [1,2,3], avec comme orientation principale le développement de mécanismes bidirectionnels d'interaction entre la détection des points d'ancrage et la transcription de la parole.

Le projet ASH vise à l'élaboration d'approches collaborative pour la reconnaissance de la parole par un couplage étroit entre systèmes de transcription ou entre un système de transcription et des détecteurs de points d'ancrage. Cette idée de couplage (attelage) est une extension du concept de décodage guidé introduit dans [4]. Les partenaires du projet sont le LIUM, le LIA et l'IRISA.

Le post-doctorant aura en charge la conception et la mise en oeuvre de mécanismes d'interaction entre le système de l'IRISA et ceux des autres partenaires. Des mécanismes similaires seront aussi étudiés entre la détection de points d'ancrage et la transcription. Ces travaux se placeront dans le cadre de la campagne d'évaluation à venir ETAPE (ESTER 3).

Le candidat devra posséder une thèse récente en informatique ou en traitement du signal avec une grande expérience en reconnaissance de la parole (de préférence en décodage ou modélisation acoustique) et/ou en traitement et classification de signaux sonores. Il devra démontrer des connaissances théoriques et pratiques en reconnaissance des formes et classification. Les approches statistiques sont au coeur de nos préoccupations mais nous sommes également intéressés par des approches discriminantes, en particulier les réseaux de neurones.

L'IRISA (http://www.irisa.fr) est une unité mixte de recherche, localisée à Rennes. Le candidat sera affilié au CNRS et rejoindra l'équipe TEXMEX, en étroite collaboration avec l'équipe METISS. Le travail sera mené de concert avec un doctorant travaillant sur la reconnaissance de la parole par points d'ancrage, en lien avec les partenaires du projet.

Le poste, d'une durée de 12 mois, éventuellement prolongée de 6 mois, est à pourvoir dès que possible. La rémuneration est de 2500 euros par mois (2040 nets).

Bibliographie

  1. M. Hasegawa-Johnson, S. Borys and K. Chen, Experiments in Landmark-Based Speech Recognition. Sound to Sense: Workshop in Honor of Kenneth N. Stevens, June, 2004.
  2. G. Gravier and D. Moraru. Towards phonetically-driven hidden Markov models: Can we incorporate phonetic landmarks in HMM-based ASR? In Proc. ISCA Tutorial and Research Workshop on Non Linear Speech Processing (NOLISP), 2007.
  3. S. Sainath. Island driven search using broad phonetic classes. IEEE Worskhop on Automatic Speech Recognition and Understanding, 2009.
  4. B. Lecouteux, G. Linarès, Y. Estève, and G. Gravier. Generalized driven decoding for speech recognition system combination. In IEEE Intl. Conf. on Acoustics, Speech and Signal Processing, 2008.

Comment postuler ?

Envoyer CV étendu + lettre de motivation + liste de publications à :