Ma photo

Stéphane HUET

ATER
IRISA / Université de Rennes 1
Directeurs de thèse : Guillaume Gravier et Pascale Sébillot

Contact

IRISA
Campus de Beaulieu
35042 RENNES Cedex
France

tél : 02 99 84 75 45
fax : 02 99 84 71 71
mél : Stephane.Huet [at] irisa.fr

Assistant : Loïc Lesage, 02 99 84 74 37, Loic.Lesage [at] irisa.fr


Thèmes de recherche


Activités de recherche

Je m'intéresse à l'application des méthodes de traitement automatique des langues (TAL) aux systèmes de reconnaissance de la parole. Les méthodes de TAL étant généralement étudiées sur des corpus écrits, un de mes premiers objectifs est d'analyser le comportement de ces techniques sur les corpus oraux. Un autre but est d'utiliser des informations extraites grâce aux méthodes de TAL pour améliorer les taux de reconnaissance d'un système de reconnaissance de la parole.
Les données sur lesquelles j'effectue mes travaux sont essentiellement des transcriptions de bulletins d'informations de radio.
J'ai réalisé ma thèse sous la direction de Pascale Sébillot et Guillaume Gravier sur l'utilisation des informations morpho-syntaxiques et de l'adaptation thématique pour améliorer la reconnaissance de la parole. Mes travaux se sont déroulés au sein de l'équipe TEXMEX, en collaboration avec l'équipe METISS de l'IRISA. J'ai également participé dans le cadre de ma thèse au projet DEMI-TON, en étroite collaboration avec l'INA.


Résumé de ma thèse

Les systèmes de reconnaissance automatique de la parole (RAP) produisent des résultats de très bonne qualité lorsque les conditions d'utilisation sont restreintes (dictée vocale, reconnaissance de mots isolés) mais les transcriptions se dégradent lorsque le langage devient plus spontané ou plus diversifié (émission d'information, plateau télévisé, etc.). Une des voies pour améliorer les performances consiste à employer davantage de connaissances linguistiques. Nous nous plaçons dans ce cadre en axant nos travaux sur deux aspects : les informations morpho-syntaxiques en vue de produire des hypothèses plus grammaticales et l'adaptation thématique pour spécialiser les systèmes de RAP à chaque document.

Dans une première partie, nous proposons une nouvelle prise en compte des parties du discours en post-traitement du décodage de la parole. Nous étiquetons pour ce faire des listes d'hypothèses à l'aide d'un analyseur morpho-syntaxique développé pour tenir compte des spécificités des transcriptions. Nos expériences indiquent que cet outil atteint sur ce type de texte de bonne performances. Nous réordonnons ces listes en modifiant le score global employé par le système de RAP pour reconnaître un groupe de souffle, de manière à prendre en compte les informations morpho-syntaxiques. Une amélioration significative du taux d'erreur de mots est obtenue lors d'expériences menées sur des émissions d'information francophones (corpus ), et ce avec trois critères différents de décodage couramment utilisés en RAP. Nous établissons en outre l'intérêt des informations morpho-syntaxiques pour améliorer des mesures de confiance basées sur des probabilités a posteriori.

Dans une seconde partie plus exploratoire, nous nous intéressons à l'adaptation thématique d'un modèle de langage (ML) d'un système de RAP. Nous proposons à cette fin une chaîne de traitements originale qui nous permet de spécialiser de manière fine et non supervisée le système de RAP. Nous découpons dans un premier temps le document étudié en sections thématiquement homogènes. Pour cela, nous développons un nouveau cadre probabiliste pour prendre en compte différentes modalités (cohérence lexicale, indices acoustiques et marqueurs linguistiques) afin de segmenter une transcription selon les sujets abordés et montrons son intérêt pour améliorer la qualité de la segmentation. Nous construisons ensuite des corpus d'adaptation pertinents à partir du Web en utilisant une procédure novatrice. Nous adaptons enfin le ML avec ces corpus spécifiques et montrons que, sur des sections thématiques sélectionnées manuellement, cette méthode permet d'améliorer significativement la modélisation du ML, même si le gain constaté au niveau de la qualité de la transcription est léger.


Publications

Liste complète


Activités d'enseignement

L'ensemble de ces enseignements représentent 289 heures équivalent TD.

J'ai été moniteur en informatique à l'Université de Rennes 1 entre 2004 et 2007. J'ai ensuite obtenu un demi-poste d'ATER pour l'année universitaire 2007-2008.


Courte biographie

J'ai reçu mon diplôme d'ingénieur de l'Institut National des Sciences Appliquées (INSA) de Rennes en 2004 et mon master de recherche à l'Université de Rennes 1 (IFSIC) la même année. J'ai soutenu ma thèse en informatique le 11 décembre 2007 et ai été qualifié en section 27 pour le poste de maître de conférence en janvier 2008.

J'ai réalisé mon stage de DEA dans l'équipe SIMBAD de l'IRISA sur l'étude des signaux myoélectriques pour la commande d'une main artificielle.