IRISA
Campus de Beaulieu
35042 RENNES Cedex
France
tél : 02 99 84 75 45
fax : 02 99 84 71 71
mél : Stephane.Huet [at] irisa.fr
Assistant : Loïc Lesage, 02 99 84 74 37, Loic.Lesage [at] irisa.fr
Je m'intéresse à l'application des méthodes de traitement
automatique des langues (TAL) aux systèmes de reconnaissance de la
parole. Les méthodes de TAL étant généralement étudiées sur des
corpus écrits, un de mes premiers objectifs est d'analyser le
comportement de ces techniques sur les corpus oraux. Un autre
but est d'utiliser des informations extraites grâce aux
méthodes de TAL pour améliorer les taux de reconnaissance d'un système
de reconnaissance de la parole.
Les données sur lesquelles j'effectue mes travaux sont essentiellement
des transcriptions de bulletins d'informations de radio.
J'ai réalisé ma thèse sous la direction de Pascale Sébillot et Guillaume
Gravier sur l'utilisation des informations morpho-syntaxiques et de l'adaptation
thématique pour améliorer la reconnaissance de la parole. Mes travaux se
sont déroulés au sein de l'équipe TEXMEX,
en collaboration avec l'équipe
METISS de l'IRISA. J'ai également
participé dans le cadre de ma thèse au projet DEMI-TON, en étroite
collaboration avec l'INA.
Les systèmes de reconnaissance automatique de la parole (RAP) produisent des résultats de très bonne qualité lorsque les conditions d'utilisation sont restreintes (dictée vocale, reconnaissance de mots isolés) mais les transcriptions se dégradent lorsque le langage devient plus spontané ou plus diversifié (émission d'information, plateau télévisé, etc.). Une des voies pour améliorer les performances consiste à employer davantage de connaissances linguistiques. Nous nous plaçons dans ce cadre en axant nos travaux sur deux aspects : les informations morpho-syntaxiques en vue de produire des hypothèses plus grammaticales et l'adaptation thématique pour spécialiser les systèmes de RAP à chaque document.
Dans une première partie, nous proposons une nouvelle prise en compte des parties du discours en post-traitement du décodage de la parole. Nous étiquetons pour ce faire des listes d'hypothèses à l'aide d'un analyseur morpho-syntaxique développé pour tenir compte des spécificités des transcriptions. Nos expériences indiquent que cet outil atteint sur ce type de texte de bonne performances. Nous réordonnons ces listes en modifiant le score global employé par le système de RAP pour reconnaître un groupe de souffle, de manière à prendre en compte les informations morpho-syntaxiques. Une amélioration significative du taux d'erreur de mots est obtenue lors d'expériences menées sur des émissions d'information francophones (corpus ), et ce avec trois critères différents de décodage couramment utilisés en RAP. Nous établissons en outre l'intérêt des informations morpho-syntaxiques pour améliorer des mesures de confiance basées sur des probabilités a posteriori.
Dans une seconde partie plus exploratoire, nous nous intéressons à l'adaptation thématique d'un modèle de langage (ML) d'un système de RAP. Nous proposons à cette fin une chaîne de traitements originale qui nous permet de spécialiser de manière fine et non supervisée le système de RAP. Nous découpons dans un premier temps le document étudié en sections thématiquement homogènes. Pour cela, nous développons un nouveau cadre probabiliste pour prendre en compte différentes modalités (cohérence lexicale, indices acoustiques et marqueurs linguistiques) afin de segmenter une transcription selon les sujets abordés et montrons son intérêt pour améliorer la qualité de la segmentation. Nous construisons ensuite des corpus d'adaptation pertinents à partir du Web en utilisant une procédure novatrice. Nous adaptons enfin le ML avec ces corpus spécifiques et montrons que, sur des sections thématiques sélectionnées manuellement, cette méthode permet d'améliorer significativement la modélisation du ML, même si le gain constaté au niveau de la qualité de la transcription est léger.
L'ensemble de ces enseignements représentent 289 heures équivalent TD.
J'ai été moniteur en informatique à l'Université de Rennes 1 entre 2004 et 2007. J'ai ensuite obtenu un demi-poste d'ATER pour l'année universitaire 2007-2008.
J'ai reçu mon diplôme d'ingénieur de l'Institut National des Sciences Appliquées (INSA) de Rennes en 2004 et mon master de recherche à l'Université de Rennes 1 (IFSIC) la même année. J'ai soutenu ma thèse en informatique le 11 décembre 2007 et ai été qualifié en section 27 pour le poste de maître de conférence en janvier 2008.
J'ai réalisé mon stage de DEA dans l'équipe SIMBAD de l'IRISA sur l'étude des signaux myoélectriques pour la commande d'une main artificielle.