Michel Dutat, Ivan Magrin-Chagnolleau, and Frédéric Bimbot.
Analyse en composantes principales temps-fréquence :
application à la reconnaissance de la langue.
Proceedings of JEP 2000, Aussois, France, June 2000.

Résumé: Une grande variété d'analyses paramétriques du signal de parole
a été utilisée en reconnaissance de la langue par modélisation acoustique.
Les meilleurs résultats sont généralement obtenus en incorporant
l'information dynamique du signal par le biais d'approximations de la
dérivée et de la dérivée seconde (les coefficients delta et delta-delta).
Dans cette étude, nous abordons une nouvelle paramétrisation qui prend
également en compte l'aspect dynamique du signal. Cependant, cette méthode
opère sur le signal une sélection à la fois temporelle et fréquentielle
du matériel acoustique et ceci en fonction de la langue. Cette sélection
est réalisée par des filtres temps-fréquence dont les coefficients sont
calculés à partir du corpus d'apprentissage de la langue considérée. On
fait l'hypothèse qu'un énoncé ainsi filtré est mieux représenté lorsque
le filtre qui lui est appliqué est celui correspondant à sa langue. Cette
approche rend plus optimal la paramétrisation et améliore ainsi le taux de
reconnaissance par rapport à celui obtenu avec une paramétrisation classique.