Du traitement des langues en recherche d’information et vice versa

Defense type
HDR
Starting date
Room
IRISA Rennes, Salle Metivier
Speaker
Vincent Claveau (Linkmedia)
Theme

La recherche d'information (RI) et le traitement automatique des langues (TAL) sont deux domaines de recherche de l'informatique partageant en commun leur matériau premier : la langue. Pourtant, ces deux domaines ont longtemps évolué indépendamment, avec peu d'interactions. Au travers d'une sélection de nos travaux passés, nous montrons pourtant tous les bénéfices à croiser les connaissances acquises dans chacun de ces domaines. Précisément, nous avons articulé ce mémoire en deux parties, l'une dédiée aux apports du TAL pour la RI, et l'autre aux apports de la RI pour le TAL. Nous revisitons ainsi plusieurs de nos contributions sur, d'une part, la morphologie, la translittération, la segmentation thématique, l'analyse fine de termes médicaux dans un contexte de RI, et d'autre part, sur l'utilisation des moteurs de recherche comme classifieurs, les tâches de RI comme techniques d'évaluation de techniques de TAL, la sémantique distributionnelle et les plongements de mots par et pour la RI.
Nous discutons également de la pertinence de cette dichotomie entre ces deux domaines à l'heure de l'intelligence artificielle, et de la convergence de leur corpus technique (notamment les approches neuronales) ; nous présentons enfin quelques enjeux de recherche à la croisée de ces domaines.

Composition of the jury
Catherine Berrut, Professeur des universités, Univ. Grenoble, France
Philippe Langlais, Professeur titulaire, Univ. de Montréal, Canada
Jacques Savoy, Professeur titulaire, Univ. Neuchâtel, Suisse
Adeline Nazarenko, Professeur des universités, Univ. Paris-Nord
Patrice Bellot, Professeur des universités, Univ. Aix-Marseille
Olivier Dameron, Maı̂tre de conférences, Univ. Rennes 1