Du traitement des langues en recherche d’information et vice versa

Type de soutenance
HDR
Date de début
Salle
IRISA Rennes, Salle Metivier
Orateur
Vincent Claveau (Linkmedia)
Département principal
Sujet

La recherche d'information (RI) et le traitement automatique des langues (TAL) sont deux domaines de recherche de l'informatique partageant en commun leur matériau premier : la langue. Pourtant, ces deux domaines ont longtemps évolué indépendamment, avec peu d'interactions. Au travers d'une sélection de nos travaux passés, nous montrons pourtant tous les bénéfices à croiser les connaissances acquises dans chacun de ces domaines. Précisément, nous avons articulé ce mémoire en deux parties, l'une dédiée aux apports du TAL pour la RI, et l'autre aux apports de la RI pour le TAL. Nous revisitons ainsi plusieurs de nos contributions sur, d'une part, la morphologie, la translittération, la segmentation thématique, l'analyse fine de termes médicaux dans un contexte de RI, et d'autre part, sur l'utilisation des moteurs de recherche comme classifieurs, les tâches de RI comme techniques d'évaluation de techniques de TAL, la sémantique distributionnelle et les plongements de mots par et pour la RI.
Nous discutons également de la pertinence de cette dichotomie entre ces deux domaines à l'heure de l'intelligence artificielle, et de la convergence de leur corpus technique (notamment les approches neuronales) ; nous présentons enfin quelques enjeux de recherche à la croisée de ces domaines.

Composition du jury
Catherine Berrut, Professeur des universités, Univ. Grenoble, France
Philippe Langlais, Professeur titulaire, Univ. de Montréal, Canada
Jacques Savoy, Professeur titulaire, Univ. Neuchâtel, Suisse
Adeline Nazarenko, Professeur des universités, Univ. Paris-Nord
Patrice Bellot, Professeur des universités, Univ. Aix-Marseille
Olivier Dameron, Maı̂tre de conférences, Univ. Rennes 1