Utilisation de connaissances ontologiques dans la liaison de contenus et de données appliquées au journalisme de données

Type de soutenance
Thèse
Date de début
Date de fin
Lieu
IRISA Rennes
Salle
Aurigny
Orateur
Cheikh Brahim EL VAIGH (Linkmedia)
Sujet
Cette thèse s’intéresse à la création de liens entre contenus textuels et bases de connaissances ontologiques (BC). Elle fait appel à plusieurs domaines de recherche : le traitement automatique des langues, la recherche d’information et le web sémantique, notamment l’utilisation de BC fondées sur le modèle RDF.
 
Nous proposons d’une part d’étudier le liage d’entités collectif qui cherche à relier simultanément les mentions d’entités présentes dans un texte aux entités d’une BC.
 
Notre contribution porte sur la définition de mesures sémantiques bien fondées qui exploitent les propriétés des BC pour améliorer l’état de l’art, et permettent d’introduire du raisonnement.
D’autre part, nous nous intéressons à l’alignement de différentes BC, moyennant des approches de plongement des bases dans des espaces de grandes dimensions.
Cet alignement permet l’enrichissement des BC, et indirectement l’amélioration du liage d’entités collectif. Pour ce faire, nous proposons un nouveau critère qui se fonde sur l’alignement des dimensions des espaces de plongement des BC, et permet de résister à un alignement a priori bruité entre les BC, voire de supprimer ce besoin d’alignement manuel.
Composition du jury
Dir. de thèse :
Guillaume GRAVIER Directeur de recherche au CNRS / IRISA
Co-dir. de thèse :
François GOASDOUÉ Professeur à l’Université de Rennes 1 / IRISA
Pascale SÉBILLOT Professeur à l’INSA Rennes / IRISA
Examinateurs :
Peggy CELLIER Maître de conférences à l’INSA Rennes / IRISA
Amedeo NAPOLI Directeur de recherche au CNRS / LORIA
Nathalie PERNELLE Professeur à l’Université Sorbonne Paris Nord / LIPN
Sophie ROSSET Directeur de recherche au CNRS / LIMSI
Xavier TANNIER Professeur à Sorbonne Université / LIMICS