accueil

carte
animles activités scientifiques 
-
recherche

aide
 

formation par la recherche / formation doctorale / enseignement, stages / sujets de thèses

-

Sujet de thèse proposé à l'Irisa pour la rentrée 2000-2001

-image
 

Transformation de questions écrites en requêtes SQLf

Localisation :ENSSAT, Lannion

Equipe CORDIAL et BADINS

Responsable : Laurent MICLET (tél. direct : 02 96 46 66 28, email : miclet@enssat.fr)
Patrick BOSC (tél. direct : 02 96 46 66 45, email : bosc@enssat.fr)

Mot-clés : Apprentissage de transducteurs, traitement de la langue naturelle, interrogation flexible de bases de données.

Sujet : Le projet BADINS a développé (sous le nom de SQLf) une extension du langage SQL d'interrogation des Bases de Données, autorisant la requête à intégrer des paramètres d'imprécision. Par exemple, si ">>" représente le "comparateur graduel" beaucoup plus grand (dont la sémantique est donnée sous la forme de fonction d'appartenance floue), la phrase :
"trouver les jeunes employés dont le salaire est beaucoup plus élevé que celui des autres employés du même département"
s'écrit en SQLf :
select #emp, nom from EMP E where age = jeune and salaire >> all
(select salaire from EMP where #dep = E.#dep and #emp ¹ E.#emp)

Le but de la thèse est l'apprentissage automatique d'un outil de traduction, à partir de corpus de couples (phrase en français, requête SQLf) de même sémantique. Une fois la phase d'apprentissage terminée, une phrase en français pourrait donc être traduite automatiquement en requête SQLf pour interroger la base de données. L'outil de traduction qu'il est envisagé d'apprendre est une forme d'automate fini avec sortie, appelé transducteur. Le travail consistera donc à se familiariser avec la théorie et la pratique de l'apprentissage (ou inférence) des transducteurs, ainsi qu'avec les langages SQL et SQLf. La biliographie sur le passage du texte écrit aux requêtes SQL devra également être faite. Il faudra ensuite construire un corpus d'apprentissage et tester un algorithme existant. Enfin, il s'agira de développer des heuristiques propres à ce problème et de concevoir un algorithme d'apprentissage spécifique. Une question ouverte est si la totalité de SQLf pourra être traitée ainsi, ou s'il faudra définir des sous-ensembles syntaxiques où l'apprentissage sera efficace.


File translated from TEX by TTH, version 2.25.
On 8 Mar 2000, 15:33.
 

up

dernière mise à jour : 13 mars2000

--english version---webmaster@irisa.fr ---©copyright--


accueil
 

w3c-html4