accueil

carte
animles activités scientifiques 
-
recherche

aide
 

formation par la recherche / formation doctorale / enseignement, stages / sujets de thèses

-

Sujet de thèse proposé à l'Irisa pour la rentrée 2000-2001

-image
 

Introduction de la connaissance a priori
en reconnaissance de formules mathématiques

Localisation :Irisa, Rennes

Equipe Imadoc (IMAges et DOCuments)

Responsable : Jean CAMILLERAPP, Bertrand COüASNON (tél. direct : 02 99 28 66 40, email : couasnon@irisa.fr)

Mot-clés : Reconnaissance de documents, analyse structurelle, gestion des connaissances a priori, segmentation, formules mathématiques.

Sujet : Dans le domaine de la reconnaissance de documents, la reconnaissance de formules mathématiques a déjà fait l'objet de nombreuses études. Cependant, selon la littérature, certaines difficultés ne sont toujours pas résolues : caractères se touchant, petits symboles...

Les résultats actuels sont insuffisants dans le cadre d'une utilisation industrielle. Il est en effet nécessaire, d'une part d'obtenir de meilleurs taux de reconnaissance, et d'autre part d'éviter une relecture fastidieuse et coûteuse de l'ensemble des formules. L'objet de cette thèse sera donc d'introduire la connaissance a priori déduite des règles de constitution des formules afin d'améliorer la segmentation (i.e. la reconnaissance) et de permettre au système de détecter avec, une grande certitude, les zones susceptibles d'être mal reconnues.

Ce travail sur l'introduction de la connaissance a priori reprendra et étendra les méthodes développées au sein de l'équipe Imadoc. Il sera nécessaire de définir une formalisation grammaticale des formules mathématiques, ainsi que de déterminer les connaissances sémantiques utiles à une meilleure reconnaissance. Il faudra également définir une méthode de segmentation contextuelle des symboles mathématiques. Cette méthode pourra utiliser un classifieur, développé dans l'équipe Imadoc, capable de rejeter des formes qui ne correspondent pas à des symboles.

Ce travail s'intègre dans la réalisation d'un système complet et générique de reconnaissance de documents structurés pouvant s'adapter à d'autres types de documents.


File translated from TEX by TTH, version 2.25.
On 8 Mar 2000, 15:33.
 

up

dernière mise à jour : 13 mars2000

--english version---webmaster@irisa.fr ---©copyright--


accueil
 

w3c-html4