Vous êtes ici

De l’intérêt des modèles grammaticaux pour la reconnaissance de motifs dans les séquences génomiques

Résumé : Cette thèse en bioinformatique étudie l’intérêt de rechercher des motifs dans des séquences génomiques à l’aide de grammaires.

 

Depuis les années 80, à l’initiative notamment de David Searls, des travaux ont montré qu’en théorie des grammaires de haut niveau offrent suffisamment d’expressivité pour permettre la description de motifs biologiques complexes, notamment par le biais d’une nouvelle classe de grammaire dédiée à la biologie : les grammaires à variables de chaîne (SVG, String Variable Grammar).
Ce formalisme a notamment donné lieu à Logol, qui est un langage grammatical et un outil d’analyse développé dans l’équipe Dyliss où a lieu cette thèse. Logol est un langage conçu pour être suffisamment flexible pour se plier à une large gamme de motifs qu’il est possible de rencontrer en biologie. Le fait que les grammaires restent inutilisée pour la reconnaissance de motifs pose question. Le formalisme grammatical est-il vraiment pertinent pour modéliser des motifs biologiques ?
Cette thèse tente de répondre à cette question à travers une démarche exploratoire. Ainsi, nous étudions la pertinence d’utiliser les modèles grammaticaux, via Logol, sur six applications différentes de reconnaissance de motifs sur des génomes.

Orateur: 
Aymeric ANTOINE-LORQUIN
Date: 
Jeudi, 1. décembre 2016 - 14:00 - 19:00
Lieu: 
Salle Métivier
Type soutenance: 
Composition du Jury: 

 

* Hélène Touzet Directrice de Recherche au CNRS / Rapporteure

* Jacques van Helden Professeur à l’Université d’Aix-Marseille / Rapporteur

* Yves Bigot Directeur de recherche au CNRS / Examinateur

* Olivier Ridoux Professeur à l’Université de Rennes 1 / Examinateur

* Anne Siegel Directrice de recherche au CNRS / Directrice de thèse

* Catherine Belleannée Maître de conférence à l’Université de Rennes 1 / Co-directrice de thèse