Identification de souches d’une espèce bactérienne à partir de longues lectures

Defense type
Thesis
Starting date
End date
Location
IRISA Rennes
Room
AMPHITHEATRE G INRIA
Speaker
Grégoire SIEKANIEC (GENSCALE)
Theme

Grégoire SIEKANIEC soutiendra sa thèse intitulée : Identification de souches d’une espèce bactérienne à partir de longues lectures le 10 décembre 2021 à 14h00 dans l'amphithéâtre Inria Rennes
 

Résumé :

Actuellement, l’identification à partir de séquences énomiques de souches d’une espèce bactérienne présentes dans un échantillon reste un processus complexe et chronophage. Cette difficulté provient de la grande similarité génomique entre ces souches. Cependant, pouvoir les différencier rapidement est crucial dans de nombreux domaines, que ce soit en agroalimentaire (comme Streptococcus thermophilus) ou en santé publique. Récemment, la troisième génération de technologies de séquençage, et plus particulièrement les séquenceurs d’Oxford Nanopore Technologies, permettent d’obtenir des séquences longues mais erronées à partir d’échantillons contenant des souches bactériennes. Ces lectures contiennent plus d’informations que les anciennes lectures courtes de seconde génération. Or, actuellement, il existe encore assez peu de logiciels bioinformatiques développés pour identifier les souches bactériennes à partir de longues lectures erronées.
Cette thèse propose donc une nouvelle méthode d’identification de souches bactériennes basée sur l’hypothèse qu’une lecture nanopore est suffisamment longue pour permettre de distinguer une souche (ou un groupe de souches) des autres. Cette méthode utilise une technique d’indexation particulièrement compacte d’une base de données de génomes connus. Elle repose également sur l’utilisation d’une graine espacée afin de rechercher les séquences dans l’index en étant moins sensible aux erreurs des lectures longues. La méthode est implémentée dans un logiciel appelé ORI (Oxford nanopore Reads Identification) qui a montré des résultats robustes d’identification bactérienne sur des données réelles de Streptococcus thermophilus.

Composition of the jury
Rapporteurs :
Hélène Chiapello Ingénieure de recherche, HDR, INRAE, Jouy-en-Josas
David Vallenet Directeur de recherche, LABGeM, CEA, CNRS, Evry

Examinateurs :
Elisa Fromont Professeure des universités, Univ Rennes, IRISA, Rennes
Philippe Glaser Directeur de recherche, Institut Pasteur, Paris
Romain Chauvet Chef de Projet R&D, Eurofins , Nantes

Dir. de thèse : Jacques Nicolas Directeur de recherche, Univ Rennes, INRIA, Rennes
Dir. de thèse : Eric Guédon Directeur de recherche, INRAE, Institut Agro, STLO, Rennes
Invitée : Emeline Roux Maître de conférences, Univ Rennes, Rennes