Integration and analysis of heterogeneous biological data through multilayer graph exploitation to gain deeper insights into feed efficiency variations in growing pigs

Defense type
Thesis
Starting date
End date
Room
amphithéâtre Matagrin à l'Institut Agro
Speaker
Camille Juigné
Theme
La soutenance se déroulera le vendredi 1er décembre à 9h en amphi Matagrin à l'Institut Agro (point n°5 sur le plan en PJ).
 
Résumé : Les progrès technologiques d’étude du vivant ont conduit à une explosion de données multimodales et multicentriques. Ce phénomène soulève de nombreuses questions liées au stockage, à la standardisation et à l’analyse de ces données massives. Ainsi, ce travail de thèse porte sur le développement d’une méthode intégrative d’analyse de données biologiques, pour en extraire de la connaissance. Pour prendre en compte leur forte interdépendance, cette approche consiste à intégrer différents types d’entités biologiques (ARNm, protéines, métabolites, caractères observables) qui sont habituellement étudiés indépendamment les uns des autres. La solution informatique élaborée permet d’intégrer ces données hétérogènes dans un graphe multicouche, avec une couche par type d’entités. L’originalité est de relier les éléments d’une couche ou de couches différentes par des propriétés extraites des bases de données et de connaissances publiques à l’aide de technologies du Web Sémantique. A partir de ce graphe, le but est de caractériser les relations entre un groupe de molécules d’intérêt grâce à des métriques de la théorie des graphes. La méthode développée a été appliquée à des jeux de données expérimentaux (transcriptomique, métabolomique et phénotypes animaux) pour décrire et comprendre les relations entre les molécules et leur importance dans la variation d’efficience alimentaire de porcs. L’efficience alimentaire est un phénotype clé pour contribuer à un élevage durable, mais complexe. Ce travail a permis de mettre à disposition des méthodes d'analyse novatrices, à différentes échelles de l'organisation du vivant, favorisant une meilleure compréhension des processus biologiques.
 
Mots clés : Efficience alimentaire, Graphe multicouche, Intégration de données, Multi-omiques, Web sémantique

 


 
Composition of the jury
Mathieu Emily, professeur à l'Institut Agro Rennes Angers (examinateur, président du jury)
Michel Dumontier, distinguished professor à l'Université de Maastricht (examinateur)
Andrea Rau, directrice de recherche à l'INRAE (rapportrice)
Fabien Jourdan, directeur de recherche à l'INRAE(rapporteur)
Florence Gondret, directrice de recherche à l'INRAE (directrice de thèse)
Emmanuelle Becker, maîtresse de conférence à l'Université de Rennes (co-encadrante de thèse)