Ingrid JACQUEMIN
IngridJACQUEMINDOCTEURProjet Symbiose |
IRISA Campus de Beaulieu 35042 Rennes, France Email : ingrid.jacquemin@irisa.fr | GRAPPA Université de Lille3 av. du Général de Gaulle 59000 VILLENEUVE D'ASCQ Email : ingrid.jacquemin@univ-lille3.fr Page web : ma page grappa | INRA rue de la Géraudière BP 71627 44316 Nantes cedex 3 Email : ijacquem@nantes.inra.fr |
- Postdoc à l'INRA de Nantes
- Responsable : Dominique Tessier
Co-encadrement : Christine Gaspin (Toulouse) - Sujet : Interprétation de données de séquençage de novo obtenues à grande échelle en protéomique d'organismes non séquencés.
Résumé:
Le projet de recherche proposé vient en appui des projets de protéomique des compartiments subcellulaires initiés dans l'unité BIA (Biopolymères, Interactions, Assemblages) du département CEPIA. Les développements attendus à l'issu de ce projet devraient permettre d'approfondir l'interprétation des données de MS/MS issues de la plateforme RIO de spectrométrie de masse, en particulier dans un contexte d'augmentation des débits d'analyses. En effet, les améliorations des techniques dues d'une part à un appareillage de plus en plus précis dans les mesures de masses, d'autre part à la prise en charge de l'analyse de mélanges issus, par exemple, de protocoles associant chromatographie liquide et spectrométrie de masse, reste limitées par la capacité d'interprétation automatisée des résultats. Il s'agit ici de l'améliorer sensiblement, principalement dans le contexte de l'analyse des génomes non séquencés. - Titre de thèse: Découverte de motifs relationnels en bioinformatique: application à la prédiction des ponts disulfures dans les protéines.
Résumé:
L'exploitation fonctionnelle des informations provenant des grands programmes de séquençage des génomes pose le problème important de la prédiction de la structure tridimensionnelle des protéines. Or, déterminer la structure 3D des protéines expérimentalement est une tâche très lourde et coûteuse, qui peut s'avérer parfois impossible à réaliser. L'arrivée massive de données provenant des programmes de séquençage à grande échelle impose de passer d'une approche biochimique à une approche bioinformatique, et nécessite en particulier de développer des méthodes de prédiction sur des séquences. Le problème général de prédiction de structure des protéines à partir de la séquence d'acides aminés est difficile. La résolution de plusieurs sous-problèmes plus spécifiques exploitant les particularités de protéines aide à réduire cette complexité.
Cette thèse propose l'exploration de deux nouvelles pistes pour progresser dans la résolution de prédiction de ponts disulfures dans les protéines car cette liaison covalente stabilise et contraint fortement la conformation spatiale de la protéine et la connaissance des positions où elle intervient peut réduire considérablement la complexité du problème de la prédiction de la structure 3D des protéines. Pour cela, nous utilisons dans un premier temps, l'inférence grammaticale et plus particulièrement les langages de contrôle introduit par Y. Takada, puis dans un deuxième temps, la programmation logique inductive.
Diverses expériences visent à confronter un cadre théorique d'apprentissage et des algorithmes généraux d'inférence grammaticale régulière à une application pratique de prédiction d'appariements spécifiques au sein d'une séquence protéique. D'autres expérimentations montrent que la programmation logique inductive donne de bons résultats sur la prédiction de l'état oxydé des cystéines en inférant des règles interprétables par les biologistes. Nous avons proposé un algorithme d'induction heuristique qui peut être utilisé pour différents problèmes. L'idée d'effectuer plusieurs phases d'apprentissage en tenant compte des résultats obtenus aux phases précédentes permettant ainsi de diminuer considérablement la combinatoire dans les espaces d'hypothèses logiques car à chaque étape, notre algorithme construit des règles de plus en plus discriminantes.
Thèse soutenue en décembre 2005. - Prédiction de ponts disulfures par langages de contrôle, CAP 2003, Laval, I.Jacquemin et J.Nicolas
- Modélisation de cystéines oxydées à l'aide de la Programmation Logique Inductive, JOBIM 2005, Lyon, I.Jacquemin et J.Nicolas
- Disulfide bond prediction using Inductive Logic Programming, WCB 2005, Sitges, I.Jacquemin et J.Nicolas
- Découverte de motifs relationnels en bioinformatique: application à la prédiction des ponts disulfures, Manuscrit de thèse, 2005, IRISA - Université de Rennes 1, I.Jacquemin
- Disulfides bonds prediction within proteins, ECCB 2003, La Vilette, I.Jacquemin et J.Nicolas (résumé) et (poster)
- Disulfide bond prediction using Inductive Logic Programming, ECCB 2005, Madrid, I.Jacquemin et J.Nicolas (poster)
- 1997 et 2001 : Tutorat (aide aux étudiants de Deug MIAS 1e année en mathématique et informatique) à Valenciennes(59)
- 2000 - 2001 : Travaux Pratique de Base de données en IUT 2e année à Cambrai(59)
- 2001 - 2002 : Cours, TD, TP de SCHEME en 1e cycle, 1e année d'école d'ingénieur à l'Insa de Rennes(35) (équivalent 64h cours). Création d'un DS et correction de 120 copies
- 2002 - 2004 : Cours, TD, TP de JAVA en 1e cycle, 2e année d'école d'ingénieur à l'Insa de Rennes(35) (équivalent 64h cours). Création d'un DS et examen et correction de 120 copies
- 2004 - 2005 : Cours, TD d'UML en DESS TIMH (faculté de médecine de Rennes) (équivalent 20h cours)+ Projets de 15h. Utilisation de Mac.
- 2004 - 2005 : Cours, TD, TP de JAVA en DESS TIMH (équivalent 18h cours) + Projets de 15h. Utilisation de Mac
- 2004 - 2005 : TP de SPIP (création de site web) master 1e année (fac. de médecine de Rennes) (12h TP). Utilisation de Mac.
- 2004 - 2005 : Cours-TP d'ACCESS 2003 aux 2e année de médecine (fac. de médecine de Rennes) (18h) + examen de fin d'année. Utilisation de Mac.
- 2005 - 2006 : ATER dans l'équipe GRAPPA à l'Université de Lille3 (ma page web).
Cours, TD, TP de Python en 1e et 2e année
Cours, TD, TP d'ACCESS en 3e année - Pascal, C, C++, Java, Scheme, Caml, Ada, Prolog, Perl, SQL, Shell, Python
- Windows 95, Unix, Mac
- anglais: lu, écrit et parlé
- allemand et espagnol: quelques notions
- Participe à un groupe de travail d'une AS CNRS "apprentissage et séquences" devenue ensuite "Projet GENOTO3D"
- Présidente (2001-2002), Vice-Présidente (2002-2003) et Vice-Trésorière (2003-2004) de l'association ADOC , association des doctorants en informatique, traitement du signal et télécommunication de Rennes1
-
Bridgeuse(classée 1e série carreau). 3e de France interclub D2 en 2006. Championne du challenge du comité de
bretagne (2e série) en 2004. Championne du challenge du comité
de bretagne(3e série) en 2003.
- Monitrice agrée FFB et arbitre de bridge
- Badminton
- Cavalière (galop 6)
