Vous êtes ici

Modèles temporels de séquences thérapeutiques pour l'exploration de données médico-administratives

Equipe et encadrants
Département / Equipe: 
Site Web Equipe: 
https://team.inria.fr/lacodam/
Directeur de thèse
Emmanuel Oger
Co-directeur(s), co-encadrant(s)
Thomas Guyet
Olivier Dameron
André Happe
Contact(s)
Sujet de thèse
Descriptif

La pharmaco-épidémiologie, i.e. l'étude de l'usage des médicaments dans des situations réelles, est révolutionnée par l'utilisation des bases de données médico-administratives, en particulier en France par l'utilisation du SNIIRAM, la base de données de l’assurance maladie [Palmaro, 2016]. Ces données (délivrances de médicaments, visites médicales, hospitalisation, etc.) constituent une masse de données immédiatement disponibles et couvrant la quasi-totalité de la population française. Leur utilisation dans la pharmaco-épidémiologie répond au besoin d'apporter rapidement des réponses à des questions de santé publique. Pour cela, les épidémiologistes ont besoin d'aborder des situations complexes ou faisant intervenir des éléments peu fréquents. Les enjeux majeurs sont ainsi d’exploiter à la fois la quantité et la complexité des données de santé.

La difficulté posée par l'utilisation des données médico-administratives est le fossé sémantique entre l'information disponible (délivrances de médicament) et la nature des événements recherchés (de nature « clinique »). Pour cela, l'épidémiologiste doit construire des proxy qui lui permettront d'identifier des patients et des événements d'intérêts à partir des données brutes du SNIIRAM : e.g. des changements de thérapeutique pour raison d'inefficacité ou encore « économique » (princeps/générique), des périodes d'expositions basés sur des effets doses, stades de maladie, etc.

Les capacités d'analyse des épidémiologistes sont limitées par la possibilité d'exprimer facilement des proxy correspondant à des séquences thérapeutiques complexes. Les obstacles à dépasser sont sémantiques et computationnelles. D'un point de vue sémantique, des séquences thérapeutiques recherchées doivent intégrer pleinement les dimensions temporelles et taxonomiques des données pour offrir un pouvoir d'expression important. D'un point de vue computationnel, les méthodes employées doivent permettent de traiter efficacement de grandes masses de données (plusieurs millions de parcours de soins).

L'objectif de cette thèse est de déterminer dans quelle mesure les modèles temporels de séquences ([Allen,1994][Muller,2008][Artikis,2012][Akshay,2016]) développés en informatique permettent de représenter des séquences thérapeutiques complexes et de montrer l’apport de cette approche pour la pharmaco-épidémiologie (en particulier, dans le cadre du développement de l'infrastructure du SNDS)

Les étapes de la thèse seront les suivantes : 1) travail bibliographique, découverte du SNIIRAM et de la pharmaco-épidémiologie 2) identification de modèles potentiels de séquences thérapeutiques et de 2 à 4 études de pharmaco-épidémiologie type à reproduire ou approfondir parmi les études de REPERES (identification d'objectifs ancillaires aux projets en cours : sur notamment les traitements de l'épilepsie [Polard,2015], ou sur la prise en charge de cancer : cancer de la prostate et mélanome ; un projet sur la prise en charge de l'hypertension artérielle [Novak,2015][Scailteux,2016] où les médicaments sont nombreux avec des changements complexes), 3) mise en œuvre et comparaison des modèles de séquences et 4) la valorisation du travail.

Bibliographie
  • [Akshay, 2016] Sundararaman Akshay, Loïc Hélouët, Claude Jard, Pierre-Alain Reynier. "Robustness of Time Petri Nets under Guard Enlargement". Fundamenta Informaticae, Polskie Towarzystwo Matematyczne, 2016, 143 (3-4)

  • [Allen, 1994] Allen & Ferguson, "Actions and Events in Interval Temporal Logic", Journal of Logic and Computation, 4(5):531-579, 1994

  • [Artikis, 2012] Alexander Artikis, Anastasios Skarlatidis, François Portet, Georgios Paliouras. "Logic-Based Event Recognition". Knowledge Engineering Review, 27 (4), pp.469–506, 2012

  • [Balusson, 2016] Frédéric Balusson, Marie-Anne Botrel, Olivier Dameron, Yann Dauxais, Erwan Drezen, Thomas Guyet, André Happe, Emmanuel Oger. "PEPS: a platform for supporting studies in pharmaco-epidemiology using medico-administrative databases". International Congress on e-Health Research, 2016

  • [Guyet, 2016] Martin Gebser, Thomas Guyet, René Quiniou, Javier Romero, Torsten Schaub: Knowledge-Based Sequence Mining with ASP. IJCAI: 1497-1504,2016

  • [Muller, 2008] Mueller, E. T.. "Event calculus". Foundations of Artificial Intelligence, 3, 671-708, 2008

  • [Nowak, 2015] Nowak E, Happe A, Bouget J, Paillard F, Vigneau C, Scarabin PY, Oger E. "Safety of Fixed Dose of Antihypertensive Drug Combinations Compared to (Single Pill) Free-Combinations: A Nested Matched Case-Control Analysis". Medicine. 94(49):e2229, 2015

  • [Palmaro,2016] Palmaro A, Moulis G, Despas F, Dupouy J, Lapeyre-Mestre M. "Overview of drug data within French health insurance databases and implications for pharmacoepidemiological studies". Fundam Clin Pharmacol. 30(6):616-624, 2016

  • [Polard, 2015] Elisabeth Polard, Emmanuel Nowak, André Happe, Arnaud Biraben, and Emmanuel Oger. "Brand name to generic substitution of antiepileptic drugs does not lead to seizure-related hospitalization: a population-based case-crossover study". Pharmacoepidemiology and drug safety, 24(11):1161–1169, 2015

  • [Rivaux, 2016] Yann Rivault, Nolwenn Le Meur, Olivier Dameron. "Complications post-opératoires et mode de prise en charge en angioplastie : apport du Programme de Médicalisation des Systèmes d'Information (PMSI)". Congrès Adelf-Epiter 2016.

  • [Scailteux,2016] Scailteux L, Balusson F, Nowak E, Happe A, Le Nautout B, Leclerc C, Polard E, Oger E, Vincendeau S. "Thérapie par déprivation d’androgène et risque cardiovasculaire (ADTCR) : étude de cohorte de 38 690 patients". Prog Urol.;26(13):780. 2016.

  • [Spiotta, 2015] Matteo Spiotta, Paolo Terenziani, Daniele Theseider Dupré: "Answer Set Programming for Temporal Conformance Analysis of Clinical Guidelines Execution". KR4HC/ProHealth, p. 65-79, 2015

Début des travaux: 
dès que possible
Mots clés: 
parcours de soins, séquences temporelles, logiques temporelles, pharmaco-épidémiologie, données massives
Lieu: 
IRISA - Campus universitaire de Beaulieu, Rennes