Vous êtes ici

Modèles temporels de séquences thérapeutiques pour l'exploration de données médico-administratives

Equipe et encadrants
Département / Equipe: 
Site Web Equipe: 
https://team.inria.fr/lacodam/
Directeur de thèse
Emmanuel Oger
Co-directeur(s), co-encadrant(s)
Guyet Thomas
Dameron Olivier
Happe André
Contact(s)
NomAdresse e-mail
Thomas Guyet
thomas.guyet@irisa.fr
Sujet de thèse
Descriptif

La pharmaco-épidémiologie, i.e. l'étude de l'usage des médicaments en conditions réelle, est révolutionnée par l'utilisation des bases de données médico-administratives, en particulier en France par l'utilisation du SNDS [Palmaro, 2016]. Ces données (délivrances de médicaments, consultations médicales, hospitalisation, en fait toutes prestations de soins remboursées par l'Assurance Maladie) constituent une masse de données prospectivement collectées et disponibles, couvrant la quasi-totalité de la population française. Leur utilisation en pharmaco-épidémiologie répond au besoin d'apporter rapidement des réponses à des questions de santé publique. Pour cela, les épidémiologistes ont besoin d'aborder des situations complexes ou faisant intervenir des éléments peu fréquents. Les enjeux majeurs sont ainsi d’exploiter à la fois la quantité et la complexité des données de santé.

La difficulté posée par l'utilisation des données médico-administratives est le fossé sémantique entre l'information disponible (par exemple, les délivrances de médicament) et la nature des événements recherchés (de nature « clinique »). Pour cela, l'épidémiologiste doit construire des proxy qui lui permettront d'identifier des patients et des événements d'intérêts à partir des données brutes du SNDS. Par exemple, il s’agit d’identifier dans les données de patients les changements de thérapeutique pour raison d'inefficacité ou encore « économique » (princeps/générique), de reconstruire des périodes d'expositions à un ou plusieurs médicaments d'intérêt (l'exposition médicamenteuse est une variable dépendante du temps pour des raisons non aléatoires), d’identifier des stades de maladie, etc.

Les capacités d'analyse des épidémiologistes sont limitées par la possibilité d'exprimer facilement des proxy correspondant à des séquences thérapeutiques complexes. Les obstacles à dépasser sont sémantiques et computationnelles. D'un point de vue sémantique, des séquences thérapeutiques recherchées doivent intégrer pleinement les dimensions temporelles et taxonomiques des données pour offrir un pouvoir d'expression important. D'un point de vue computationnel, les méthodes employées doivent permettent de traiter efficacement de grandes masses de données (plusieurs millions de parcours de soins).

L'objectif de cette thèse est de déterminer dans quelle mesure les modèles temporels de séquences développés en informatique permettent de représenter des séquences thérapeutiques complexes et de montrer l’apport de cette approche pour la pharmaco-épidémiologie (en particulier, dans le cadre du développement des outils interactifs du consortium PEPS/REPERES).

Dans le cadre de travaux passés, nous nous sommes intéressés au modèle de chroniques [Dauxais, 2017] qui représente une séquence thérapeutique comme un ensemble d’événements pour lesquels sont ajoutés des contraintes numériques sur le délai entre leurs occurrences. Ce modèle est efficace pour interroger de grandes masses de données mais montre des limites dans son expressivité (notamment sur des taxonomies ou sur l’expression de disjonctions). D’autres modèles de comportement ont été proposés avec des modélisations du temps différentes (eg [Allen,1994][Muller,2008][Artikis,2012][Akshay,2016][Piel,2016]). Chacune de ces représentations offrent donc des potentiels sémantiques et des limites calculatoires auxquels s’intéressera cette thèse pour faire émerger des solutions pratiques qui seront déployées et expérimentées sur des études pharmaco-épidémiologiques.

Les étapes de la thèse seront les suivantes : 1) travail bibliographique, découverte du SNDS et de la pharmaco-épidémiologie 2) identification de modèles potentiels de séquences thérapeutiques et de 2 à 4 études de pharmaco-épidémiologie type à reproduire ou à approfondir parmi les études menées par l'équipe REPERES (identification d'objectifs ancillaires aux projets en cours : sur notamment les traitements de l'épilepsie [Polard,2015], ou sur la prise en charge de cancer : cancer de la prostate [Scailteux,2016], mélanome, un projet sur la prise en charge de l'hypertension artérielle [Nowak,2015] où les médicaments sont nombreux avec des changements complexes), 3) mise en œuvre et comparaison des modèles de séquences et 4) valorisation du travail.

L'accès aux données du SNDS sera géré par le CHU de Rennes, gestionnaire du consortium PEPS, dans le cadre de projets d'études de pharmaco-épidémiologie menées en propre par l'équipe REPERES pour lesquelles des données sont d’ores et déjà accessibles et l’expertise médicale mobilisable. La boîte à outils PEPS servira de cadre de développement pour mettre en œuvre des expérimentations sur les données. Ces développements pourront être menés par la/le doctorant(e) avec l'aide de l'IRISA-Inria et des ingénieurs du consortium PEPS.

Bibliographie
  • [Akshay, 2016] Sundararaman Akshay, Loïc Hélouët, Claude Jard, Pierre-Alain Reynier. "Robustness of Time Petri Nets under Guard Enlargement". Fundamenta Informaticae, Polskie Towarzystwo Matematyczne, 2016, 143 (3-4)

  • [Artikis, 2012] Alexander Artikis, Anastasios Skarlatidis, François Portet, Georgios Paliouras. "Logic-Based Event Recognition". Knowledge Engineering Review, 27 (4), pp.469–506, 2012

  • [Allen, 1994] Allen & Ferguson, "Actions and Events in Interval Temporal Logic", Journal of Logic and Computation, 4(5):531-579, 1994

  • [Balusson, 2016] Frédéric Balusson, Marie-Anne Botrel, Olivier Dameron, Yann Dauxais, Erwan Drezen, et al.. "PEPS: a platform for supporting studies in pharmaco-epidemiology using medico-administrative databases". International Congress on e-Health Research, 2016

  • [Dauxais, 2017] Yann Dauxais, Thomas Guyet, David Gross-Amblard, André Happe. Discriminant chronicles mining: Application to care pathways analytics. Artificial Intelligence in Medicine, Jun 2017, Vienna, Austria. 2017, 16th Conference on Artificial Intelligence in Medicine.

  • [Drezen, 2017] Erwan Drezen, Thomas Guyet, André Happe. From medico-administrative databases analysis to care trajectories analytics: an example with the French SNDS. Fundamental and Clinical Pharmacology, Wiley, 2017

  • [Guyet, 2016] Martin Gebser, Thomas Guyet, René Quiniou, Javier Romero, Torsten Schaub: Knowledge-Based Sequence Mining with ASP. IJCAI: 1497-1504,2016

  • [Muller, 2008] Mueller, E. T.. "Event calculus". Foundations of Artificial Intelligence, 3, 671-708, 2008

  • [Nowak, 2015] Nowak E, Happe A, Bouget J, Paillard F, Vigneau C, Scarabin PY, Oger E. "Safety of Fixed Dose of Antihypertensive Drug Combinations Compared to (Single Pill) Free-Combinations: A Nested Matched Case-Control Analysis". Medicine. 94(49):e2229, 2015

  • [Palmaro,2016] Palmaro A, Moulis G, Despas F, Dupouy J, Lapeyre-Mestre M. "Overview of drug data within French health insurance databases and implications for pharmacoepidemiological studies". Fundam Clin Pharmacol. 30(6):616-624, 2016

  • [Piel, 2016] Piel, Ariane, et al. "Temporal logic framework for performance analysis of architectures of systems." NASA Formal Methods Symposium. Springer, Cham, 2016

  • [Polard, 2015] Elisabeth Polard, Emmanuel Nowak, André Happe, Arnaud Biraben, and Emmanuel Oger. "Brand name to generic substitution of antiepileptic drugs does not lead to seizure-related hospitalization: a population-based case-crossover study". Pharmacoepidemiology and drug safety, 24(11):1161–1169, 2015

  • [Rivaux, 2017] Yann Rivault, Nolwenn Le Meur, Olivier Dameron. A Similarity Measure Based on Care Trajectories as Sequences of Sets, Conference on Artificial Intelligence in Medicine in Europe, Springer, pp.278-282, 2017,

  • [Scailteux,2016] Scailteux L, Balusson F, Nowak E, Happe A, Le Nautout B, Leclerc C, Polard E, Oger E, Vincendeau S. "Thérapie par déprivation d’androgène et risque cardiovasculaire (ADTCR) : étude de cohorte de 38 690 patients". Prog Urol.;26(13):780. 2016.

  • [Spiotta, 2015] Matteo Spiotta, Paolo Terenziani, Daniele Theseider Dupré: "Answer Set Programming for Temporal Conformance Analysis of Clinical Guidelines Execution". KR4HC/ProHealth, p. 65-79, 2015

Début des travaux: 
09/2018
Mots clés: 
requêtes, données temporelles, parcours de soins, pharmaco-épidémiologie
Lieu: 
IRISA - Campus universitaire de Beaulieu, Rennes