IP-Calicot - Axes de recherche

›› État des lieux

L'apprentissage artificiel consiste à découvrir par induction un modèle de la structure qui sous-tend implicitement un ensemble de données. Parmi les nombreuses méthodes d'apprentissage automatique, la programmation logique inductive (PLI) est particulièrement intéressante car elle permet l'analyse de données complexes : les données de ce type sont organisées selon une structure mettant en jeu plusieurs relations qu'il est difficile d'expliciter par des méthodes plus classiques utilisant une représentation par attributs-valeurs.

La PLI est une méthode d'apprentissage symbolique automatique supervisée. À partir d'exemples représentant des situations où le concept se manifeste de manière positive ou négative, la méthode d'apprentissage permet d'induire une représentation générale de ce concept sous la forme d'une ou plusieurs clauses, contenant une ou plusieurs relations codées en logique du premier ordre. Cette propriété est nécessaire pour représenter de manière simple et naturelle des motifs temporels comme ceux associés aux pathologies cardiaques. En résultat, les règles obtenues sont exprimées dans un langage de haut niveau, facilement compréhensible par un humain. Cet aspect est particulièrement important pour valider les résultats obtenus auprès d'experts du domaine.

Pour plus d'informations sur la PLI, voir ici.

›› Contributions

Notre travail s'est focalisé sur l'apprentissage de connaissances temporelles à partir de séries temporelles issues de capteurs. Précisément, les exemples d'apprentissage sont constitués de fragments d'électro-cardiogrammes (ECG) représentés de manière symbolique et exprimant une pathologie. La PLI produit un ensemble de clauses constituées d'événements (occurences d'ondes spécifiques dans l'ECG) et de contraintes temporelles sur l'occurrence de ces événements. La traduction de tels ensembles de clauses dans le formalisme des chroniques en vue de leur reconnaissance sur un flux de données est quasi-directe.

Apprentissage monovoie
La représentation des exemples et des hypothèses doit faciliter l'apprentissage, en particulier, en respectant la structure implicite présente dans les données. Pour satisfaire cet objectif, nous avons utilisé une structure chaînée. Tout en évitant d'introduire un biais trop important qui nuirait à la généralité de l'apprentissage, cette représentation permet d'induire plus facilement la structuration séquentielle des événements et de la généraliser dans les modèles obtenus. De plus, elle permet de restreindre l'espace de recherche des hypothèses en éliminant de manière précoce des solutions qui ne respecteraient pas une structure séquentielle adéquate.

Apprentissage multisources
Lorsque les données proviennent de plusieurs sources, par exemple plusieurs voies d'ECG et une voie de pression ou de respiration, la taille de l'espace de recherche devient telle qu'un apprentissage par PLI est pratiquement impossible. L'idée consiste alors à utiliser une méthode "diviser pour régner". L'apprentissage comprend deux étapes : apprentissage indépendant sur chacune des voies en utilisant un langage de représentation spécifique plus simple que le langage global, puis fusion des résultats pour obtenir le modèle global. Nous utilisons une technique originale ne consistant pas à fusionner directement les modèles partiels mais à explorer l'espace global des hypothèses en étant guidé par les modèles appris au cours de la première étape.

Apprentissage de règles de décision
L'acquisition de règles de décision auprès d'experts ou en utilisant des techniques d'analyse de données telles que l'analyse en composantes principales peut s'avérer longue et fastidieuse. Nous avons évalué une technique d'apprentissage automatique produisant des arbres de décision à partir desquels il est possible de dériver des règles de décision pour le système de pilotage d'algorithmes. Pour ce faire, chacun des algorithmes concurrents est préalablement exécuté dans divers contextes de bruit courants en environnement clinique. Les règles produites comportent en partie prémisse une condition testant plusieurs attributs décrivant le contexte et en partie conclusion l'algorithme choisi ainsi qu'un réglage de ses paramètres.