Fouille de données temporelles


Atelier à EGC 2006
17 janvier 2006

Appel à communication


Objectifs

Dans de nombreux domaines applicatifs, tels la biologie, la santé, les télécommunications, la vidéo-surveillance, etc., des données sont enregistrées de manière continue. Les bases de données concernées peuvent atteindre des tailles gigantesques ou ne retenir que les données les plus récentes. Les données représentent, par exemple, les valeurs prises par des variables mesurées à intervalles réguliers ou des événements se produisant de manière irrégulière. Dans la plupart des cas, les données présentent un caractère temporel qu'il est intéressant de caractériser : relations entre les tendances de plusieurs variables, relations temporelles entre occurrences de certains types d'événements, etc. L'exploitation de cette dimension temporelle introduit une complexité supplémentaire dans les tâches de fouille de données et d'extraction de connaissances. Ainsi, il faut tenir compte
  • des aspects métriques ou symboliques des relations temporelles traitées,
  • de l'irrégularité ou du manque de synchronisation des mesures,
  • du volume des données à traiter,
  • de la fugacité des données et de la nécessité d'un traitement en temps-réel,
  • de la nécessité/possibilité ou non d'un encodage explicite des relations temporelles des données avant leur exploitation,
  • de la granularité temporelle et du caractère hétérogène des types des données pouvant avoir un impact sur les motifs susceptibles d'être découverts,
  • de la nature et de l'utilisation des connaissances extraites,
  • de la possibilité de prendre en compte la connaissance générale sur le domaine.
Les approches généralement suivies consistent, soit à étendre les approches classiques de la fouille de données pour prendre en compte la dimension temporelle, soit à proposer de nouvelles solutions et algorithmes appropriés aux données temporelles. Dans les deux cas, elles doivent tenir compte de la complexité des algorithmes utilisés et de leur possibilité de "passer à l'échelle". L'objectif de cet atelier est de rassembler des chercheurs, du domaine académique ou de l'industrie, travaillant sur des problèmes cités ci-dessus ou sur des applications confrontées à ces problèmes.

Thèmes

  • l'analyse exploratoire et l'abstraction symbolique de séries temporelles, la découverte de motifs temporels,
  • les méthodes de prédiction pour les données temporelles,
  • la prise en compte de l'aspect multidimensionnel des données temporelles,
  • la prise en compte de données qualitatives (non numériques),
  • la sélection de traits (feature selection) dans les données temporelles (pour déterminer les relations temporelles implicites intéressantes, par exemple),
  • la réduction de la dimensionnalité des données temporelles,
  • l'interrogation intelligente de données temporelles,
  • le traitement des flux de données (requêtes sur des flux, fouille de flux de données),
  • les applications de la fouille de données temporelles, par exemple dans les domaines suivants :
    • la bioinformatique,
    • la santé (monitoring, surveillance),
    • les télécommunications (facturation, diagnostic, surveillance et sécurité des réseaux),
    • les services web,
    • l'environnement,
    • etc.

Programme

9h15-9h30 ACCUEIL .
9h30-10h00 Mireille Gettler Summa, Frédérick Vautrain, Laurent Schwartz, Mathieu Barrault, Jean Marc Steyaert, Nicolas Hafner Multiple time series: New approaches and new tools in data-mining. Application to cancer epidemiology
10h00-10h30 Alexandre Vautier, Marie-Odile Cordier, Mireille Ducassé, René Quiniou Agrégation d’alarmes faiblement structurées
10h30-11h00 PAUSE .
11h00-11h30 Sullivan Hidot, Jean-Yves Lafaye, Christophe Saint-Jean Analyse factorielle d’opérateurs pour l’étude du mouvement: Application à la danse
11h30-12h00 Ahlame Chouakria-Douzal Réduction de la dimension de séries temporelles multivariées par extraction de tendances locales
12h00-12h30 Pierre-François Marteau, Marwan Fuad, Gildas Ménier Echantillonnage adaptatif et classification supervisée de séries temporelles
12h30-14h00 DEJEUNER .
14h00-14h30 M. Touati, M. Rahal, C. Quantin, G. Le Teuff, E. Diday, F. Afonso, G. Battaglia, M. Limam Analyse de trajectoires hospitalières de patients atteints d'un infarctus du myocarde
14h30-15h00 Remi Gaudin, Nicolas Nicoloyannis Séries Temporelles : Vers une mesure de distance optimale
15h00-15h30 Bernard Hugueney Représentations symboliques adaptatives de séries temporelles : principes et algorithmes de construction
15h30-16h00 PAUSE .
16h00-16h30 Thomas Guyet, Catherine Garbay, Michel Dojat Algorithme d’apprentissage de scénarios à partir de séries symboliques temporelles
16h30-17h00 Manoranjan Muniandi, Christophe Demko, Bertrand Vachon Partitionnement de données paramétriques en zones de comportement homogène dans un but explicatif
17h00-17h30 Chedy Raïssi, Pascal Poncelet, Maguelonne Teisseire FIDS : Extraction efficace d’itemsets dans des flots de données
17h30-18h00 DISCUSSION .

Organisateurs

Comité de sélection

  • Fabrice Clérot (FT R & D Lannion)
  • Marie-Odile Cordier (IRISA/Université de Rennes 1)
  • Florian De Vuyst (Ecole Centrale de Paris)
  • Michel Dojat (Unité mixte INSERM-UJF U594 "Neuroimagerie Fonctionnelle & Métabolique" Grenoble)
  • Catherine Garbay (CLIPS-IMAG Grenoble)
  • Georges Hébrail (ENST Paris)
  • René Quiniou (IRISA/INRIA Rennes)

Format des soumissions

Les textes doivent être soumis en format pdf (on trouve un convertisseur gratuit sur http://www.pdf995.com).

Ils doivent respecter les limites de 6 à 10 pages selon le format de la conférence EGC 2006 (celui de la Revue des Nouvelles Technologie de l'Information-RNTI, http://www.antsearch.univ-tours.fr/rnti/).

Dates

Réception des communications : 30 novembre 2005
Notification aux auteurs : 13 décembre 2005
Réception des articles pour publication : 3 janvier 2006
Atelier : 17 janvier 2006

Contact, soumission électronique

Georges Hébrail : hebrail@enst.fr
René Quiniou : Rene.Quiniou@irisa.fr