Sujet de Master 1 (stage d'été)
Titre Réalisation d'une extension RapidMiner pour la fouille de données sur des images satellite
Auteur(s) Thomas Guyet, René Quiniou
Début à partir de mai 2012
Description Les images satellite permettent l’acquisition d’information à grande échelle sur les couvertures de sol. Elles se différencient des images classiques (trois couches RGB), d'une part, parce que chaque pixel d'une telle image peut contenir plus de couches et, d'autre part, parce que les pixels sont géoréférencés.

Nous nous intéressons en particulier aux séries temporelles d’images satellite (SITS), c'est-à-dire des images composées d'une « couche » acquise tous les seize jours sur plusieurs années. Les travaux récents de l'équipe DREAM [1] ont permis de mettre en place une méthode pour segmenter une SITS en utilisant des méthodes de fouille de données (clustering, fouille de séquence, ...). Dans ce premier travail, nous avons expérimenté un algorithme de clustering, alors que d'autres algorithmes pourraient donner de meilleurs résultats. Nous sommes donc intéressés par expérimenter une multitude d'algorithmes et par en évaluer les résultats.

Pour tester différents algorithmes de clustering, nous ne souhaitons pas réimplémenter tous ces algorithmes, mais plutôt utiliser les implémentations existantes dans des boîtes à outils tels que RapidMiner [2]. Ce logiciel permet de définir une « chaîne de traitement » pour réaliser une fouille de données ainsi que des plans d'expérimentation pour comparer les performances des méthodes. Le logiciel propose une interface pour connecter des opérateurs (algorithmes de fouille de données ou de transformation de données).

Dans ce stage, nous souhaitons réaliser une « extension » RapidMiner (ou plugins), c'est-à-dire un ensemble d'opérateurs qui peuvent être utilisés dans l'interface de RapidMiner, pour intégrer le traitement d'images géoréférencées.

Dans un premier temps, le stagiaire aura pour objectif de définir les opérateurs nécessaires à la construction de « chaînes de traitement » d'images géoréférencées et de mettre en place les opérateurs principaux :
– opérateurs de chargement d'images dans un format georéférencé (e.g. GeoTiff) et de chargement d'images au format vectoriel (shapefile),
– opérateur efficace pour la mise en relation de plusieurs images,
– opérateurs d'enregistrement réaliser des opérations de classification des pixels d'images satellite.

Une fois ces opérateurs mis en place, ils pourront être mis en relation avec les autres opérateurs de RapidMiner de sorte à construire une chaîne de traitement pour la classification de SITS. La réalisation pourra être testée sur des données issues de séries temporelles d'images satellite (données du Sénégal).

Les développements seront réalisés en Java. Une expérience dans ce langage est souhaitable. Les technologies utilisées vont permettre à l'étudiant de découvrir, d'une part, les méthodes de fouille de données utilisées dans RapidMiner, les méthodes spécifiques de traitement de l'information géographique (utilisation de la librairie GeoTools).

Le stage sera effectué conjointement au Laboratoire d'Informatique d'Agrocampus-Ouest et à l'IRISA au sein de l'équipe DREAM (Diagnostic, Recommandation d'Action, Modélisation).

Bibliographie :

[1] Guyet T., Nicolas H., Diouck A. « Segmentation multi-échelle de séries temporelles d’images satellite : Application à l’étude d’une période de sécheresse au Sénégal », RFIA, 2011.
[2] RapidMiner : www.rapidminer.com Mots cles : intelligence artificielle, fouille de données, traitement de données géographiques, images satellite, application agronomique

Contacts : Thomas Guyet(1), René Quiniou(2)
Équipe :
1. Laboratoire d'Informatique AGROCAMPUS-OUEST – IRISA Équipe DREAM
2. INRIA-IRISA – Équipe DREAM
Mail : thomas.guyet@agrocampus-ouest.fr, rene.quiniou@inria.fr
Lien : http://www.irisa.fr/dream/Pages_Pros/Thomas.Guyet/Stages/



Ce site est maintenu par René Quiniou au moyen du système Weave
développé au sein du projet Caravel : http://www-caravel.inria.fr.
Dernière modification : 07-10-2011 09:54:25