Recherche efficace de motifs spatio-temporels dans des grands cubes de données satellites

Publié le
Equipe
Lieu
Lille (+ Vannes)
Unité de recherche
IRISA - UMR 6074
Description du sujet de la thèse

Thèse CIFRE à pourvoir le plus rapidement possible, avec la société CLS (entité SIRS localisée à Lille)

En dépit des progrès récents en intelligence artificielle appliquée à l'observation de la Terre, illustrés par des performances toujours accrues sur des jeux de données standardisés, son utilisation dans un contexte de cartographie opérationnelle reste confrontée à différents verrous, que la thèse cherchera à lever.
  
En premier lieu, les approches modernes d'analyse d'image requièrent, dans leur grande majorité, de disposer au préalable d'une grande quantité d'exemples afin d'entraîner les modèles prédictifs comme les réseaux de neurones profonds. Les solutions interactives, permettant à un utilisateur de fouiller ses données afin d'en extraire les informations recherchées et d'en découvrir de nouvelles, restent peu étudiées.
  
De plus, l'avènement de l'apprentissage profond a amené un besoin toujours plus important en ressources informatiques: capacité de calcul sur CPU ou GPU, mémoire vive. La sobriété numérique est devenue aujourd'hui une question sociétale majeure, au-delà des intérêts économiques qu'elle peut procurer.
  
Enfin, la majorité des développements récents portent sur l'identification de motifs soit purement spatiaux (segmentation sémantique, détection d'objets) soit purement temporels (classification de séries temporelles). Les séries temporelles d'images satellites, disponibles en masse avec l'avènement de missions telles que Landsat ou Sentinel, nécessitent de porter une attention conjointe aux dimensions spatiale et temporelle.
  
La prise en compte de ces différents verrous s'effectuera au travers d'une problématique scientifique originale : la recherche efficace de motifs spatio-temporels dans des grands cubes de données satellites. Cette recherche, conduite de façon interactive et itérative par un utilisateur, s'appuiera sur un nombre restreint d'exemples, sur la base desquels une fouille d'un cube de données spatio-temporelles sera effectuée afin d'en extraire les motifs les plus similaires. 
  
Bien que le paradigme de la recherche par l'exemple ou par le contenu ait été largement étudié en analyse d'image, y compris en observation de la terre, son application à des exemples spatio-temporels reste originale. Elle permettrait pourtant d'offrir de nombreux cas d'utilisation, comme par exemple l'identification  d'inondations, de feux de foret, de fauchages non conformes de prairie, etc.
  
Ce mécanisme de fouille interactive permettra également de constituer facilement des ensembles de données de référence, qui pourront être par la suite utilisés pour entraîner des modèles IA dont la pertinence reste avérée lorsque les phénomènes étudiés peuvent être observés en amont.
  
Afin de mettre en oeuvre un tel mécanisme, plusieurs paradigmes peuvent être explorés, et nous souhaitons comparer l'intérêt des approches stochastiques et déterministes dans un tel contexte. Alors que les premières sont généralement basées sur un apprentissage et font aujourd'hui office de référence dans des tâches usuelles de classification (réseaux de neurones profonds), les secondes présentent l'avantage de pouvoir être implantées à l'aide d'algorithmes particulièrement efficaces, comme les hiérarchies morphologiques par exemple. Dans tous les cas, une attention particulière sera portée à l'efficience, au passage à l'échelle, et à la robustesse de la méthode en présence de peu d'exemples.

Sujet complet : https://www-obelix.irisa.fr/files/2022/09/CIFRE_CLS_Obelix.pdf

 

Bibliographie

François Merciol and al. Tree representations of images for scalable knowledge extraction and learning for earth observation. 2017. https://gitlab.inria.fr/obelix/triskele/

François Merciol and al. Broceliande is a tools for classification base on triskele and random forest. 2018. https://gitlab.inria.fr/obelix/broceliande/

François Merciol, Loïc Faucqueur, Bharath Bhushan Damodaran, Pierre-Yves Rémy, Baudouin Desclée, Fabrice Dazin, Sébastien Lefèvre, Antoine Masse, and Christophe Sannier. Geobia at the terapixel scale: Toward efficient mapping of small woody features from heterogeneous VHR scenes. ISPRS InternationalJournal of Geo-Information, 8(1):46, 2019

François Merciol, Minh-Tan Pham, Deise Santana Maia, Antoine Masse, and Christophe Sannier.  BROCELIANDE: a comparative study of attribute profiles and feature profiles from different attributes. In ISPRS,Nice, France, June 2020

Behzad Mirmahboub, Jérôme Moré, David Youssefi, Alain Giros, François Merciol, and Sébastien Lefèvre. Fast Pattern Spectra using Tree Representation of the Image for Patch Retrieval. In Discrete Geometry and Mathematical Morphology 2021, pages 107-119, May 2021

Deise Santana Maia, Minh-Tan Pham, Erchan Aptoula, Florent Guiotte, and Sébastien Lefèvre. Classification of remote sensing data with morphological attributes profiles : a decade of advances. IEEE Geoscience and Remote Sensing Magazine, 9(3):43-71, 2021

Caglayan Tuna. Morphological Hierarchies for Satellite Image Time Series. PhD thesis, Université Bretagne Sud, 2020

Liste des encadrants et encadrantes de thèse

Nom, Prénom
Lefèvre, Sébastien
Type d'encadrement
Directeur.trice de thèse
Unité de recherche
UMR 6074
Equipe

Nom, Prénom
Merciol, François
Type d'encadrement
Co-encadrant.e
Unité de recherche
UMR 6074
Equipe
Contact·s
Nom
Merciol, François
Email
francois.merciol@irisa.fr
Mots-clés
Traitement d'image, télédétection, séries temporelles, morphologie mathématique, apprentissage profond