Sujet de Master 1 (stage d'été)
Titre Développement d’un entrepôt de données spatiales sur la plateforme Pentaho
Auteur(s) Tasssadit BOUADI, René Quiniou et Marie-­-Odile Cordier
Début à partir de mai 2012
Description Ces travaux sont menés dans le cadre d’une collaboration IRISA (Projet DREAM)/ INRA (SAS) sur le transfert de polluants et l’amélioration de la qualité des eaux de bassins versants agricoles. Dans ce contexte, un entrepôt de données a été développé au sein de l’équipe comme outil d’analyse et d’exploration de résultats de simulations issus d’un modèle agro-­-hydrologique.

Le concept d’entrepôt de données (ED) a été formalisé pour la première fois en 1990 par Bill Inmon. Il s’agissait de constituer une base de données orientée sujet, intégrée et contenant des informations historisées, non volatiles et exclusivement destinées aux processus d’aide à la décision.

Les ED offrent un ensemble d’opérateurs OLAP « analyse en ligne » permettant une analyse multidimensionnelle de gros volumes de données. Cependant, sans volet cartographique, il est impossible de visualiser et d’analyser la composante géométrique de ces données. Une solution pourrait être de combiner des technologies spatiales et non-­-spatiales : SIG & OLAP (SOLAP). Les SIG étant des logiciels spécialisés dans l'analyse et la visualisation de données géographiques.

En effet, l’analyse en ligne « OLAP » prend toute sa valeur lorsqu'elle est couplée à des outils de visualisation (cartes de terrain) identifiant les configurations spatiales sources de la pollution.

L’objectif de ce stage est d’étudier l’intégration de la technologie SOLAP dans l’entrepôt de données déjà développé en se basant sur le modèle multidimensionnel existant.

Les étapes majeures de ce stage sont:
-­- la familiarisation avec la plate forme décisionnelle PENTAHO et particulièrement le serveur SOLAP « GeoMondrian » ;
-­- l’installation et la configuration du serveur « GeoMondrian » ;
-­- la modélisation des dimensions spatiales en se basant sur le schéma multidimensionnel existant ;
-­- le déploiement de l’entrepôt de données spatiales ;
-­- les test de quelques requêtes spatiales avec le langage de requêtes « spatial MDX » sur des données réelles.

Les développements seront réalisés en Perl, Python ou un autre langage de script que vous maîtrisez. Concernant la phase d'apprentissage, des connaissances rudimentaires des SIG, XML et MySQL sont souhaitables.

Les technologies utilisées vont vous permettre de découvrir la plateforme décisionnelle Pentaho (en particulier les modules : Mondrian, GeoMondrian et workbench), le langage de requêtes MDX et les entrepôts de données spatiales.

Le stage sera effectué à l'IRISA au sein de l'équipe DREAM (Diagnostic, Recommandation d'Action, Modélisation).

Bibliographie :

-­- http://mondrian.pentaho.com/
-­- http://wiki.spatialytics.org/doku.php?id=projects:geomondrian
-­- Taher Omran Ahmed. 2008. Spatial On-­-line Analytical Processing (SOLAP): Overview and Current Trends. In Proceedings of the 2008 International Conference on Advanced Computer Theory and Engineering (ICACTE '08). IEEE Computer Society, Washington, DC, USA, 1095-­-1099.

Mots cles : Entrepôt de données spatiales, modèle multidimensionnel et temporel, SIG, OLAP & SOLAP

Contacts : Tassadit Bouadi, René Quiniou, Marie-Odile Cordier
Équipe : IRISA – Équipe DREAM
Mail : tassadit.bouadi@irisa.fr, rene.quiniou@inria.fr, marie-odile.cordier@irisa.fr



Ce site est maintenu par René Quiniou au moyen du système Weave
développé au sein du projet Caravel : http://www-caravel.inria.fr.
Dernière modification : 07-10-2011 09:54:25