Content Based Image Retrieval, Classification, SIFT, SVM, Random Forest, Clustering
La quantité de données stockée ne cesse de croître et notamment les images par le biais des nombreux sites de partage d'images (tels que Flickr par exemple). Face à cette quantité croissante d'images, il est devient indispensable de pouvoir retrouver les images intéressantes. Nous nous intéressons ici à la classification d'images basée sur le contenu. Différentes approches sont possibles pour effectuer une telle classification, nous nous concentrons sur l'approche, la plus performante actuellement, utilisant les SIFT (Scale Invariant Feature Transform) (Lowe, 1999) qui sont des vecteurs locaux invariants à la translation, au changement d'échelle, à la rotation et partiellement au changement d'illumination, transformation affine ou projection. Le nombre de SIFTs obtenus peut être relativement important (surtout dans le cas de grandes bases de données d'images). L'étape suivante consiste donc à effectuer un clustering pour regrouper les SIFTs semblables et calculer la distribution des SIFTs de chaque image dans les différents clusters. C'est à partir de cette distribution que sera ensuite faite la classification d'images à proprement parler en utilisant un algorithme de classification (par exemple un algorithme de SVM (Support Vector Machine) (Vapnik, 1995) ou de forêt aléatoire (Breiman, 2001)).
Les différentes étapes du processus imposent des choix qui vont bien entendu, influer sur la qualité des résultats obtenus. Le but est d'évaluer les répercussions des différents choix faits au cours de ce processus de classification d'images en ce qui concerne la précision de l'algorithme de classification et le coût de calcul global. On s'intéressera particulièrement aux différentes possibilités concernant :
Par ailleurs le processus de classification étant relativement coûteux en temps d'exécution pour les grands ensembles de données, on pourra aussi s'intéresser à la parallélisation du processus global ou de certaines de ses étapes (Poulet et al, 2009) en tirant partie de l'architecture parallèle des cartes graphiques actuellement disponibles (GP-GPU, General Purpose Computation using Graphics Hardware, cf. http://www.gpgpu.org/sc2007/).
La validation se fera sur des ensembles de données d'images tels que le "Dataset of 3D object categories" (Savarese & Fei Fei, 2007) ou ImageNet (Deng et al, 2009)