Reconnaissance de l'interprète d'un enregistrement musical
Niveau: Master 2 Recherche
Mots-clés: musique, classification, clustering, descripteurs haut-niveau, transcription symbolique, timbre
Responsable : Emmanuel Vincent
Mail : emmanuel.vincent@irisa.fr
Tél : 02 99 84 22 69
Description:
La taille importante des bases de données d'enregistrements musicaux (ITunes, SACEM, collections personnelles) impose de disposer d'algorithmes de classification automatique afin de pouvoir les organiser rapidement et parcourir leur contenu de façon plus intuitive. Plusieurs tâches de classification, comme la reconnaissance du genre musical, de la mélodie, du compositeur et de l'interprète, ainsi que l'identification d'enregistrements similaires ou de reprises font l'objet d'une évaluation annuelle [1].
Les algorithmes existants reposent sur des descripteurs bas-niveau, comme les coefficients cepstraux en échelle Mel (MFCCs) [2], qui représentent un enregistrement comme un tout non structuré. Malgré l'usage de techniques d'apprentissage évoluées, leur performance reste nettement inférieure à celle d'un humain. Une meilleure performance peut être obtenue en utilisant des descripteurs haut-niveau extraits d'une transcription symbolique (partition musicale, MIDI) [3]. La transcription exacte n'est généralement pas disponible, mais des avancées récentes en traitement du signal permettent d'effectuer une transcription automatique approchée [4]. L'enregistrement est alors reprsenté comme un ensemble de notes, chacune définie par sa hauteur, ses instants de début et de fin et un ensemble de paramètres liés à son timbre.
L'objectif du stage est de mettre en oeuvre et d'évaluer un algorithme de reconnaissance de l'interprète d'un enregistrement à partir d'une transcription symbolique fournie par un logiciel développé dans l'équipe [4]. On s'inspirera pour cela de la liste de descripteurs haut-niveau proposée dans [3]. Les descripteurs de rythme, puissance, hauteur, mélodie et accords pourront être directement calculés sur cette transcription. Les descripteurs de timbre vocal et instrumental pourront aussi être calculés en séparant les notes en différentes classes de timbre par clustering. La performance sera évaluée sur la base de données artist20 [5].
Bibliographie:
[1] http://www.music-ir.org/mirexwiki
[2] MI Mandel and DPW Ellis. Song-level features and SVMs for music classification.
[3] C McKay. Automatic genre classification of MIDI recordings. M.A. Thesis, McGill University, Canada, 2004.
[4] E Vincent. Two nonnegative matrix factorization methods for polyphonic pitch transcription. In Proc. Music Information Retrieval Evaluation eXchange (MIREX), 2007.
[5] http://labrosa.ee.columbia.edu/projects/artistid/