Modélisation probabiliste de suites d’accords pour l’analyse de contenus musicaux
Niveau: Master 2 Recherche
Responsables : Frédéric Bimbot et Emmanuel Vincent
Mail : frederic.bimbot@irisa.fr
Tél : 02 99 84 75 06
Avec le développement croissant
de l’audio sur Internet et des systèmes automatiques
d’analyse et de composition musicaux, la modélisation
statistique du langage musical présente un intérêt
accru. Ces approches sont en effet porteuses de nombreuses
applications pour l'analyse musicologique, la composition assistée
par ordinateur et la navigation dans les grandes bases de contenus
musicaux (type ITunes ou SheetMusicArchive).
Basé sur une pré-étude conduite pendant l’été 2008, le stage consiste à étudier et expérimenter le modèle dit de n-grammes, utilisé habituellement pour le langage écrit, sur des suites d'accords musicaux. Un volet des travaux portera sur la représentation des accords par un symbole dans un dictionnaire approprié. Un autre volet concernera le choix et la mise en œuvre de techniques de lissage des probabilités du modèle n-gramme, afin de modéliser des suites d’accords rares et d'éviter le sur-apprentissage. Une application de ces travaux consistera à établir un réseau de similarité sur un corpus de chansons.
Ce stage pourra déboucher sur
une proposition de thèse, dans laquelle on s’intéressera
à des modèles plus sophistiqués de dépendances
à long terme, utilisant des approches probabilistes plus
générales (champs de Markov, réseaux Bayésiens).
On étendra également l’étude à la
modélisation de données musicales complexes (partition
de structure 2D ou plus au lieu de suite d'accords). On envisagera la
combinaison des modèles de langage proposés avec des
modèles acoustiques développés dans l'équipe,
afin d’améliorer la qualité de la séparation
d’instruments et la retranscription de contenus sonores en
métadonnées symboliques.