Passer au contenu
  metiss  

Démonstrations

Document Actions

Démonstrations en ligne

Quelques démonstrations relatives aux travaux de recherche menés dans l'équipe METISS sont disponible sur le site de vulgarisation scientifique  http://interstices.info/

    • Reconnaissance du locuteur
    • Séparation de sources audio (en préparation)
    • Indexation automatique de documents audio  (en préparation)

Autres démonstrations

  • Performance measurement in Blind Audio Source Separation
  • Séparation de sources mono. Deux sources sont mélangées sur un seul canal (enregistrement mono). Pour les séparer, nous commençons par une phase d'apprentissage sur des exemples représentatifs des sources pour estimer les paramètres de modèles statistiques (mélanges de Gaussiennes modélisant les spectres de Fourier à court terme). La séparation est alors effectuée avec une méthode similaire à l'algorithme de réhaussement de parole d'Ephraim-Mallat et prend la forme d'un filtrage de Wiener adaptatif. L'exemple suivant correspond à un enregistrement de jazz dont les 45 premières secondes servent à entraîner un modèle à 32 Gaussiennes pour séparer les 15 dernières secondes.

  • Séparation de trois sources à partir d'un enregistrement stéréophonique. Trois sources sont mélangées (mélange linéaire instantané) sur deux canaux. Nous avons décomposé le mélange stéréo sur un dictionnaire d'atomes de Gabor stéréo à l'aide de l'algorithme de Matching Pursuit, puis chaque atome de la décomposition est affecté à une source en fonction de la différence d'intensité entre canaux. L'exemple suivant correspond à un mélange instantané artificiel d'un violoncelle, de percussions et d'un piano.
    • Voici par comparaison, ce que l'on obtiendrait au mieux avec une  séparation linéaire : source1, source2, source3.




Créé par gonon
Dernière modification 29.07.2009 09:52 PM