Une empreinte audio à base d’ALISP appliquée à l’identification audio dans un flux radiophonique - Télécom Paris Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Une empreinte audio à base d’ALISP appliquée à l’identification audio dans un flux radiophonique

Résumé

Cet article présente un système d’identification audio pour détecter et identifier des publicités et des morceaux de musique dans les flux radiophoniques en utilisant des unités acoustiques. Ces unités, nommées ALISP (Automatic Language Independent Speech Processing), sont apprises de manière entièrement automatique grâce à la décomposition temporelle, la quantification vectorielle et des modèles HMM. L’originalité de l’approche est qu’aucune transcription n’est utilisée pour apprendre les modèles HMM. Pour identifier des morceaux de musique et les publicités, les transcriptions ALISP des morceaux de référence sont comparées aux transcriptions du flux radiophonique de test en utilisant la distance de Levenshtein. Pour l’identification des publicités, nous obtenons un taux de précision de 99% et un taux de rappel de 94% pour un flux de test contenant 4401 publicités. Pour l’identification de morceaux de musique nous obtenons un taux de précision de 100% et un taux de rappel de 95% sur un flux de test contenant 505 morceaux de musique.
Fichier non déposé

Dates et versions

hal-02286467 , version 1 (13-09-2019)

Identifiants

  • HAL Id : hal-02286467 , version 1

Citer

Houssem Khemiri, Dijana Petrovska-Delacrétaz, Gérard Chollet. Une empreinte audio à base d’ALISP appliquée à l’identification audio dans un flux radiophonique. COmpression et REprésentation des Signaux Audiovisuels, May 2012, Lille, France. pp.139-144. ⟨hal-02286467⟩
46 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More