v2.12.0 (512)

Cours scientifiques - APM_4AI04_TP : Analyse des signaux de musique et de parole : méthodes et applications

Descriptif

Ce cours propose de parcourir, depuis les bases méthodologiques et théoriques jusqu'aux applications, les domaines du traitement de la parole et des signaux audio-fréquences. Les signaux de parole et de musique sont un type de données disponibles en masse sur le web. Leur analyse est une étape primordiale à l'indexation, qui permet ensuite aux sites de réseaux sociaux d'organiser, d'agréger ces contenus. Les données de parole jouent également un rôle central dans les applications dites de speech analytics et d'interaction humain-machine (google voice, siri). Enfin, le traitement des signaux audio-fréquences donne lieu actuellement à de nombreux développements dont la plupart touchent notre vie quotidienne (musique, home studio, home cinema).

Objectifs pédagogiques

Acquis d'apprentissage
À l'issue de l'UE, l'élève sera capable de:
- Décrire les mécanismes de perception et de production de la parole
- Réaliser un système de synthèse et de reconnaissance automatique de la parole
- Contrôler indépendamment l’échelle temporelle et l’échelle fréquentielle d’un signal de parole ou de musique
- Identifier et mettre en œuvre une méthode de séparation de sources audio dans un contexte applicatif donné
- Décrire et mettre en œuvre des méthodes d’apprentissage profond pour l'audio


Compétences de rattachement (et justification)
- BC5.1 – Modéliser mathématiquement une situation, des données, des phénomènes physiques dans le contexte du numérique; Justification : L'UE amène les élèves à utiliser des modèles de signaux spécifiques à la parole et à la musique.
- BC5.2 – Concevoir un système de traitement de données, d’intelligence artificielle, d’apprentissage machine dans un objectif d’aide à la décision ou de recherche automatique d’information; Justification : L'UE amène les élèves à concevoir différents systèmes de traitement de données audio, dans le cadre de diverses applications à la parole et à la musique.

24 heures en présentiel

24 heures de travail personnel estimé pour l’étudiant.

Diplôme(s) concerné(s)

Parcours de rattachement

Format des notes

Numérique sur 20

Programme détaillé

- Perception et production de la parole

- Reconnaissance automatique de la parole : principe, fonctionnement et méthode de reconnaissance

- Synthèse de la parole

- Séparation de sources

- Modifications temporelles et spectrales

- NMF (Non-Negative Matrix Factorization) pour le traitement de signaux audio 

- l'apprentissage profond pour l'audio

 

 

 

Mots clés

traitement du signal audio, traitement des signaux musicaux, interactions vocales, traitement de la parole, apprentissage profond

Méthodes pédagogiques

Leçons, travaux dirigés, travaux pratiques
Veuillez patienter