Descriptif
Ce cours propose de parcourir, depuis les bases méthodologiques et théoriques jusqu'aux applications, les domaines du traitement de la parole et des signaux audio-fréquences. Les signaux de parole et de musique sont un type de données disponibles en masse sur le web. Leur analyse est une étape primordiale à l'indexation, qui permet ensuite aux sites de réseaux sociaux d'organiser, d'agréger ces contenus. Les données de parole jouent également un rôle central dans les applications dites de speech analytics et d'interaction humain-machine (google voice, siri). Enfin, le traitement des signaux audio-fréquences donne lieu actuellement à de nombreux développements dont la plupart touchent notre vie quotidienne (musique, home studio, home cinema).Objectifs pédagogiques
Acquis d'apprentissage À l'issue de l'UE, l'élève sera capable de: \- Décrire les mécanismes de perception et de production de la parole \- Réaliser un système de synthèse et de reconnaissance automatique de la parole \- Contrôler indépendamment l’échelle temporelle et l’échelle fréquentielle d’un signal de parole ou de musique \- Identifier et mettre en œuvre une méthode de séparation de sources audio dans un contexte applicatif donné \- Décrire et mettre en œuvre des méthodes d’apprentissage profond pour l'audio Compétences de rattachement (et justification) \- BC5.1 – Modéliser mathématiquement une situation, des données, des phénomènes physiques dans le contexte du numérique; Justification : L'UE amène les élèves à utiliser des modèles de signaux spécifiques à la parole et à la musique. \- BC5.2 – Concevoir un système de traitement de données, d’intelligence artificielle, d’apprentissage machine dans un objectif d’aide à la décision ou de recherche automatique d’information; Justification : L'UE amène les élèves à concevoir différents systèmes de traitement de données audio, dans le cadre de diverses applications à la parole et à la musique.
24 heures en présentiel
24 heures de travail personnel estimé pour l’étudiant.