Descriptif
Natural language processing has given rise to innumerable industrial applications. While many new tasks have emerged in NLP and speech processing over the last decades, methods to solve them have increasingly converged towards a unified modeling paradigm. In this course, we will use large-scale generative models and sequence-to-sequence modeling to delve into state-of-the-art statistical machine learning methods and apply them to major NLP and speech processing tasks — language modeling, machine translation, speech recognition, information extraction. Students should expect to get an in-depth understanding of these methods, through theoretical analysis and hands-on lab sessions. Grading will involve a project, to be carried out over the course of the class. Topics to be covered:
1. Language Modeling
2. Speech to Text
3. Extracting Structured Information from Text
4. Machine Translation
5. Code Generation
Objectifs pédagogiques
Acquis d'apprentissageÀ l'issue de l'UE, l'élève sera capable de:
- Concevoir une solution à un problème de NLP ou traitement de la parole à l'aide d'outils de l'état de l'art, et concevoir son évaluation
- Analyser et critiquer un système de NLP ou traitement de la parole, sur le plan technique et scientifique
- Décrire et défendre sur le plan scientifique une solution technique dans un exposé oral et un rapport écrit
Compétences de rattachement (et justification)
- BC5.2 – Concevoir un système de traitement de données, d’intelligence artificielle, d’apprentissage machine dans un objectif d’aide à la décision ou de recherche automatique d’information; Justification : Les étudiants réalisent un projet d'application dont l'objet est précisément la conception d'un système de NLP ou traitement de la parole, pour résoudre un problème typique de ce domaine.
- BC6.2 – S’appuyer sur la modélisation mathématique pour évaluer les performances et les limites du système et de ses composants, de manière à mettre en évidence les facteurs de dimensionnement et d’architecture; Justification : Le projet des étudiants comporte un volet d'évaluation de leur propre solution. IA327 demande aux étudiants d'être critiques vis-à-vis des critères d'évaluation choisis, et il leur est demandé de justifier leurs choix et de faire preuve de rigueur.
- BC4.2 Documenter l’état de l’art se rapportant à un domaine spécifique des sciences du numérique dans au moins deux langues; Justification : Dans ce projet d'application et dans nos exigences, nous nous orientons aux standards internationaux de publication scientifique. Documenter l'état de l'art en fait naturellement partie.