UE APM_53670_EP | Catalogue 2025-2026

Descriptif

**Contenu:** e cours est une introduction à l'apprentissage par renforcement orientée vers les mathématiques. L'objectif est de présenter les fondements de l'apprentissage par renforcement afin que les étudiants soient capables de lire et d'appliquer des articles de recherche. L'accent sera mis sur les mathématiques sous-jacentes afin de faciliter la compréhension de l'heuristique des algorithmes.

21 heures en présentiel

Diplôme(s) concerné(s)

M2 MSV - Mathématiques pour les Sciences du Vivant

Format des notes

Numérique sur 20

Programme détaillé

**Syllabus:** - Sequential Decisions, MDP and Policies - Operations Research: Prediction and Planning - Reinforcement Learning: Prediction and Planning in the Tabular Setting - Reinforcement Learning: Advanced Techniques in the Tabular Setting - Reinforcement Learning: Approximation of the Value Functions - Reinforcement Learning: Policy Approach