Séminaire STATQAM: «Une introduction à l’apprentissage par renforcement sensible au risque avec des mesures de risque dynamiques»
Conférencier: Anthony Coache (Université de Toronto)
La plupart des approches d’apprentissage par renforcement, ou “reinforcement learning” (RL), cherchent à optimiser des récompenses actualisées pour un agent neutre face au risque. Bien qu’il existe des travaux sur l’apprentissage par renforcement sensible au risque, ils fournissent généralement des stratégies de pré-engagement optimales, sont adaptés à une mesure de risque spécifique, ou ne sont applicables qu’à de petits espaces état-action ou à d’autres contextes simplifiés. Dans cette présentation, nous explorons des mesures de risque dynamiques pour évaluer le risque d’une séquence de coûts, et proposons des algorithmes RL profonds où l’agent optimise une mesure de risque dynamique. Nous présentons ces approches RL sensibles au risque pour optimiser les stratégies et illustrons leur efficacité dans diverses applications. Travaux conjoints avec Sebastian Jaimungal et Álvaro Cartea.
Date / heure
Lieu
Montréal (QC)
Renseignements
- Geneviève Lefebvre
- lefebvre.gen@uqam.ca