Séminaire STATQAM: «Une introduction à l’apprentissage par renforcement sensible au risque avec des mesures de risque dynamiques»

Conférencier: Anthony Coache (Université de Toronto) 

La plupart des approches d’apprentissage par renforcement, ou “reinforcement learning” (RL), cherchent à optimiser des récompenses actualisées pour un agent neutre face au risque. Bien qu’il existe des travaux sur l’apprentissage par renforcement sensible au risque, ils fournissent généralement des stratégies de pré-engagement optimales, sont adaptés à une mesure de risque spécifique, ou ne sont applicables qu’à de petits espaces état-action ou à d’autres contextes simplifiés. Dans cette présentation, nous explorons des mesures de risque dynamiques pour évaluer le risque d’une séquence de coûts, et proposons des algorithmes RL profonds où l’agent optimise une mesure de risque dynamique. Nous présentons ces approches RL sensibles au risque pour optimiser les stratégies et illustrons leur efficacité dans diverses applications. Travaux conjoints avec Sebastian Jaimungal et Álvaro Cartea.

clockCreated with Sketch.Date / heure

jeudi 15 février 2024
15 h 30

pinCreated with Sketch.Lieu

UQAM - Pavillon Président-Kennedy (PK)
PK-5115
201, avenue du Président-Kennedy
Montréal (QC)

personCreated with Sketch.Renseignements

Groupes