Une intuition sur RUDDER

Présentation de l'article RUDDER: Return Decomposition for Delayed Rewards écrit par Arjona-Medina, J. A. et al. dans le cadre du cours GLO-7030 Apprentissage par réseaux de neurones profonds donné à l'Université Laval. (~6 min)

Visionner sur YouTube
Télécharger les diapositives

Matériel lié à l’article de Arjona-Medina, J.A et al.