Présentation de l'article RUDDER: Return Decomposition for Delayed Rewards écrit par Arjona-Medina, J. A. et al. dans le cadre du cours GLO-7030 Apprentissage par réseaux de neurones profonds donné à l'Université Laval. (~6 min)
Visionner sur YouTube
Télécharger les diapositives