Une intuition sur RUDDER

Présentation de l'article RUDDER: Return Decomposition for Delayed Rewards écrit par Arjona-Medina, J. A. et al. dans le cadre du cours GLO-7030 Apprentissage par réseaux de neurones profonds donné à l'Université Laval. (~6 min)

Visionner sur YouTube
Télécharger les diapositives

Matériel lié à l’article de Arjona-Medina, J.A et al.

Version de l’article accepté à NeurIPS 2019
Annexe de l’article (64 pages + bibliographie)
Blog post des auteurs (5 min read + 20 min read)