Course Outline

Invoering

Reinforcement Learning Basisprincipes

Basis Reinforcement Learning Technieken

Inleiding tot JUTE

Convergentie van waarde en beleidsiteratie

Beloning vormgeven

Verkenning

Generalisatie

Gedeeltelijk waarneembare MDP's

Opties

Logistiek

TD Lambda

Beleidsgradiënten

Diepe Q-Learning

Onderwerpen in de speltheorie

Samenvatting en volgende stappen

Requirements

  • Vaardigheid in Python
  • Een goed begrip van college-calculus en lineaire algebra
  • Basiskennis van waarschijnlijkheid en Statistics
  • Ervaar het maken van machine learning-modellen in Python en Numpy

Publiek

  • Ontwikkelaars
  • Datawetenschappers
  21 Hours
 

Related Courses

Related Categories