Course Outline

Introductie

  • Leren door positieve bekrachtiging

Elements van Reinforcement Learning

Belangrijke termen (acties, staten, beloningen, beleid, waarde, Q-waarde, enz.)

Overzicht van methoden voor oplossingen in tabelvorm

Een softwareagent maken

Inzicht in op waarden gebaseerde, op beleid gebaseerde en modelgebaseerde benaderingen

Werken met het Markov Decision Process (MDP)

Hoe beleid de manier van handelen van een agent bepaalt

Monte Carlo-methoden gebruiken

Temporeel-Verschil Leren

n-stap Bootstrapping

Benaderingsmethoden voor oplossingen

Voorspelling op het beleid met benadering

Controle op het beleid met benadering

Off-policy Methoden met Approximatie

Inzicht in geschiktheidstraceringen

Methoden voor beleidsverloop gebruiken

Samenvatting en conclusie

Requirements

  • Ervaring met machinaal leren
  • Programming ervaring

Publiek

  • Datawetenschappers
  21 Hours
 

Related Courses

AI and Robotics for Nuclear - Extended

  120 Hours

AI and Robotics for Nuclear

  80 Hours

Related Categories