Cursusaanbod

Inleiding tot Reinforcement Learning en Agentele AI

  • Besluitvorming onder onzekerheid en sequentiële planning
  • Belangrijkste componenten van RL: agenten, omgevingen, toestanden en beloningen
  • Rol van RL in adapteerbare en agentele AI-systemen

Markov Decision Processes (MDPs)

  • Formele definitie en eigenschappen van MDPs
  • Waardefuncties, Bellman-vergelijkingen en dynamische programmering
  • Beleidsevaluatie, -verbetering en -iteratie

Model-Free Reinforcement Learning

  • Monte Carlo- en Temporal-Difference (TD)-leren
  • Q-learning en SARSA
  • Praktijkopdracht: tabulaire RL-methoden implementeren in Python

Deep Reinforcement Learning

  • Combinatie van neurale netwerken en RL voor functiebenadering
  • Deep Q-Networks (DQN) en ervaringsoverdracht
  • Actor-Critic-architecturen en beleidsgradiënten
  • Praktijkopdracht: een agent trainen met DQN en PPO met Stable-Baselines3

Exploratiestrategieën en beloningvorming

  • Balanceren van exploratie vs. exploitatie (ε-greedig, UCB, entropiemethoden)
  • Beloningsfuncties ontwerpen en ongewenst gedrag voorkomen
  • Beloningvorming en curriculumleer

Geavanceerde onderwerpen in RL en besluitvorming

  • Multi-agent reinforcement learning en coöperatieve strategieën
  • Hiërarchische reinforcement learning en optieskader
  • Offline RL en imitatieleer voor veilige implementatie

Simuleringsomgevingen en evaluatie

  • OpenAI Gym gebruiken en aangepaste omgevingen
  • Continue vs. discreet actieruimte
  • Metrieken voor agentprestaties, stabiliteit en steekproefefficiëntie

RL integreren in agentele AI-systemen

  • Redenering en RL combineren in hybride agentarchitecturen
  • Reinforcement learning combineren met toolgebruikende agenten
  • Operatieve overwegingen voor schaling en implementatie

Afstudieproject

  • Een reinforcement learning-agent ontwerpen en implementeren voor een gesimuleerde opdracht
  • Trainingsevaluatie doorvoeren en hyperparameters optimaliseren
  • Adaptief gedrag en besluitvorming in een agentele context demonstreren

Samenvatting en volgende stappen

Vereisten

  • Sterke beheersing van Python-programmeren
  • Solide begrip van machine learning en deep learning-concepten
  • Vertrouwdheid met lineaire algebra, waarschijnlijkheidsrekening en basisoptimalisatiemethodes

Doelgroep

  • Reinforcement learning-ingenieurs en toegepaste AI-onderzoekers
  • Robotica- en automatisatieontwikkelaars
  • Ingenieurs teams die werken aan adapteerbare en agentele AI-systemen
 28 uren

Leveringsopties

PRIVÉGROEPSTRAINING

Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.

  • Pre-cursusgesprek met uw trainer
  • Aanpassing van de leerervaring om uw doelen te bereiken -
    • Op maat gemaakte overzichten
    • Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
  • Training gepland op een datum naar keuze
  • Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen

Private Group Prices RRP from €9120 online delivery, based on a group of 2 delegates, €2880 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.

Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen


OPENBARE TRAINING

Kijk op onze public courses

Reviews (3)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën