Cursusaanbod
Inleiding tot Reinforcement Learning en Agentele AI
- Besluitvorming onder onzekerheid en sequentiële planning
- Belangrijkste componenten van RL: agenten, omgevingen, toestanden en beloningen
- Rol van RL in adapteerbare en agentele AI-systemen
Markov Decision Processes (MDPs)
- Formele definitie en eigenschappen van MDPs
- Waardefuncties, Bellman-vergelijkingen en dynamische programmering
- Beleidsevaluatie, -verbetering en -iteratie
Model-Free Reinforcement Learning
- Monte Carlo- en Temporal-Difference (TD)-leren
- Q-learning en SARSA
- Praktijkopdracht: tabulaire RL-methoden implementeren in Python
Deep Reinforcement Learning
- Combinatie van neurale netwerken en RL voor functiebenadering
- Deep Q-Networks (DQN) en ervaringsoverdracht
- Actor-Critic-architecturen en beleidsgradiënten
- Praktijkopdracht: een agent trainen met DQN en PPO met Stable-Baselines3
Exploratiestrategieën en beloningvorming
- Balanceren van exploratie vs. exploitatie (ε-greedig, UCB, entropiemethoden)
- Beloningsfuncties ontwerpen en ongewenst gedrag voorkomen
- Beloningvorming en curriculumleer
Geavanceerde onderwerpen in RL en besluitvorming
- Multi-agent reinforcement learning en coöperatieve strategieën
- Hiërarchische reinforcement learning en optieskader
- Offline RL en imitatieleer voor veilige implementatie
Simuleringsomgevingen en evaluatie
- OpenAI Gym gebruiken en aangepaste omgevingen
- Continue vs. discreet actieruimte
- Metrieken voor agentprestaties, stabiliteit en steekproefefficiëntie
RL integreren in agentele AI-systemen
- Redenering en RL combineren in hybride agentarchitecturen
- Reinforcement learning combineren met toolgebruikende agenten
- Operatieve overwegingen voor schaling en implementatie
Afstudieproject
- Een reinforcement learning-agent ontwerpen en implementeren voor een gesimuleerde opdracht
- Trainingsevaluatie doorvoeren en hyperparameters optimaliseren
- Adaptief gedrag en besluitvorming in een agentele context demonstreren
Samenvatting en volgende stappen
Vereisten
- Sterke beheersing van Python-programmeren
- Solide begrip van machine learning en deep learning-concepten
- Vertrouwdheid met lineaire algebra, waarschijnlijkheidsrekening en basisoptimalisatiemethodes
Doelgroep
- Reinforcement learning-ingenieurs en toegepaste AI-onderzoekers
- Robotica- en automatisatieontwikkelaars
- Ingenieurs teams die werken aan adapteerbare en agentele AI-systemen
Leveringsopties
PRIVÉGROEPSTRAINING
Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.
- Pre-cursusgesprek met uw trainer
- Aanpassing van de leerervaring om uw doelen te bereiken -
- Op maat gemaakte overzichten
- Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
- Training gepland op een datum naar keuze
- Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen
Private Group Prices RRP from €9120 online delivery, based on a group of 2 delegates, €2880 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
OPENBARE TRAINING
Kijk op onze public courses
Reviews (3)
Goede mix van kennis en praktijk
Ion Mironescu - Facultatea S.A.I.A.P.M.
Cursus - Agentic AI for Enterprise Applications
Automatisch vertaald
De combinatie van theorie en praktijk, en van hoge- en lagenniveau perspectieven
Ion Mironescu - Facultatea S.A.I.A.P.M.
Cursus - Autonomous Decision-Making with Agentic AI
Automatisch vertaald
praktische oefeningen
Daniel - Facultatea S.A.I.A.P.M.
Cursus - Agentic AI in Multi-Agent Systems
Automatisch vertaald