Cursusaanbod
Inleiding tot Reinforcement Learning en Agentele AI
- Besluitvorming onder onzekerheid en sequentiële planning
- Belangrijkste componenten van RL: agenten, omgevingen, toestanden en beloningen
- Rol van RL in adapteerbare en agentele AI-systemen
Markov Decision Processes (MDPs)
- Formele definitie en eigenschappen van MDPs
- Waardefuncties, Bellman-vergelijkingen en dynamische programmering
- Beleidsevaluatie, -verbetering en -iteratie
Model-Free Reinforcement Learning
- Monte Carlo- en Temporal-Difference (TD)-leren
- Q-learning en SARSA
- Praktijkopdracht: tabulaire RL-methoden implementeren in Python
Deep Reinforcement Learning
- Combinatie van neurale netwerken en RL voor functiebenadering
- Deep Q-Networks (DQN) en ervaringsoverdracht
- Actor-Critic-architecturen en beleidsgradiënten
- Praktijkopdracht: een agent trainen met DQN en PPO met Stable-Baselines3
Exploratiestrategieën en beloningvorming
- Balanceren van exploratie vs. exploitatie (ε-greedig, UCB, entropiemethoden)
- Beloningsfuncties ontwerpen en ongewenst gedrag voorkomen
- Beloningvorming en curriculumleer
Geavanceerde onderwerpen in RL en besluitvorming
- Multi-agent reinforcement learning en coöperatieve strategieën
- Hiërarchische reinforcement learning en optieskader
- Offline RL en imitatieleer voor veilige implementatie
Simuleringsomgevingen en evaluatie
- OpenAI Gym gebruiken en aangepaste omgevingen
- Continue vs. discreet actieruimte
- Metrieken voor agentprestaties, stabiliteit en steekproefefficiëntie
RL integreren in agentele AI-systemen
- Redenering en RL combineren in hybride agentarchitecturen
- Reinforcement learning combineren met toolgebruikende agenten
- Operatieve overwegingen voor schaling en implementatie
Afstudieproject
- Een reinforcement learning-agent ontwerpen en implementeren voor een gesimuleerde opdracht
- Trainingsevaluatie doorvoeren en hyperparameters optimaliseren
- Adaptief gedrag en besluitvorming in een agentele context demonstreren
Samenvatting en volgende stappen
Vereisten
- Sterke beheersing van Python-programmeren
- Solide begrip van machine learning en deep learning-concepten
- Vertrouwdheid met lineaire algebra, waarschijnlijkheidsrekening en basisoptimalisatiemethodes
Doelgroep
- Reinforcement learning-ingenieurs en toegepaste AI-onderzoekers
- Robotica- en automatisatieontwikkelaars
- Ingenieurs teams die werken aan adapteerbare en agentele AI-systemen
Aangepaste bedrijfsopleiding
Opleidingsoplossingen ontworpen exclusief voor bedrijven.
- Aangepaste inhoud: We passen de syllabus en praktijkopdrachten aan naar de echte doelen en behoeften van uw project.
- Voor flexibel schema: Datums en tijden aangepast aan het rooster van uw team.
- Formaat: Online (live), In-company (bij uw kantoren) of Hybride.
Prijs per privégroep, online live training, startend vanaf 6400 € + BTW*
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
Reviews (3)
De trainer is geduldig en zeer behulpzaam. Hij kent het onderwerp goed.
CLIFFORD TABARES - Universal Leaf Philippines, Inc.
Cursus - Agentic AI for Business Automation: Use Cases & Integration
Automatisch vertaald
Goede mix van kennis en praktijk
Ion Mironescu - Facultatea S.A.I.A.P.M.
Cursus - Agentic AI for Enterprise Applications
Automatisch vertaald
De combinatie van theorie en praktijk, en van hoge- en lagenniveau perspectieven
Ion Mironescu - Facultatea S.A.I.A.P.M.
Cursus - Autonomous Decision-Making with Agentic AI
Automatisch vertaald