Cursusaanbod
1. Inleiding tot Deep Reinforcement Learning
- Wat is Reinforcement Learning?
- Het verschil tussen Supervised, Unsupervised, en Reinforcement Learning
- Toepassingen van DRL in 2025 (robotica, gezondheidszorg, financiën, logistiek)
- Het begrijpen van de agent-milieu interactie-lus
2. Fundamentals van Reinforcement Learning
- Markov Decision Processes (MDP)
- Staat, actie, beloning, beleid, en waardefuncties
- De afweging tussen exploratie en exploitatie
- Monte Carlo methoden en Temporal-Difference (TD) learning
3. Basale RL-algoritmes implementeren
- Tabulaire methoden: Dynamic Programming, beleidsbeoordeling, en iteratie
- Q-Learning en SARSA
- Epsilon-greedy exploratie en afnemende strategieën
- RL-omgevingen implementeren met OpenAI Gymnasium
4. Overgang naar Deep Reinforcement Learning
- Beperkingen van tabulaire methoden
- Het gebruiken van neurale netwerken voor functie-approximatie
- Deep Q-Network (DQN) architectuur en workflow
- Ervaringsherhaling en doelnetwerken
5. Geavanceerde DRL-algoritmes
- Double DQN, Dueling DQN, en Prioritized Experience Replay
- Beleid-gradient methoden: REINFORCE algoritme
- Actor-Critic architecturen (A2C, A3C)
- Proximal Policy Optimization (PPO)
- Soft Actor-Critic (SAC)
6. Werken met continue actie-ruimtes
- Uitdagingen in continue controle
- Het gebruiken van DDPG (Deep Deterministic Policy Gradient)
- Twin Delayed DDPG (TD3)
7. Praktische tools en frameworks
- Het gebruiken van Stable-Baselines3 en Ray RLlib
- Loggen en monitoren met TensorBoard
- Hyperparameter tuning voor DRL-modellen
8. Beloning Engineering en milieu-ontwerp
- Beloning vormgeven en straf balanceren
- Sim-to-real transfer learning concepten
- Aangepaste omgevingen maken in Gymnasium
9. Deelbaar waargenomen omgevingen en generalisatie
- Onvoldoende staat informatie verwerken (POMDPs)
- Geheugengebaseerde benaderingen met behulp van LSTMs en RNNs
- De robuustheid van agenten en generalisatie verbeteren
10. Game Theory en Multi-Agent Reinforcement Learning
- Inleiding tot multi-agent omgevingen
- Samenwerking vs. competitie
- Toepassingen in tegenovergestelde training en strategie optimalisatie
11. Casusstudies en praktische toepassingen
- Simulaties van autonome voertuigen
- Dynamische prijsstelling en financiële handelsstrategieën
- Robotica en industriële automatisering
12. Probleemoplossing en optimalisatie
- Instabiel trainen diagnosticeren
- Beloning schaarste en overfitting beheren
- DRL-modellen schalen op GPUs en gedistribueerde systemen
13. Samenvatting en volgende stappen
- Samenvatting van DRL-architectuur en sleutelalgoritmen
- Industrie-trends en onderzoek richtingen (bijv. RLHF, hybride modellen)
- Verdere bronnen en leesmateriaal
Vereisten
- Vaardigheid in Python-programmeren
- Begrip van Calculus en Lineaire Algebra
- Basiswetenschap van Kansrekening en Statistiek
- Ervaring in het bouwen van machine learning-modellen met Python en NumPy of TensorFlow/PyTorch
Publiek
- Ontwikkelaars geïnteresseerd in AI en intelligente systemen
- Datawetenschappers die versterkingsleer-frameworks verkennen
- Machine Learning Engineers die werken met autonome systemen
Aangepaste bedrijfsopleiding
Opleidingsoplossingen ontworpen exclusief voor bedrijven.
- Aangepaste inhoud: We passen de syllabus en praktijkopdrachten aan naar de echte doelen en behoeften van uw project.
- Voor flexibel schema: Datums en tijden aangepast aan het rooster van uw team.
- Formaat: Online (live), In-company (bij uw kantoren) of Hybride.
Prijs per privégroep, online live training, startend vanaf 4800 € + BTW*
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
Reviews (3)
Ik vond het echt leuk hoe we aan het einde de tijd namen om te experimenteren met CHAT GPT. De ruimte was hier niet ideaal voor ingericht - in plaats van één grote tafel zouden een paar kleinere tafels handig geweest zijn, zodat we in kleine groepjes konden brainstormen.
Nola - Laramie County Community College
Cursus - Artificial Intelligence (AI) Overview
Automatisch vertaald
Werken op basis van eerste principes op een gefocuste manier, en overgaan naar het toepassen van casestudies binnen dezelfde dag
Maggie Webb - Department of Jobs, Regions, and Precincts
Cursus - Artificial Neural Networks, Machine Learning, Deep Thinking
Automatisch vertaald
Dat het echte bedrijfsgegevens gebruikte. De trainer had een zeer goede benadering door de deelnemers te laten meedoen en tegen elkaar aan treden
Jimena Esquivel - Zaklad Uslugowy Hakoman Andrzej Cybulski
Cursus - Applied AI from Scratch in Python
Automatisch vertaald