Cursusaanbod
1. Inleiding tot Deep Reinforcement Learning
- Wat is Reinforcement Learning?
- Het verschil tussen Supervised, Unsupervised, en Reinforcement Learning
- Toepassingen van DRL in 2025 (robotica, gezondheidszorg, financiën, logistiek)
- Het begrijpen van de agent-milieu interactie-lus
2. Fundamentals van Reinforcement Learning
- Markov Decision Processes (MDP)
- Staat, actie, beloning, beleid, en waardefuncties
- De afweging tussen exploratie en exploitatie
- Monte Carlo methoden en Temporal-Difference (TD) learning
3. Basale RL-algoritmes implementeren
- Tabulaire methoden: Dynamic Programming, beleidsbeoordeling, en iteratie
- Q-Learning en SARSA
- Epsilon-greedy exploratie en afnemende strategieën
- RL-omgevingen implementeren met OpenAI Gymnasium
4. Overgang naar Deep Reinforcement Learning
- Beperkingen van tabulaire methoden
- Het gebruiken van neurale netwerken voor functie-approximatie
- Deep Q-Network (DQN) architectuur en workflow
- Ervaringsherhaling en doelnetwerken
5. Geavanceerde DRL-algoritmes
- Double DQN, Dueling DQN, en Prioritized Experience Replay
- Beleid-gradient methoden: REINFORCE algoritme
- Actor-Critic architecturen (A2C, A3C)
- Proximal Policy Optimization (PPO)
- Soft Actor-Critic (SAC)
6. Werken met continue actie-ruimtes
- Uitdagingen in continue controle
- Het gebruiken van DDPG (Deep Deterministic Policy Gradient)
- Twin Delayed DDPG (TD3)
7. Praktische tools en frameworks
- Het gebruiken van Stable-Baselines3 en Ray RLlib
- Loggen en monitoren met TensorBoard
- Hyperparameter tuning voor DRL-modellen
8. Beloning Engineering en milieu-ontwerp
- Beloning vormgeven en straf balanceren
- Sim-to-real transfer learning concepten
- Aangepaste omgevingen maken in Gymnasium
9. Deelbaar waargenomen omgevingen en generalisatie
- Onvoldoende staat informatie verwerken (POMDPs)
- Geheugengebaseerde benaderingen met behulp van LSTMs en RNNs
- De robuustheid van agenten en generalisatie verbeteren
10. Game Theory en Multi-Agent Reinforcement Learning
- Inleiding tot multi-agent omgevingen
- Samenwerking vs. competitie
- Toepassingen in tegenovergestelde training en strategie optimalisatie
11. Casusstudies en praktische toepassingen
- Simulaties van autonome voertuigen
- Dynamische prijsstelling en financiële handelsstrategieën
- Robotica en industriële automatisering
12. Probleemoplossing en optimalisatie
- Instabiel trainen diagnosticeren
- Beloning schaarste en overfitting beheren
- DRL-modellen schalen op GPUs en gedistribueerde systemen
13. Samenvatting en volgende stappen
- Samenvatting van DRL-architectuur en sleutelalgoritmen
- Industrie-trends en onderzoek richtingen (bijv. RLHF, hybride modellen)
- Verdere bronnen en leesmateriaal
Vereisten
- Vaardigheid in Python-programmeren
- Begrip van Calculus en Lineaire Algebra
- Basiswetenschap van Kansrekening en Statistiek
- Ervaring in het bouwen van machine learning-modellen met Python en NumPy of TensorFlow/PyTorch
Publiek
- Ontwikkelaars geïnteresseerd in AI en intelligente systemen
- Datawetenschappers die versterkingsleer-frameworks verkennen
- Machine Learning Engineers die werken met autonome systemen
Leveringsopties
PRIVÉGROEPSTRAINING
Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.
- Pre-cursusgesprek met uw trainer
- Aanpassing van de leerervaring om uw doelen te bereiken -
- Op maat gemaakte overzichten
- Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
- Training gepland op een datum naar keuze
- Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen
Private Group Prices RRP from €6840 online delivery, based on a group of 2 delegates, €2160 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
OPENBARE TRAINING
Kijk op onze public courses
Reviews (5)
Hunter is fantastisch, zeer boeiend, uiterst deskundig en knap. Heel goed gedaan.
Rick Johnson - Laramie County Community College
Cursus - Artificial Intelligence (AI) Overview
Automatisch vertaald
Very flexible.
Frank Ueltzhoffer
Cursus - Artificial Neural Networks, Machine Learning and Deep Thinking
Automatisch vertaald
I liked the new insights in deep machine learning.
Josip Arneric
Cursus - Neural Network in R
Automatisch vertaald
Ann created a great environment to ask questions and learn. We had a lot of fun and also learned a lot at the same time.
Gudrun Bickelq
Cursus - Introduction to the use of neural networks
Automatisch vertaald
It was very interactive and more relaxed and informal than expected. We covered lots of topics in the time and the trainer was always receptive to talking more in detail or more generally about the topics and how they were related. I feel the training has given me the tools to continue learning as opposed to it being a one off session where learning stops once you've finished which is very important given the scale and complexity of the topic.
Jonathan Blease
Cursus - Artificial Neural Networks, Machine Learning, Deep Thinking
Automatisch vertaald