Cursusaanbod

1. Inleiding tot Deep Reinforcement Learning

  • Wat is Reinforcement Learning?
  • Het verschil tussen Supervised, Unsupervised, en Reinforcement Learning
  • Toepassingen van DRL in 2025 (robotica, gezondheidszorg, financiën, logistiek)
  • Het begrijpen van de agent-milieu interactie-lus

2. Fundamentals van Reinforcement Learning

  • Markov Decision Processes (MDP)
  • Staat, actie, beloning, beleid, en waardefuncties
  • De afweging tussen exploratie en exploitatie
  • Monte Carlo methoden en Temporal-Difference (TD) learning

3. Basale RL-algoritmes implementeren

  • Tabulaire methoden: Dynamic Programming, beleidsbeoordeling, en iteratie
  • Q-Learning en SARSA
  • Epsilon-greedy exploratie en afnemende strategieën
  • RL-omgevingen implementeren met OpenAI Gymnasium

4. Overgang naar Deep Reinforcement Learning

  • Beperkingen van tabulaire methoden
  • Het gebruiken van neurale netwerken voor functie-approximatie
  • Deep Q-Network (DQN) architectuur en workflow
  • Ervaringsherhaling en doelnetwerken

5. Geavanceerde DRL-algoritmes

  • Double DQN, Dueling DQN, en Prioritized Experience Replay
  • Beleid-gradient methoden: REINFORCE algoritme
  • Actor-Critic architecturen (A2C, A3C)
  • Proximal Policy Optimization (PPO)
  • Soft Actor-Critic (SAC)

6. Werken met continue actie-ruimtes

  • Uitdagingen in continue controle
  • Het gebruiken van DDPG (Deep Deterministic Policy Gradient)
  • Twin Delayed DDPG (TD3)

7. Praktische tools en frameworks

  • Het gebruiken van Stable-Baselines3 en Ray RLlib
  • Loggen en monitoren met TensorBoard
  • Hyperparameter tuning voor DRL-modellen

8. Beloning Engineering en milieu-ontwerp

  • Beloning vormgeven en straf balanceren
  • Sim-to-real transfer learning concepten
  • Aangepaste omgevingen maken in Gymnasium

9. Deelbaar waargenomen omgevingen en generalisatie

  • Onvoldoende staat informatie verwerken (POMDPs)
  • Geheugengebaseerde benaderingen met behulp van LSTMs en RNNs
  • De robuustheid van agenten en generalisatie verbeteren

10. Game Theory en Multi-Agent Reinforcement Learning

  • Inleiding tot multi-agent omgevingen
  • Samenwerking vs. competitie
  • Toepassingen in tegenovergestelde training en strategie optimalisatie

11. Casusstudies en praktische toepassingen

  • Simulaties van autonome voertuigen
  • Dynamische prijsstelling en financiële handelsstrategieën
  • Robotica en industriële automatisering

12. Probleemoplossing en optimalisatie

  • Instabiel trainen diagnosticeren
  • Beloning schaarste en overfitting beheren
  • DRL-modellen schalen op GPUs en gedistribueerde systemen

13. Samenvatting en volgende stappen

  • Samenvatting van DRL-architectuur en sleutelalgoritmen
  • Industrie-trends en onderzoek richtingen (bijv. RLHF, hybride modellen)
  • Verdere bronnen en leesmateriaal

Vereisten

  • Vaardigheid in Python-programmeren
  • Begrip van Calculus en Lineaire Algebra
  • Basiswetenschap van Kansrekening en Statistiek
  • Ervaring in het bouwen van machine learning-modellen met Python en NumPy of TensorFlow/PyTorch

Publiek

  • Ontwikkelaars geïnteresseerd in AI en intelligente systemen
  • Datawetenschappers die versterkingsleer-frameworks verkennen
  • Machine Learning Engineers die werken met autonome systemen
 21 Uren

Leveringsopties

PRIVÉGROEPSTRAINING

Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.

  • Pre-cursusgesprek met uw trainer
  • Aanpassing van de leerervaring om uw doelen te bereiken -
    • Op maat gemaakte overzichten
    • Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
  • Training gepland op een datum naar keuze
  • Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen

Private Group Prices RRP from €6840 online delivery, based on a group of 2 delegates, €2160 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.

Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen


OPENBARE TRAINING

Kijk op onze public courses

Reviews (5)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën