Reinforcement Learning voor AI-Agenten Training Cursus
Reinforcement Learning (RL) is een steunpilaar van de moderne AI-onderzoek en toepassingen. Het richt zich op het trainen van agents om optimale beslissingen te nemen in dynamische, meerstapsomgevingen.
Deze door een instructeur geleide, live training (online of op locatie) is bedoeld voor geavanceerde AI-professionals die de technieken van reinforcement learning willen meesteren en deze willen implementeren voor het trainen van AI-agents om complexe problemen op te lossen.
Na voltooiing van deze training zullen de deelnemers in staat zijn:
- De kernprincipes van reinforcement learning en Markov Decision Processes (MDPs) te begrijpen.
- RL-algoritmen zoals Q-Learning, SARSA en Deep Q-Networks (DQN) te ontwerpen en te implementeren.
- Frameworks zoals OpenAI Gym en RL-bibliotheken te gebruiken voor praktische toepassingen.
- AI-agents te trainen om real-world, meerstapsbeslissingsproblemen op te lossen.
- Uitdagingen zoals de exploratie-exploitatie-compromis en convergentie in RL-training aan te pakken.
Opzet van de cursus
- Interactieve lezing en discussie.
- Veel oefeningen en praktijk.
- Hands-on implementatie in een live-labomgeving.
Aanpassingsopties voor de cursus
- Om een aangepaste training voor deze cursus aan te vragen, neem dan contact met ons op om dit te regelen.
Cursusaanbod
Inleiding tot Versterkingsleer
- Overzicht van versterkingsleer en haar toepassingen
- Verschillen tussen begeleid, onbegeleid en versterkingsleer
- Belangrijke concepten: agent, omgeving, beloningen en beleid
Markov Decision Processes (MDPs)
- Begrip van staten, acties, beloningen en toestandsoverschakelingen
- Waardefuncties en de Bellman-vergelijking
- Dynamisch programmeren voor het oplossen van MDPs
Kern RL Algorithmen
- Tabellarische methoden: Q-Learning en SARSA
- Beleidsgebaseerde methoden: REINFORCE algoritme
- Actor-Critic kader en hun toepassingen
Deep Reinforcement Learning
- Inleiding tot Deep Q-Networks (DQN)
- Ervaringsherhaling en doelnetwerken
- Beleidgradiënten en geavanceerde diepe RL-methoden
RL Frameworks en Tools
- Inleiding tot OpenAI Gym en andere RL-omgevingen
- Gebruik van PyTorch of TensorFlow voor RL-modelontwikkeling
- Trainen, testen en benchmarken van RL-agenten
Uitdagingen in RL
- Balanceren van exploratie en exploitatie tijdens het trainen
- Omgaan met schaarse beloningen en credittoewijzingsproblemen
- Schaalbaarheid en rekenkrachtige uitdagingen in RL
Praktijkactiviteiten
- Implementeren van Q-Learning en SARSA algoritmen vanaf de grond
- Trainen van een DQN-gebaseerde agent om een eenvoudig spel te spelen in OpenAI Gym
- Fijnafstellen van RL-modellen voor verbeterde prestaties in aangepaste omgevingen
Samenvatting en volgende stappen
Vereisten
- Sterke kennis van machine learning principes en algoritmen
- Vaardigheid in Python-programmeren
- Kennis van neurale netwerken en deep learning frameworks
Publiek
- Machine learning engineers
- AI-specialisten
Leveringsopties
PRIVÉGROEPSTRAINING
Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.
- Pre-cursusgesprek met uw trainer
- Aanpassing van de leerervaring om uw doelen te bereiken -
- Op maat gemaakte overzichten
- Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
- Training gepland op een datum naar keuze
- Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen
Private Group Prices RRP from €4560 online delivery, based on a group of 2 delegates, €1440 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
OPENBARE TRAINING
Kijk op onze public courses
Hulp nodig bij het kiezen van de juiste cursus?
Reinforcement Learning voor AI-Agenten Training Cursus - Navraag
Reinforcement Learning voor AI-Agenten - Consultancyaanvraag
Consultancyaanvraag
Voorlopige Aankomende Cursussen
Gerelateerde cursussen
Agentic Development with Gemini 3 en Google Antigravity
21 UrenGoogle Antigravity is een ontwikkelomgeving voor agente development die bedoeld is om autonome agenten te bouwen die in staat zijn tot plannen, redeneren, coderen en handelen met de multimodale mogelijkheden van Gemini 3.
Deze instructiegeleide live training (online of ter plekke) is gericht op geavanceerde technische professionals die willen ontwerpen, bouwen en implementeren autonome agenten met Gemini 3 en de Antigravity omgeving.
Na het voltooien van deze training zijn de deelnemers voorbereid op:
- Autonome workflows bouwen die Gemini 3 gebruiken voor redeneren, plannen en uitvoeren.
- Agenten in Antigravity ontwikkelen die taken kunnen analyseren, code schrijven en interactie hebben met tools.
- Gemini-geïmplementeerde agenten integreren met enterprise systemen en APIs.
- Agentengedrag, veiligheid en betrouwbaarheid optimaliseren in complexe omgevingen.
Format van de cursus
- Expertdemonstraties gecombineerd met interactieve discussies.
- Handson experimenten met autonome agent development.
- Praktische implementatie met Antigravity, Gemini 3 en ondersteunende cloud tools.
Aanpassingsmogelijkheden van de cursus
- Als uw team specifieke domeingerelateerd gedrag of aangepaste integraties nodig heeft, neem dan contact met ons op om het programma aan te passen.
Geavanceerd Antigravity: Feedbacklussen, Leren & Langdurig Agentengeheugen
14 UrenGoogle Antigravity is een geavanceerde framework voor experimenten met langdurige agenten en emergente interactieve gedragingen.
Deze instructeurgeleide, live training (online of ter plaatse) is gericht op geavanceerde professionals die willen ontwerpen, analyseren en optimaliseren van agenten die in staat zijn herinneringen vast te houden, zich te verbeteren via feedback en te evolueren over langere tijdsperiodes.
Na het volgen van deze cursus zullen de deelnemers de vaardigheden verwerven om:
- Langdurige geheugensstructuren voor agentenpersistentie te ontwerpen.
- Effectieve feedbacklussen te implementeren om het gedrag van agenten te vormgeven.
- Leertrajecten en modeldrift te evalueren.
- Geheugenmechanismen in complexe multi-agentensystemen te integreren.
Cursusopzet
- Expertgeleide discussies in combinatie met technische demonstraties.
- Handson exploratie door middel van gestructureerde ontwerpuitdagingen.
- Toepassing van concepten in gesimuleerde agentenomgevingen.
Cursusaanpassingsmogelijkheden
- Als uw organisatie aangepaste inhoud of gevalsspecifieke voorbeelden vereist, neem dan contact met ons op om deze training aan te passen.
Geavanceerde Mastra Integraties: APIs, Tools, Bedrijfsgegevens en Externe Systemen
21 UrenMastra is een framework dat diepe integratie ondersteunt tussen AI-agents, APIs, bedrijfsapplicaties en externe gegevenssystemen.
Deze door een instructeur geleide, live training (online of ter plekke) is gericht op middelbare ingenieurs die betrouwbare, veilige en schaalbare integraties willen bouwen tussen Mastra-agents en het brede bedrijfseco-systeem.
Na afloop van deze training zijn de deelnemers voorbereid om:
- API-geleide integraties te implementeren tussen Mastra-agents en externe diensten.
- Bedrijfsgegevenssystemen en tools te verbinden met geautomatiseerde agentworkflows.
- Beste praktijken voor veilige gegevensoverdracht en authenticatie toe te passen.
- Integratielaagjes te ontwerpen die schaalbaar, onderhoudbaar en klaar zijn voor productie.
Format van de cursus
- Interactieve les en discussie.
- Handson integratie-engineering en API-oefeningen.
- Live-lab implementatie met realistische bedrijfsscenario's.
Cursusaanpassingsopties
- Op maat gemaakte API-scenario's, bedrijfssysteem-mappings of data-integratie-workshops zijn beschikbaar op verzoek.
Accelerating AI Agent Deployment with AgentCore Runtime & Gateway
14 UrenAgentCore Runtime & Gateway is een AWS-servicekoppelingspaar voor het inpakken, implementeren en veilig beschikbaar maken van AI-agenten met gestroomlijnde integraties met externe systemen.
Deze door een docent geleide live training (online of ter plaatse) is bedoeld voor teams op tussenniveau die willen overstappen van agentprototypen naar productie door de AgentCore Runtime te meesteren voor implementatie en de Gateway voor veilige verbindingen en API-integratie.
Na afloop van deze training kunnen de deelnemers:
- AgentCore Runtime-omgevingen opzetten en agenten inpakken voor implementatie.
- Agenten via de Gateway blootstellen met geverifieerde, snelheidsbeperkte eindpunten.
- Externe hulpmiddelen en API's integreren in agentwerkstromen met behulp van stabiele contracten.
- Observabiliteit, logboeken en gebruikersmonitoring instrumenteren voor productiebedrijf.
Opzet van de cursus
- Interactieve colleges en discussies.
- Praktische oefeningen met Runtime-implementaties en Gateway-integraties.
- Praktische oefeningen met nadruk op betrouwbaarheid, veiligheid en uitrol.
Opties voor cursusaanpassing
- Om een aangepaste training voor deze cursus aan te vragen, neem contact met ons op om dit te regelen.
Antigravity voor Ontwikkelaars: Bouwen van Agent-first Toepassingen
21 UrenAntigravity is een ontwikkelplatform ontworpen om AI-geleide, agent-first toepassingen te bouwen.
Dit instructeur-leden, live training (online of ter plaatse) is gericht op middenniveau-ontwikkelaars die echte toepassingen willen creëren met behulp van autonome AI-agents in de Antigravity omgeving.
Na het voltooien van deze training zijn de deelnemers uitgerust om:
- Toepassingen te ontwikkelen die afhankelijk zijn van autonome en gecoördineerde AI-agents.
- De Antigravity IDE, editor, terminal en browser te gebruiken voor eind-to-eind-ontwikkeling.
- Multi-agent werkstromen te beheren met de Agent Manager.
- Agent-functies te integreren in productie-grade software systemen.
Format van het Cursus
- Gebalanceerde presentaties met diepgaande demonstraties.
- Uitgebreide hands-on praktijk en begeleide oefeningen.
- Reële implementatie werk in de live omgeving van Antigravity.
Cursus Aanpassings Opties
- Voor op maat gemaakt inhoud die aansluit bij uw ontwikkelstack, neem contact met ons op om een aangepaste versie van deze training te regelen.
Aan de Slag met Antigravity: Een Inleiding tot Agent-First IDEs
14 UrenGoogle Antigravity is een agent-first ontwikkelomgeving ontworpen om ingenieursworkflows te optimaliseren door slimme automatisering.
Deze instructiegeleide, live training (online of ter plaatse) is gericht op beginners die de grondbeginselen van Antigravity willen ontdekken en begrijpen hoe agentgedreven coderingomgevingen productiviteit verhogen.
Na het voltooien van deze training zullen de deelnemers in staat zijn:
- Google Antigravity te installeren en te configureren.
- Zowel het Editor View als het Manager View te navigeren en te begrijpen.
- Effectief samenwerken met agents om eenvoudige ontwikkelopdrachten te automatiseren.
- Antigravity gebruiken om projectbestanden te genereren, verfijnen en beheren.
Cursusopzet
- Uitleg door de instructeur ondersteund door real-time demonstraties.
- Gestuurde oefeningen gericht op hands-on gebruik van agents.
- Praktische verkenning van kernfuncties van Antigravity in een gecontroleerde labomgeving.
Cursusaanpassingsmogelijkheden
- Als u een aangepaste versie van deze training nodig heeft, neem dan contact met ons op om een op maat gemaakt programma te regelen.
Antigravity voor Webautomatisering & Browser-Gebaseerde Taken
21 UrenGoogle Antigravity is een platform voor het bouwen van agents die in staat zijn om te interacteren met webapplicaties, browseromgevingen en multi-surface workflows.
Deze instructeurgeleide, live-training (online of on-site) is gericht op professionals op middelbaar niveau die wensen om browser-gebaseerde workflows te bouwen, te automatiseren en te testen met behulp van Google Antigravity.
Na het voltooien van de training zullen de deelnemers in staat zijn om:
- Agents te creëren die interacteren met webapplicaties op een browseroppervlak.
- End-to-end workflows over browsercontexten te automatiseren.
- Agentgedrag in UI-gestuurde omgevingen te valideren en op te lossen.
- Cross-surface automatiseringsstrategieën met Antigravity te implementeren.
Formaat van de cursus
- Geleide instructie ondersteund door demonstraties.
- Praktische, hands-on activiteiten en scenario-gebaseerde oefeningen.
- Implementatie van agent workflows in een interactieve labomgeving.
Cursusaanpassingsopties
- Voor aangepaste trainingseisen, neem contact met ons op om de cursus naar uw doelstellingen te aanpassen.
Enterprise Agentic AI met Amazon Bedrock AgentCore
14 UrenAmazon Bedrock AgentCore is een ondernemingsgereed framework voor het bouwen, implementeren en schalen van AI-agenten met geïntegreerde ondersteuning voor geheugen, observabiliteit en veilige identiteitsbeheer.
Deze door een instructeur geleide live training (online of op locatie) is gericht op ingenieurs en architecten op het tussen- en geavanceerd niveau die agentische AI-systemen willen ontwerpen, beveiligen en bedienen met behulp van AWS Bedrock AgentCore.
Aan het einde van deze training zullen de deelnemers in staat zijn om:
- De architectuur en componenten van AgentCore te begrijpen.
- AI-agenten te implementeren en te beheren met Runtime en Gateway.
- Persistentie van het geheugen en toestandsgebonden interacties in te voeren.
- Identiteits-, observabiliteit- en nalevingscontroles toe te passen.
- Meerdere agenten voor bedrijfsmatige workflows te ontwerpen.
Formaat van de cursus
- Interactieve lezing en discussie.
- Hands-on AWS lab-sessies met AgentCore.
- Pratische oefeningen met implementatie- en monitoringsscenario's.
Aanpassingsopties voor de cursus
- Om een aangepaste training voor deze cursus aan te vragen, neem contact met ons op om dit te regelen.
Securing AI Agents: Identity, Observability, and Compliance with AgentCore
14 UrenAgentCore biedt ingebouwde identiteits-, observabiliteits- en nalevingsfuncties die organisaties in staat stellen om AI-agents verantwoord in zakelijke omgevingen te implementeren.
Deze door een instructeur geleide live training (online of op locatie) is gericht op geavanceerde beoefenaars die veilige, controleerbare en nalevingsconforme AI-agentensystemen willen ontwerpen en beheren met behulp van Amazon Bedrock AgentCore.
Op het einde van deze training kunnen de deelnemers:
- Ondernemingsidentiteit en toestemmingmodellen voor agents implementeren.
- Observabiliteit inschakelen via gestructureerd loggen, metrieken en tracing.
- Nalevingscontroles toepassen om in lijn te komen met regelgevingskaders.
- Agentactiviteit controleren en veilige sessie-niveau controles onderhouden.
Formaat van de cursus
- Interactieve lezing en discussie.
- Hands-on labs met AWS-beveiligings- en monitoringtools.
- Casusstudies in gereguleerde zakelijke omgevingen.
Opties voor cursusaanpassing
- Om een aangepaste training voor deze cursus aan te vragen, neem contact met ons op om dit te regelen.
AI Agent Development met Mastra
14 UrenDeze instructeur-gelede, live training (online of on-site) is gericht op softwareontwikkelaars met een tusseniveau en ingenieursteams die schaalbare, observabele AI-systemen willen bouwen met Mastra.
Aan het einde van deze training zullen de deelnemers in staat zijn om:
- De architectuur van Mastra te begrijpen en hoe deze integreert met LLMs en externe APIs.
- AI-agents en workflows te ontwerpen en implementeren met TypeScript.
- De observabiliteit- en geheugentoepassingen van Mastra te gebruiken om de prestaties van agents te bewaken en te verbeteren.
- Productie-gereed AI-toepassingen te implementeren met behulp van de framework-functies van Mastra.
Mastra Debugging, Evaluatie & Kwaliteitsborging voor AI-agents
21 UrenMastra is een framework dat gestructureerde tools biedt voor het evalueren, debuggen en waarborgen van de betrouwbaarheid van AI-agents die werken in complexe workflows.
Deze instructiegeleide live training (online of ter plekke) is gericht op praktijkers met een tussenliggend niveau die streven naar grondige testen van agentgedrag, het verbeteren van betrouwbaarheid en de implementatie van meetbare evaluatieprocessen.
Aan het einde van deze training zullen de deelnemers met zelfvertrouwen:
- Debugging-technieken toepassen om agentgedragsproblemen te identificeren en te corrigeren.
- Agents evalueren met behulp van gestructureerde metrische gegevens, benchmarks en kwaliteitscores.
- Tooling en workflows implementeren die betrouwbaarheid, drift en hallucinaties volgen.
- QA-strategieën ontwerpen die consistent en voorspelbaar agentgedrag waarborgen.
Format van de cursus
- Interactieve lezing en discussie.
- Hands-on debugging- en evaluatieoefeningen.
- Live-lab analyse van agentgedrag met behulp van observability-tools.
Cursusaanpassingsopties
- Aangepaste betrouwbaarheidstestscenarios en branchekundige QA-methoden kunnen op verzoek worden geregeld.
Mastra Ops & Production Engineering: Deploying and Scaling AI Agents
21 UrenMastra is een operationele framework ontworpen om de implementatie, schaling en levenscyclusbeheer van AI-agents in productieomgevingen te vereenvoudigen.
Deze door instructeurs geleide live-training (online of ter plaatse) is gericht op technisch specialisten met een middel- tot gevorderd niveau die AI-agents betrouwbaar en efficiënt in productiesystemen moeten implementeren.
Na het voltooien van deze training zijn de deelnemers in staat om:
- Mastra-gebaseerde AI-agents te implementeren in beheerde, productiegrade omgevingen.
- Agents horizontaal en verticaal te schalen met behulp van platform-eigen primitives.
- Observabiliteitspipelines te implementeren om het gedrag en de prestaties van agents te volgen.
- Runtimetype-instellingen te optimaliseren om latentie, kosten en operationele risico's te verlagen.
Format van de cursus
- Interactieve les en discussie.
- Praktijkgerichte oefeningen gericht op echte implementatiescenario's.
- Live-labimplementatie met behulp van gecontaineriseerde en georkestreerde omgevingen.
Aanpassingsmogelijkheden voor de cursus
- Aanpassing van onderwerpen, praktijklabs of branchespecifieke scenario's is op verzoek beschikbaar.
Mastra Workflow Automation & Multi-Agent Orchestration
21 UrenMastra is een framework dat geavanceerde workflow-automatisering en coördinatie mogelijk maakt voor meerdere AI-agents die werken binnen gedistribueerde systemen.
Deze op instructie gebaseerde, live training (online of ter plaatse) is gericht op practitioners van middelbare niveau die complexe multi-agent workflows willen ontwerpen, coördineren en bedienen op schaal.
Door deze training te volgen, zullen de deelnemers de vaardigheden verwerven om:
- Complexe workflows te ontwerpen met behulp van Mastra’s coördinatiecapaciteiten.
- Meerdere agents die parallel of afhankelijk werken, te coördineren.
- Tools voor monitoring en debugging van workflow-uitvoering te implementeren.
- Orchestrationlogica te optimaliseren voor betrouwbaarheid, doorzettingsvermogen en automatisatie-efficiëntie.
Format van de cursus
- Interactieve lezing en discussie.
- Praktische oefeningen voor workflow-ontwerp en automatisering.
- Praktische implementatie in een containerisatiefriendly live-lab omgeving.
Aanpassingsmogelijkheden voor de cursus
- Op verzoek aangepaste automatisatiescenario's, enterprise-integraties of workflowpatronen kunnen worden geleverd.
Agent Workflows Beheren in Google Antigravity: Orchestration, Planning en Artifacts
14 UrenGoogle Antigravity is een agentgericht ontwikkelplatform dat gebruikt wordt om AI-geleide codering en automatiseringsworkflows te orkestreren, te beheren en te coördineren.
Deze door instructeurs geleide live-training (online of ter plaatse) is gericht op professionals met een tusseniveau die leren hoe ze multi-agent workflows in Google Antigravity ontwerpen, beheren en optimaliseren.
Na het volgen van deze training zullen de deelnemers de vaardigheden hebben om:
- Agentverantwoordelijkheden en orkestratiepijplijnen in te stellen binnen de Manager-interface.
- Antigravity-artefacten op te stellen en te interpreteren, waaronder taaklijsten, plannen, logs en browseropnames.
- Verificatiestrategieën te implementeren om agenthandelingen transparant en toelaatbaar te houden.
- Multi-agent samenwerking te optimaliseren voor complexe ontwikkel- en operationele taken.
Cursusformat
- Geleide presentaties en praktische demonstraties.
- Scenario-gebaseerde oefeningen gericht op echte workflowuitdagingen.
- Handson experimentatie in een live Antigravity-werkruimte.
Cursusaanpassingsopties
- Als u een aangepaste versie van deze cursus nodig heeft, neem dan contact met ons op om aanpassingsopties te bespreken.
Testing & Verifying Agent-Driven Code: Quality Assurance in Antigravity
14 UrenAntigravity is a framework representing advanced agent-driven development workflows.
Dit praktijkgerichte, door een instructeur geleide training (online of ter plaatse) is gericht op professioneel tot gevorderd niveau profs die willen controleren, valideren en beveiligen wat door AI-agents wordt geproduceerd in Antigravity-gedreven omgevingen.
Na het voltooien van deze training zullen de deelnemers in staat zijn:
- De nauwkeurigheid en veiligheid van door agents gegenereerde code-artefacten te beoordelen.
- Gestructureerde technieken te gebruiken om door agents uitgevoerde taken te verifiëren.
- Browseropnames en agentactiviteit effectief te analyseren.
- QA- en beveiligingsprincipes toe te passen om de betrouwbaarheid van agentwerkstromen te waarborgen.
Format van het Cursus
- Instructeur-geleide technische briefing en discussies.
- Praktische oefeningen gericht op het verifiëren van echte agentwerkstromen.
- Handson testing en validatie in een gecontroleerde labomgeving.
Cursus Aanpassingsmogelijkheden
- Aanpassing van scenario's, werkstromen en testvoorbeelden is beschikbaar op verzoek.