Cursusaanbod
Inleiding, doelen en migratiestrategie
- Cursusdoelen, deelnemerprofielvergelijking en succescriteria
- Hogere-niveau benaderingen voor migratie en risicoverwegingen
- Instellen van workspaces, repositories en labdatasets
Dag 1 — Migratiefundamenten en architectuur
- Lakehouse-concepten, Delta Lake-overzicht en Databricks-architectuur
- Verschillen tussen SMP en MPP en de implicaties voor migratie
- Medallion (Bronze→Silver→Gold) ontwerp en Unity Catalog-overzicht
Dag 1 Lab — Omzetten van een stored procedure
- Praktische migratie van een voorbeeld-stored procedure naar een notebook
- Toewijzen van temp tabellen en cursors aan DataFrame-transformaties
- Validatie en vergelijking met de originele output
Dag 2 — Geavanceerde Delta Lake & Incrementele Laden
- ACID-transacties, commitlogs, versiebeheer en time travel
- Auto Loader, MERGE INTO-patronen, upserts en schemaevolutie
- OPTIMIZE, VACUUM, Z-ORDER, partitioneren en opslagoptimalisatie
Dag 2 Lab — Incrementele ingest & Optimalisatie
- Implementeren van Auto Loader-ingest en MERGE-werkstromen
- Toepassen van OPTIMIZE, Z-ORDER en VACUUM; validatie van resultaten
- Meten van prestatieverbeteringen bij lezen/schrijven
Dag 3 — SQL in Databricks, Prestaties & Foutopsporing
- Analytische SQL-functies: windowfuncties, high-order functies, JSON/array-handhaving
- Lezen van de Spark UI, DAGs, shuffles, stages, taken en flessenhalsdiagnose
- Queryoptimalisatiepatronen: broadcast joins, hints, caching en spill-reductie
Dag 3 Lab — SQL-omzetting & Prestatietuning
- Zwaar SQL-proces omzetten naar geoptimaliseerde Spark SQL
- Spark UI-traces gebruiken om skew en shuffleproblemen te identificeren en oplossen
- Benchmark voordat/na en documentatie van tuningstappen
Dag 4 — Tactische PySpark: Vervangen van procedurale logica
- Spark-uitvoeringsmodel: driver, executors, lazy evaluation en partitioneringsstrategieën
- Lussen en cursors omzetten naar gevectoriseerde DataFrame-operaties
- Modularisatie, UDFs/pandas UDFs, widgets en herbruikbare bibliotheken
Dag 4 Lab — Omzetten van procedurale scripts
- Proceduraal ETL-script omzetten naar modulaire PySpark-notebooks
- Parametrisering, unit-achtige tests en herbruikbare functies introduceren
- Codebeoordeling en toepassing van best-practice-checklist
Dag 5 — Orkestratie, Volledige End-to-End Pipeline & Best Practices
- Databricks Workflows: taakontwerp, takenafhankelijkheden, triggers en foutafhandeling
- Ontwerpen van incrementele Medallion-pipelines met kwaliteitsregels en schemavalidatie
- Integratie met Git (GitHub/Azure DevOps), CI en teststrategieën voor PySpark-logica
Dag 5 Lab — Bouwen van een Volledige End-to-End Pipeline
- Assemble Bronze→Silver→Gold-pipeline georkestreerd met Workflows
- Logging, audit, retries en automatische validaties implementeren
- Volledige pipeline uitvoeren, outputs valideren en deploy-notes voorbereiden
Operationeel maken, Governance en Productiegereedheid
- Unity Catalog-governance, lijnen en toegangscontroles best practices
- Kosten, clustersizing, autoscaling en taakconcurrentiepatronen
- Deploy-checklists, terugrollingsstrategieën en runbookcreatie
Eindbeoordeling, Kennisoverdracht en Volgende Stappen
- Deelnemer-presentaties van migratiework en geleerde lessen
- Gap-analyse, aanbevolen vervolgodingen en overdracht van trainingsmateriaal
- Referenties, verdere leerpaden en ondersteuningsopties
Vereisten
- Inzicht in data engineering-concepten
- Ervaring met SQL en stored procedures (Synapse / SQL Server)
- Vertrouwdheid met ETL-orkestratieconcepten (ADF of vergelijkbaar)
Doelgroep
- Technologie-managers met een achtergrond in data engineering
- Data engineers die procedurale OLAP-logica naar Lakehouse-patronen migreren
- Platform-engineers die verantwoordelijk zijn voor de adoptie van Databricks
Leveringsopties
PRIVÉGROEPSTRAINING
Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.
- Pre-cursusgesprek met uw trainer
- Aanpassing van de leerervaring om uw doelen te bereiken -
- Op maat gemaakte overzichten
- Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
- Training gepland op een datum naar keuze
- Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen
Private Group Prices RRP from €11400 online delivery, based on a group of 2 delegates, €3600 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
OPENBARE TRAINING
Kijk op onze public courses