Cursusaanbod
Introductie, doelen en migratiestrategie
- Doelstellingen van de cursus, profielafstemming van de deelnemers en succescriteria
- Overzicht van migratiebenaderingen op hoog niveau en risico's
- Instellen van workspaces, repositories en laboratoriumdatasets
Dag 1 — Fundamenten en architectuur van de migratie
- Lakehouse-concepten, overzicht van Delta Lake en Databricks-architectuur
- Verschillen tussen SMP en MPP en de implicaties voor migratie
- Medallion (Bronze→Silver→Gold)-ontwerp en overzicht van Unity Catalog
Lab Dag 1 — Omzetten van een stored procedure
- Hands-on migratie van een voorbeeld stored procedure naar een notebook
- Afbeelden van temp-tabellen en cursors op DataFrame-transformaties
- Validatie en vergelijking met de originele uitvoer
Dag 2 — Geavanceerde Delta Lake & Incrementele Ingesting
- ACID-transacties, commitlogs, versiebeheer en tijdmachine
- Auto Loader, MERGE INTO-patronen, upserts en schema-evolutie
- OPTIMIZE, VACUUM, Z-ORDER, partitiering en opslagoptimalisatie
Lab Dag 2 — Incrementele ingest & optimalisatie
- Implementeren van Auto Loader ingest en MERGE-werkstroom
- Toepassen van OPTIMIZE, Z-ORDER en VACUUM; valideren van resultaten
- Meet lees-/schrijfprestatieverbeteringen
Dag 3 — SQL in Databricks, prestaties & debuggen
- Analytische SQL-functies: window functions, hogere-orde functies, JSON/array-behandeling
- Lezen van de Spark UI, DAGs, shuffles, stages, taken en bottleneck-diagnose
- Query-tuningpatronen: broadcast joins, hints, caching en spill-reductie
Lab Dag 3 — SQL-herformuleren & prestatieoptimalisatie
- Een zware SQL-proces herformuleren naar geoptimaliseerde Spark SQL
- Gebruik Spark UI-traces om skew en shuffle-problemen te identificeren en op te lossen
- Benchmark voor-/nadien en documenteer tuning-stappen
Dag 4 — Tactische PySpark: Vervangen van procedurele logica
- Spark-uitvoeringsmodel: driver, executors, lazy evaluation en partitioning-strategieën
- Lussen en cursors omzetten naar vectorized DataFrame-operaties
- Modularisatie, UDFs/pandas UDFs, widgets en herbruikbare bibliotheken
Lab Dag 4 — Herformuleren van procedurele scripts
- Een procedurele ETL-script herformuleren naar modulaire PySpark-notebooks
- Introduceer parametrisering, unit-stijl tests en herbruikbare functies
- Code review en toepassing van een best-practice checklist
Dag 5 — Orkestratie, volledige end-to-end-pipeline & best practices
- Databricks Workflows: job-ontwerp, taakafhankelijkheden, triggers en foutafhandeling
- Ontwerpen van incrementele Medallion-pipelines met kwaliteitsregels en schema-validatie
- Integratie met Git (GitHub/Azure DevOps), CI, en teststrategieën voor PySpark-logica
Lab Dag 5 — Bouwen van een volledige end-to-end-pipeline
- Assembleer de Bronze→Silver→Gold-pipeline georkestreerd met Workflows
- Implementeer logging, auditing, retries en automatische validaties
- Voer de volledige pipeline uit, valideer outputs en bereid implementatie-aantekeningen voor
Operationeel maken, governance en productie-klaarheid
- Unity Catalog-governance, lineage en toegangsbeheer best practices
- Kosten, clustergrootte, autoscaling en job-concurrentiepatronen
- Implementatiechecklijsten, rollback-strategieën en runbookcreatie
Eindbeoordeling, kennisoverdracht en volgende stappen
- Presentaties van deelnemers over hun migratie-arbeid en lesjes geleerd
- Gap-analyse, aanbevolen vervolgaandheden en overdracht van opleidingsmaterialen
- Referenties, verdere leerpaden en ondersteuningsmogelijkheden
Vereisten
- Een begrip van data engineering-concepten
- Ervaring met SQL en stored procedures (Synapse / SQL Server)
- Kennis van ETL-orkestratieconcepten (ADF of vergelijkbaar)
Doelgroep
- Technologie-managers met een achtergrond in data engineering
- Data engineers die procedurele OLAP-logica naar Lakehouse-patronen verplaatsen
- Platform ingenieurs die verantwoordelijk zijn voor de implementatie van Databricks
Leveringsopties
PRIVÉGROEPSTRAINING
Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.
- Pre-cursusgesprek met uw trainer
- Aanpassing van de leerervaring om uw doelen te bereiken -
- Op maat gemaakte overzichten
- Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
- Training gepland op een datum naar keuze
- Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen
Private Group Prices RRP from €11400 online delivery, based on a group of 2 delegates, €3600 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
OPENBARE TRAINING
Kijk op onze public courses