Cursusaanbod

Inleiding, doelen en migratiestrategie

  • Cursusdoelen, deelnemerprofielvergelijking en succescriteria
  • Hogere-niveau benaderingen voor migratie en risicoverwegingen
  • Instellen van workspaces, repositories en labdatasets

Dag 1 — Migratiefundamenten en architectuur

  • Lakehouse-concepten, Delta Lake-overzicht en Databricks-architectuur
  • Verschillen tussen SMP en MPP en de implicaties voor migratie
  • Medallion (Bronze→Silver→Gold) ontwerp en Unity Catalog-overzicht

Dag 1 Lab — Omzetten van een stored procedure

  • Praktische migratie van een voorbeeld-stored procedure naar een notebook
  • Toewijzen van temp tabellen en cursors aan DataFrame-transformaties
  • Validatie en vergelijking met de originele output

Dag 2 — Geavanceerde Delta Lake & Incrementele Laden

  • ACID-transacties, commitlogs, versiebeheer en time travel
  • Auto Loader, MERGE INTO-patronen, upserts en schemaevolutie
  • OPTIMIZE, VACUUM, Z-ORDER, partitioneren en opslagoptimalisatie

Dag 2 Lab — Incrementele ingest & Optimalisatie

  • Implementeren van Auto Loader-ingest en MERGE-werkstromen
  • Toepassen van OPTIMIZE, Z-ORDER en VACUUM; validatie van resultaten
  • Meten van prestatieverbeteringen bij lezen/schrijven

Dag 3 — SQL in Databricks, Prestaties & Foutopsporing

  • Analytische SQL-functies: windowfuncties, high-order functies, JSON/array-handhaving
  • Lezen van de Spark UI, DAGs, shuffles, stages, taken en flessenhalsdiagnose
  • Queryoptimalisatiepatronen: broadcast joins, hints, caching en spill-reductie

Dag 3 Lab — SQL-omzetting & Prestatietuning

  • Zwaar SQL-proces omzetten naar geoptimaliseerde Spark SQL
  • Spark UI-traces gebruiken om skew en shuffleproblemen te identificeren en oplossen
  • Benchmark voordat/na en documentatie van tuningstappen

Dag 4 — Tactische PySpark: Vervangen van procedurale logica

  • Spark-uitvoeringsmodel: driver, executors, lazy evaluation en partitioneringsstrategieën
  • Lussen en cursors omzetten naar gevectoriseerde DataFrame-operaties
  • Modularisatie, UDFs/pandas UDFs, widgets en herbruikbare bibliotheken

Dag 4 Lab — Omzetten van procedurale scripts

  • Proceduraal ETL-script omzetten naar modulaire PySpark-notebooks
  • Parametrisering, unit-achtige tests en herbruikbare functies introduceren
  • Codebeoordeling en toepassing van best-practice-checklist

Dag 5 — Orkestratie, Volledige End-to-End Pipeline & Best Practices

  • Databricks Workflows: taakontwerp, takenafhankelijkheden, triggers en foutafhandeling
  • Ontwerpen van incrementele Medallion-pipelines met kwaliteitsregels en schemavalidatie
  • Integratie met Git (GitHub/Azure DevOps), CI en teststrategieën voor PySpark-logica

Dag 5 Lab — Bouwen van een Volledige End-to-End Pipeline

  • Assemble Bronze→Silver→Gold-pipeline georkestreerd met Workflows
  • Logging, audit, retries en automatische validaties implementeren
  • Volledige pipeline uitvoeren, outputs valideren en deploy-notes voorbereiden

Operationeel maken, Governance en Productiegereedheid

  • Unity Catalog-governance, lijnen en toegangscontroles best practices
  • Kosten, clustersizing, autoscaling en taakconcurrentiepatronen
  • Deploy-checklists, terugrollingsstrategieën en runbookcreatie

Eindbeoordeling, Kennisoverdracht en Volgende Stappen

  • Deelnemer-presentaties van migratiework en geleerde lessen
  • Gap-analyse, aanbevolen vervolgodingen en overdracht van trainingsmateriaal
  • Referenties, verdere leerpaden en ondersteuningsopties

Vereisten

  • Inzicht in data engineering-concepten
  • Ervaring met SQL en stored procedures (Synapse / SQL Server)
  • Vertrouwdheid met ETL-orkestratieconcepten (ADF of vergelijkbaar)

Doelgroep

  • Technologie-managers met een achtergrond in data engineering
  • Data engineers die procedurale OLAP-logica naar Lakehouse-patronen migreren
  • Platform-engineers die verantwoordelijk zijn voor de adoptie van Databricks
 35 Uren

Leveringsopties

PRIVÉGROEPSTRAINING

Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.

  • Pre-cursusgesprek met uw trainer
  • Aanpassing van de leerervaring om uw doelen te bereiken -
    • Op maat gemaakte overzichten
    • Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
  • Training gepland op een datum naar keuze
  • Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen

Private Group Prices RRP from €11400 online delivery, based on a group of 2 delegates, €3600 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.

Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen


OPENBARE TRAINING

Kijk op onze public courses

Voorlopige Aankomende Cursussen

Gerelateerde categorieën