CONTACT ONS

Cursusaanbod

Introductie:

  • Apache Spark in Hadoop Ecosysteem
  • Korte intro voor python, scala

Basis (theorie):

  • Architectuur
  • RDD
  • Transformatie en acties
  • Fase, taak, afhankelijkheden

Met behulp van Databricks omgeving begrijp je de basis (hands-on workshop):

  • Oefeningen met behulp van RDD API
  • Basisfuncties voor actie en transformatie
  • PairRDD
  • Verbinden
  • Strategieën voor caching
  • Oefeningen met behulp van de DataFrame-API
  • VonkSQL
  • DataFrame: selecteren, filteren, groeperen, sorteren
  • UDF (door de gebruiker gedefinieerde functie)
  • Kijken naar DataSet API
  • Streaming

Met behulp van AWS-omgeving inzicht in de implementatie (hands-on workshop):

  • Basisprincipes van AWS-lijm
  • Begrijp de verschillen tussen AWS EMR en AWS Glue
  • Voorbeeldtaken in beide omgevingen
  • Begrijp de voor- en nadelen

Extra:

  • Inleiding tot Apache Airflow orkestratie

Vereisten

Programmeervaardigheden (bij voorkeur Python, Scala)

SQL basis

 21 Uren

Aangepaste bedrijfsopleiding

Opleidingsoplossingen ontworpen exclusief voor bedrijven.

  • Aangepaste inhoud: We passen de syllabus en praktijkopdrachten aan naar de echte doelen en behoeften van uw project.
  • Voor flexibel schema: Datums en tijden aangepast aan het rooster van uw team.
  • Formaat: Online (live), In-company (bij uw kantoren) of Hybride.
Investering

Prijs per privégroep, online live training, startend vanaf 4800 € + BTW*

Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen

Reviews (3)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën