Cursusaanbod
Deel 1: Inleiding tot Hadoop
- Geschiedenis en concepten van Hadoop
- Ecosysteem
- Distributies
- Hoge-niveau architectuur
- Hadoop mythen
- Hadoop uitdagingen
- Hardware / software
- lab : eerste kijk op Hadoop
Deel 2: HDFS
- Ontwerp en architectuur
- Concepten (horizontale schaling, replicatie, data-localiteit, rack-awareness)
- Daemons : Namenode, Secondary namenode, Data node
- Communicaties / heart-beats
- Data-integriteit
- Lees- en schrijfpad
- Namenode High Availability (HA), Federatie
- labs : Interactie met HDFS
Deel 3 : Map Reduce
- Concepten en architectuur
- daemons (MRV1) : jobtracker / tasktracker
- Fasen : driver, mapper, shuffle/sort, reducer
- Map Reduce Versie 1 en Versie 2 (YARN)
- Interne onderdelen van Map Reduce
- Inleiding tot het Java Map Reduce-programma
- labs : Een voorbeeld van een MapReduce-programma uitvoeren
Deel 4 : Varken
- Varken versus Java-kaart verminderen
- De Stroom van de Taak van het varken
- varken Latijnse taal
- ETL met varken
- Transformaties en joins
- Door de gebruiker gedefinieerde functies (UDF)
- labs : schrijven van Pig scripts om data te analyseren
Deel 5: Hive
- Architectuur en design
- Gegevenstypen
- SQL Ondersteuning in Hive
- Tabellen maken Hive en query's uitvoeren
- Partities
- Joins
- Tekstverwerking
- labs : diverse labo's over het verwerken van data met Hive
Deel 6: HBase
- Concepten en architectuur
- HBase vs RDBMS vs Cassandra
- HBase Java API
- Tijdreeksdata op HBase
- Schemadesign
- labs : Interactie met HBase via shell; programmeren in HBase Java API ; oefening schemadesign
Vereisten
- Comfortabel met Java programmeertaal (de meeste programmeeroefeningen zijn in Java)
- Comfortabel in Linux omgeving (in staat zijn om te navigeren Linux opdrachtregel, bestanden bewerken met VI / Nano)
Lab-omgeving
Zero Install : Er is geen behoefte om Hadoop software te installeren op de machines van de studenten! Er wordt een werkende Hadoop cluster voor de studenten beschikbaar gesteld.
Studenten hebben het volgende nodig
- einen SSH-client (Linux en Mac hebben al ssh-clients, voor Windows wordt Putty aanbevolen)
- einen browser om toegang te krijgen tot de cluster, Firefox wordt aanbevolen
Leveringsopties
PRIVÉGROEPSTRAINING
Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.
- Pre-cursusgesprek met uw trainer
- Aanpassing van de leerervaring om uw doelen te bereiken -
- Op maat gemaakte overzichten
- Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
- Training gepland op een datum naar keuze
- Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen
Private Group Prices RRP from €9120 online delivery, based on a group of 2 delegates, €2880 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
OPENBARE TRAINING
Kijk op onze public courses
Reviews (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
During the exercises, James explained me every step whereever I was getting stuck in more detail. I was completely new to NIFI. He explained the actual purpose of NIFI, even the basics such as open source. He covered every concept of Nifi starting from Beginner Level to Developer Level.
Firdous Hashim Ali - MOD A BLOCK
Cursus - Apache NiFi for Administrators
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Cursus - Impala for Business Intelligence
That I had it in the first place.
Peter Scales - CACI Ltd
Cursus - Apache NiFi for Developers
practical things of doing, also theory was served good by Ajay