Cursusaanbod
Sectie 1: Inleiding tot Hadoop
- Hadoop geschiedenis, concepten
- ecosysteem
- distributies
- hoog niveau architectuur
- Hadoop mythen
- Hadoop uitdagingen
- hardware/software
- lab : eerste kijkje bij Hadoop
Sectie 2: HDFS
- Ontwerp en architectuur
- concepten (horizontale schaling, replicatie, data lokaliteit, rack bewustzijn)
- Daemons : Namenode, Secondary namenode, Data node
- communicatie / hartstochten
- data integriteit
- lezen / schrijven pad
- Namenode High Availability (HA), Federatie
- labs : Interactie met HDFS
Sectie 3: Map Reduce
- concepten en architectuur
- daemons (MRV1) : jobtracker / tasktracker
- fasen : driver, mapper, shuffle/sort, reducer
- Map Reduce Versie 1 en Versie 2 (YARN)
- internals van Map Reduce
- Inleiding tot Java Map Reduce programma
- labs : Uitvoeren van een voorbeeld MapReduce programma
Sectie 4: Pig
- pig vs java map reduce
- pig job flow
- pig latin taal
- ETL met Pig
- Transformaties & Joins
- Gebruikersgedefinieerde functies (UDF)
- labs : schrijven van Pig scripts voor data analyse
Sectie 5: Hive
- architectuur en ontwerp
- datatypes
- SQL ondersteuning in Hive
- Aanmaken van Hive tabellen en query's
- partities
- joins
- tekstverwerking
- labs : diverse labs over data verwerking met Hive
Sectie 6: HBase
- concepten en architectuur
- HBase vs RDBMS vs Cassandra
- HBase Java API
- tijdreeksen data op HBase
- schema ontwerp
- labs : interactie met HBase met behulp van shell; programmeren in HBase Java API ; Schema ontwerp oefening
Vereisten
- Vertrouwd met Java programmeertaal (meeste programmeeroefeningen zijn in java)
- Vertrouwd met Linux omgeving (in staat om te navigeren in de Linux opdrachtregel, bestanden bewerken met vi / nano)
Labomgeving
Zero Install: Er is geen noodzaak om Hadoop software te installeren op de machines van de studenten! Er wordt een werkende Hadoop cluster voor studenten beschikbaar gesteld.
Studenten hebben de volgende nodig
- een SSH-client (Linux en Mac hebben al ssh-clients, voor Windows is Putty aanbevolen)
- een browser om toegang te krijgen tot de cluster, Firefox aanbevolen
Leveringsopties
PRIVÉGROEPSTRAINING
Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.
- Pre-cursusgesprek met uw trainer
- Aanpassing van de leerervaring om uw doelen te bereiken -
- Op maat gemaakte overzichten
- Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
- Training gepland op een datum naar keuze
- Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen
Private Group Prices RRP from €9120 online delivery, based on a group of 2 delegates, €2880 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
OPENBARE TRAINING
Kijk op onze public courses
Reviews (5)
De live voorbeelden
Ahmet Bolat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
Automatisch vertaald
Tijdens de oefeningen legde James mij elke stap in detail uit waar ik vast liep. Ik was helemaal nieuw met NIFI. Hij legde het daadwerkelijke doel van NIFI uit, zelfs de basis zoals open source. Hij dekte elk concept van Nifi vanaf het Beginner Niveau tot het Developer Niveau.
Firdous Hashim Ali - MOD A BLOCK
Cursus - Apache NiFi for Administrators
Automatisch vertaald
Trainer's voorbereiding en organisatie, en kwaliteit van de materialen op github geleverd.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Cursus - Impala for Business Intelligence
Automatisch vertaald
Dat ik het in eerste instantie had.
Peter Scales - CACI Ltd
Cursus - Apache NiFi for Developers
Automatisch vertaald
praktische dingen van doen, ook de theorie werd goed verzorgd door Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Cursus - Hadoop Administration on MapR
Automatisch vertaald