Cursusaanbod
1: HDFS (17%)
- Beschrijf de functie van HDFS Daemons
- Beschrijf de normale werking van een Apache Hadoop-cluster, zowel voor gegevensopslag als voor gegevensverwerking.
- Identificeer huidige kenmerken van computersystemen die een systeem zoals Apache Hadoop motiveren.
- Classificeer de belangrijkste doelen van HDFS-ontwerp
- Gegeven een scenario, identificeer de juiste toepassingsgeval voor HDFS Federatie
- Identificeer de componenten en daemon van een HDFS HA-Quorum-cluster
- Analyseer de rol van HDFS-beveiliging (Kerberos)
- Bepaal de beste keuze voor gegevensserialisatie voor een gegeven scenario
- Beschrijf lees- en schrijfroutes voor bestanden
- Identificeer de opdrachten om bestanden te manipuleren in de Hadoop File System Shell
2: YARN en MapReduce versie 2 (MRv2) (17%)
- Begrijp hoe het upgraden van een cluster van Hadoop 1 naar Hadoop 2 clusterinstellingen beïnvloedt
- Begrijp hoe MapReduce v2 (MRv2 / YARN) te implementeren, inclusief alle YARN daemons
- Begrijp de basisontwerpstrategie voor MapReduce v2 (MRv2)
- Bepaal hoe YARN bronnen toewijst
- Identificeer de workflow van een MapReduce-job die op YARN draait
- Bepaal welke bestanden je moet wijzigen en hoe je een cluster moet migreren van MapReduce versie 1 (MRv1) naar MapReduce versie 2 (MRv2) dat op YARN draait
3: Hadoop Cluster Planning (16%)
- Belangrijke punten om te overwegen bij het kiezen van hardware en besturingssystemen voor een Apache Hadoop-cluster
- Analyseer de keuzes bij het selecteren van een besturingssysteem
- Begrijp kernel-aanpassingen en schijfruil
- Gegeven een scenario en een werkbelastingspatroon, identificeer een hardwareconfiguratie die past bij het scenario
- Gegeven een scenario, bepaal de ecosysteemcomponenten die uw cluster nodig heeft om de SLA te vervullen
- Clustergrootte: gegeven een scenario en frequentie van uitvoering, identificeer de specifieke werkbelastingdetails, inclusief CPU, geheugen, opslag en schijf I/O
- Schijfgrootte en -configuratie, inclusief JBOD versus RAID, SANs, virtualisatie en schijfgroottevereisten in een cluster
- Netwerktopologieën: begrijp netwerkgebruik in Hadoop (voor zowel HDFS als MapReduce) en stel of identificeer belangrijke netwerkontwerpelementen voor een gegeven scenario
4: Hadoop Cluster Installatie en Beheer (25%)
- Gegeven een scenario, identificeer hoe de cluster omgaat met schijf- en machinestoringen
- Analyseer een logconfiguratie en logconfiguratiebestandsformaat
- Begrijp de basis van Hadoop-metrieken en clustergezondheidsmonitoring
- Identificeer de functie en het doel van beschikbare hulpmiddelen voor clusterbeheer
- Zorg voor de installatie van alle ecosysteemcomponenten in CDH 5, inclusief (maar niet beperkt tot): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive en Pig
- Identificeer de functie en het doel van beschikbare hulpmiddelen voor het beheren van het Apache Hadoop-bestandssysteem
5: Resource Management (10%)
- Begrijp de algemene ontwerpdoelen van elke Hadoop-planner
- Gegeven een scenario, bepaal hoe de FIFO-planner clusterbronnen toewijst
- Gegeven een scenario, bepaal hoe de Fair-planner clusterbronnen toewijst onder YARN
- Gegeven een scenario, bepaal hoe de Capacity-planner clusterbronnen toewijst
6: Monitoring en Logboeken (15%)
- Begrijp de functies en kenmerken van de metriekverzamelingscapaciteiten van Hadoop
- Analyseer de NameNode- en JobTracker-webgebruikersinterfaces
- Begrijp hoe je clusterdaemons kunt monitoren
- Identificeer en monitor CPU-gebruik op masterknooppunten
- Beschrijf hoe je swap en geheugenallocatie op alle knooppunten kunt monitoren
- Identificeer hoe je de logbestanden van Hadoop kunt bekijken en beheren
- Interpreteer een logbestand
Vereisten
- Basisbewerkingen voor Linux beheer
- Basisbewerkingen voor programmeren
Leveringsopties
PRIVÉGROEPSTRAINING
Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.
- Pre-cursusgesprek met uw trainer
- Aanpassing van de leerervaring om uw doelen te bereiken -
- Op maat gemaakte overzichten
- Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
- Training gepland op een datum naar keuze
- Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen
Private Group Prices RRP from €11400 online delivery, based on a group of 2 delegates, €3600 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
OPENBARE TRAINING
Kijk op onze public courses
Reviews (3)
I genuinely enjoyed the many hands-on sessions.
Jacek Pieczatka
Cursus - Administrator Training for Apache Hadoop
Automatisch vertaald
I genuinely enjoyed the big competences of Trainer.
Grzegorz Gorski
Cursus - Administrator Training for Apache Hadoop
Automatisch vertaald
I mostly liked the trainer giving real live Examples.
Simon Hahn
Cursus - Administrator Training for Apache Hadoop
Automatisch vertaald