Cursusaanbod
- Inleiding
- Hadoop geschiedenis, concepten
- Ecosysteem
- Distributies
- Hoog niveau architectuur
- Hadoop mythen
- Hadoop uitdagingen (hardware / software)
- Labs: bespreek uw Big Data projecten en problemen
- Planning en installatie
- Software selecteren, Hadoop distributies
- Cluster dimensioneren, plannen voor groei
- Hardware en netwerk selecteren
- Rack topologie
- Installatie
- Multi-tenancy
- Directory structuur, logs
- Benchmarking
- Labs: cluster installeren, prestatie benchmarks uitvoeren
- HDFS-operaties
- Concepten (horizontale schaalbaarheid, replicatie, data-locatiebewustzijn, rack-gevoeligheid)
- Nodes en daemons (NameNode, Secondary NameNode, HA Standby NameNode, DataNode)
- Gezondheidsmonitoring
- Beheer via opdrachtregel en browser
- Opslag toevoegen, defecte schijven vervangen
- Labs: kennismaken met HDFS-opdrachtregels
- Data-inname
- Flume voor logs en andere data-inname in HDFS
- Sqoop voor het importeren van SQL databases naar HDFS en voor het exporteren terug naar SQL
- Hadoop datawarehousing met Hive
- Data kopiëren tussen clusters (distcp)
- Het gebruik van S3 als aanvulling op HDFS
- Beste praktijken en architecturen voor data-inname
- Labs: instellen en gebruiken van Flume, hetzelfde voor Sqoop
- MapReduce-operaties en beheer
- Parallelle computing voor MapReduce: vergelijking HPC vs Hadoop beheer
- MapReduce clusterbelasting
- Nodes en Daemons (JobTracker, TaskTracker)
- MapReduce UI-walkthrough
- MapReduce configuratie
- Job configuratie
- MapReduce optimaliseren
- Veiligstellen van MR: wat u uw programmeurs moet vertellen
- Labs: MapReduce-voorbeelden uitvoeren
- YARN: nieuwe architectuur en nieuwe mogelijkheden
- YARN ontwerpdoelen en implementatie-architectuur
- Nieuwe acteurs: ResourceManager, NodeManager, Application Master
- YARN installeren
- Jobplanning onder YARN
- Labs: jobplanning onderzoeken
- Geavanceerde onderwerpen
- Hardwaremonitoring
- Clustermonitoring
- Servers toevoegen en verwijderen, Hadoop upgraden
- Backup, herstel en planning voor bedrijfscontinuïteit
- Oozie job workflows
- Hadoop hoge beschikbaarheid (HA)
- Hadoop Federatie
- Uw cluster beveiligen met Kerberos
- Labs: monitoring instellen
- Optionele tracks
- Cloudera Manager voor clusterbeheer, monitoring en routinetaakjes; installatie, gebruik. In deze track worden alle oefeningen en labs uitgevoerd in de Cloudera distributieomgeving (CDH5)
- Ambari voor clusterbeheer, monitoring en routinetaakjes; installatie, gebruik. In deze track worden alle oefeningen en labs uitgevoerd binnen de Ambari cluster manager en Hortonworks Data Platform (HDP 2.0)
Vereisten
- op de hoogte zijn van basis Linux systeembeheer
- basis scriptingvaardigheden
Kennis van Hadoop en Distributed Computing is niet vereist, maar zal in het cursus worden geïntroduceerd en uitgelegd.
Labomgeving
Zero Install : Er is geen noodzaak om Hadoop-software te installeren op de machines van de studenten! Er wordt een werkende Hadoop-cluster voor de studenten geleverd.
Studenten moeten het volgende hebben
- een SSH-client (Linux en Mac hebben al ssh-clients, voor Windows is Putty aanbevolen)
- een browser om toegang te krijgen tot de cluster. We raden de Firefox-browser aan met de FoxyProxy-extensie geïnstalleerd
Leveringsopties
PRIVÉGROEPSTRAINING
Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.
- Pre-cursusgesprek met uw trainer
- Aanpassing van de leerervaring om uw doelen te bereiken -
- Op maat gemaakte overzichten
- Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
- Training gepland op een datum naar keuze
- Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen
Private Group Prices RRP from €6840 online delivery, based on a group of 2 delegates, €2160 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
OPENBARE TRAINING
Kijk op onze public courses
Reviews (5)
De live voorbeelden
Ahmet Bolat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
Automatisch vertaald
Tijdens de oefeningen legde James mij elke stap in detail uit waar ik vast liep. Ik was helemaal nieuw met NIFI. Hij legde het daadwerkelijke doel van NIFI uit, zelfs de basis zoals open source. Hij dekte elk concept van Nifi vanaf het Beginner Niveau tot het Developer Niveau.
Firdous Hashim Ali - MOD A BLOCK
Cursus - Apache NiFi for Administrators
Automatisch vertaald
Trainer's voorbereiding en organisatie, en kwaliteit van de materialen op github geleverd.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Cursus - Impala for Business Intelligence
Automatisch vertaald
Dat ik het in eerste instantie had.
Peter Scales - CACI Ltd
Cursus - Apache NiFi for Developers
Automatisch vertaald
praktische dingen van doen, ook de theorie werd goed verzorgd door Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Cursus - Hadoop Administration on MapR
Automatisch vertaald