Hadoop Administration Training Cursus
De cursus is bedoeld voor IT-specialisten die op zoek zijn naar een oplossing om grote datasets op te slaan en te verwerken in een gedistribueerde systeemomgeving
Doel van de cursus:
Kennis opdoen met betrekking tot Hadoop clusterbeheer
Cursusaanbod
Inleiding tot Cloud Computing en Big Data oplossingen
Apache Hadoop evolutie: HDFS, MapReduce, YARN
Installatie en configuratie van Hadoop in Pseudo-gedistribueerde modus
MapReduce-taken uitvoeren op Hadoop-cluster
Hadoop Planning, installatie en configuratie van clusters
Hadoop ecosysteem: Varken, Hive, Sqoop, HBase
- Big Data toekomst: Impala, Cassandra
Vereisten
- basis Linux administratieve vaardigheden
- Basis programmeervaardigheden
Leveringsopties
PRIVÉGROEPSTRAINING
Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.
- Pre-cursusgesprek met uw trainer
- Aanpassing van de leerervaring om uw doelen te bereiken -
- Op maat gemaakte overzichten
- Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
- Training gepland op een datum naar keuze
- Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen
Private Group Prices RRP from €6840 online delivery, based on a group of 2 delegates, €2160 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
OPENBARE TRAINING
Kijk op onze public courses
Hulp nodig bij het kiezen van de juiste cursus?
Hadoop Administration Training Cursus - Enquiry
Hadoop Administration - Consultancyaanvraag
Consultancyaanvraag
Reviews (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
During the exercises, James explained me every step whereever I was getting stuck in more detail. I was completely new to NIFI. He explained the actual purpose of NIFI, even the basics such as open source. He covered every concept of Nifi starting from Beginner Level to Developer Level.
Firdous Hashim Ali - MOD A BLOCK
Cursus - Apache NiFi for Administrators
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Cursus - Impala for Business Intelligence
That I had it in the first place.
Peter Scales - CACI Ltd
Cursus - Apache NiFi for Developers
practical things of doing, also theory was served good by Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Cursus - Hadoop Administration on MapR
Voorlopige Aankomende Cursussen
Gerelateerde cursussen
Administrator Training for Apache Hadoop
35 UrenAudiëntie:
De cursus is bedoeld voor IT-specialisten die op zoek zijn naar een oplossing om grote datasets op te slaan en te verwerken in een gedistribueerde systeemomgeving
Goal:
Diepgaande kennis van Hadoop clusterbeheer.
Big Data Analytics in Health
21 UrenBig data-analyse omvat het proces van het onderzoeken van grote hoeveelheden gevarieerde gegevenssets om correlaties, verborgen patronen en andere nuttige inzichten te ontdekken.
De gezondheidsindustrie heeft enorme hoeveelheden complexe heterogene medische en klinische gegevens. Het toepassen van big data-analyses op gezondheidsgegevens biedt een enorm potentieel voor het verkrijgen van inzichten voor het verbeteren van de gezondheidszorg. De enorme omvang van deze datasets vormt echter grote uitdagingen bij analyses en praktische toepassingen in een klinische omgeving.
In deze door een instructeur geleide, live training (op afstand), leren deelnemers hoe ze big data-analyses in gezondheid kunnen uitvoeren terwijl ze een reeks praktische live-laboefeningen doorlopen.
Aan het einde van deze training kunnen deelnemers:
- Installeer en configureer big data-analysehulpmiddelen zoals Hadoop MapReduce en Spark
- Begrijp de kenmerken van medische gegevens
- Pas big data-technieken toe om met medische gegevens om te gaan
- Bestudeer big data-systemen en algoritmen in het kader van gezondheidstoepassingen
Publiek
- ontwikkelaars
- Data Scientists
Indeling van de cursus
- Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen.
Notitie
- Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
Hadoop For Administrators
21 UrenApache Hadoop is het meest populaire framework voor verwerking Big Data op clusters van servers. In deze driedaagse (optioneel vier) daagse cursus leren deelnemers over de zakelijke voordelen en gebruiksscenario's voor Hadoop en het ecosysteem, hoe ze de implementatie en groei van clusters kunnen plannen, hoe ze kunnen installeren, onderhouden, monitoren, problemen oplossen en optimaliseren Hadoop. Ze zullen ook oefenen met het laden van bulkgegevens in clusters, vertrouwd raken met verschillende Hadoop distributies en oefenen met het installeren en beheren van Hadoop ecosysteemtools. De cursus wordt afgesloten met een bespreking van het beveiligen van clusters met Kerberos.
“… De materialen waren zeer goed voorbereid en grondig behandeld. Het Lab was zeer behulpzaam en goed georganiseerd"
— Andrew Nguyen, Principal Integration DW Engineer, Microsoft Online Advertising
Audiëntie
Hadoop Beheerders
Formatteren
Lezingen en hands-on labs, ongeveer 60% hoorcolleges, 40% labs.
Hadoop for Developers (4 days)
28 UrenApache Hadoop is het meest populaire framework voor verwerking Big Data op clusters van servers. In deze cursus laat een ontwikkelaar kennismaken met verschillende componenten (HDFS, MapReduce, Pig, Hive en HBase) Hadoop ecosysteem.
Advanced Hadoop for Developers
21 UrenApache Hadoop is een van de meest populaire frameworks voor verwerking Big Data op clusters van servers. Deze cursus gaat dieper in op gegevensbeheer in HDFS, advanced Pig, Hive en HBase. Deze geavanceerde programmeertechnieken zullen nuttig zijn voor ervaren Hadoop ontwikkelaars.
Doelgroep: ontwikkelaars
Duur: drie dagen
Vorm: hoorcolleges (50%) en hands-on labs (50%).
Hadoop Administration on MapR
28 UrenAudiëntie:
Deze cursus is bedoeld om big data/hadoop-technologie te demystificeren en te laten zien dat het niet moeilijk te begrijpen is.
Hadoop and Spark for Administrators
35 UrenDeze instructeur-geleide, live training in Nederland (op locatie of op afstand) is gericht op systeembeheerders die willen leren hoe ze clusters binnen hun organisatie kunnen opzetten, implementeren en beheren.
Aan het einde van deze training kunnen deelnemers:
- Installeer en configureer Apache Hadoop.
- Begrijp de vier belangrijkste componenten in het Hadoop-ecosysteem: HDFS, MapReduce, YARN en Hadoop Common.
- Gebruik Hadoop Distributed File System (HDFS) om een cluster te schalen naar honderden of duizenden knooppunten.
- Stel HDFS in om te functioneren als opslagengine voor on-premise Spark-implementaties.
- Stel Spark in voor toegang tot alternatieve opslagoplossingen zoals Amazon S3 en NoSQL databasesystemen zoals Redis, Elasticsearch, Couchbase, Aerospike, enz.
- Voer administratieve taken uit zoals het inrichten, beheren, monitoren en beveiligen van een Apache Hadoop-cluster.
HBase for Developers
21 UrenDeze cursus introduceert HBase - een No SQL store bovenop Hadoop . De cursus is bedoeld voor ontwikkelaars die HBase gaan gebruiken om applicaties te ontwikkelen, en beheerders die HBase-clusters gaan beheren.
We zullen een ontwikkelaar door HBase-architectuur en datamodellering en applicatie-ontwikkeling op HBase leiden. Er wordt ook ingegaan op het gebruik van MapReduce met HBase en enkele beheeronderwerpen met betrekking tot prestatieoptimalisatie. De cursus is zeer praktisch met veel laboratoriumoefeningen.
Duur : 3 dagen
Publiek : ontwikkelaars en beheerders
Hortonworks Data Platform (HDP) for Administrators
21 UrenDeze live training onder leiding van een instructeur in Nederland (online of ter plaatse) introduceert Hortonworks Data Platform (HDP) en leidt deelnemers door de implementatie van de Spark + Hadoop-oplossing.
Aan het einde van deze training zijn de deelnemers in staat om:
- Gebruik Hortonworks om op grote schaal betrouwbaar Hadoop uit te voeren.
- Integreer de beveiligings-, governance- en operationele mogelijkheden van Hadoop met de flexibele analytische workflows van Spark.
- Gebruik Hortonworks om elk van de componenten in een Spark-project te onderzoeken, te valideren, te certificeren en te ondersteunen.
- Verwerk verschillende soorten gegevens, waaronder gestructureerde, ongestructureerde, in-beweging en stilstaande gegevens.
Data Analysis with Hive/HiveQL
7 UrenDeze cursus behandelt het gebruik van Hive SQL taal (AKA: Hive HQL, SQL on Hive , Hive QL) voor mensen die gegevens uit Hive
Impala for Business Intelligence
21 UrenCloudera Impala is een open source massively parallel processing (MPP) SQL query engine voor Apache Hadoop clusters.
Impala stelt gebruikers in staat om SQL query's met lage latentie uit te voeren op gegevens die zijn opgeslagen in Hadoop Distributed File System en Apache Hbase zonder dat gegevensverplaatsing of -transformatie nodig is.
Audiëntie
Deze cursus is bedoeld voor analisten en datawetenschappers die analyses uitvoeren op gegevens die zijn opgeslagen in Hadoop via Business Intelligence of SQL tools.
Na afloop van deze cursus zijn de deelnemers in staat om
- Haal zinvolle informatie uit Hadoop clusters met Impala.
- Schrijf specifieke programma's om Business Intelligentie in Impala SQL Dialect te vergemakkelijken.
- Problemen oplossen Impala.
Apache NiFi for Administrators
21 UrenIn deze live training onder leiding van een instructeur in Nederland (ter plaatse of op afstand) leren deelnemers hoe ze Apache NiFi kunnen implementeren en beheren in een live labomgeving.
Aan het einde van deze training zijn de deelnemers in staat om:
- Installeer en configureer Apachi NiFi.
- Bron, transformeer en beheer gegevens uit ongelijksoortige, gedistribueerde gegevensbronnen, waaronder databases en big data lakes.
- Automatiseer gegevensstromen.
- Schakel streaminganalyse in.
- Pas verschillende benaderingen toe voor gegevensopname.
- Transformeer Big Data en naar zakelijke inzichten.
Apache NiFi for Developers
7 UrenIn deze door een instructeur geleide, live training in Nederland leren deelnemers de basisprincipes van flow-based programmeren terwijl ze een aantal demo-extensies, componenten en processors ontwikkelen met behulp van Apache NiFi.
Aan het einde van deze training zijn de deelnemers in staat om:
- Begrijp de architectuur en dataflowconcepten van NiFi.
- Ontwikkel extensies met behulp van NiFi en API's van derden.
- Op maat ontwikkelen van hun eigen Apache Nifi processor.
- Neem real-time gegevens op en verwerk ze uit ongelijksoortige en ongebruikelijke bestandsindelingen en gegevensbronnen.
Python, Spark, and Hadoop for Big Data
21 UrenDeze live training in Nederland onder leiding van een instructeur (online of op locatie) is bedoeld voor ontwikkelaars die Spark, Hadoop en Python willen gebruiken en integreren om grote en complexe datasets te verwerken, analyseren en transformeren.
Aan het einde van deze training zijn de deelnemers in staat om:
- Zet de benodigde omgeving in om te beginnen met het verwerken van big data met Spark, Hadoop en Python.
- Krijg inzicht in de functies, kernonderdelen en architectuur van Spark en Hadoop.
- Leer hoe u Spark, Hadoop en Python kunt integreren voor de verwerking van big data.
- Verken de tools in het Spark-ecosysteem (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka en Flume).
- Bouw gezamenlijke filteraanbevelingssystemen die vergelijkbaar zijn met Netflix, YouTube, Amazon, Spotify en Google.
- Gebruik Apache Mahout om machine learning-algoritmen te schalen.