Course Outline

Invoering

  • Inleiding tot Cloud Computing en Big Data oplossingen
  • Overzicht van Apache Hadoop Functies en architectuur

Opstellen Hadoop

  • Een Hadoop cluster plannen (on-premise, cloud, enz.)
  • Het besturingssysteem en Hadoop distributie selecteren
  • Voorzieningen voor resources (hardware, netwerk, etc.)
  • Het downloaden en installeren van de software
  • Het cluster op maat maken voor flexibiliteit

Werken met HDFS

  • Inzicht in het Hadoop gedistribueerde bestandssysteem (HDFS)
  • Overzicht van HDFS-opdrachtreferentie
  • AccessHDFS inschakelen
  • Basisbestandsbewerkingen uitvoeren op HDFS
  • S3 gebruiken als aanvulling op HDFS

Overzicht van de MapReduce

  • Gegevensstroom begrijpen in het MapReduce Framework
  • In kaart brengen, shuffle, sorteren en verkleinen
  • Demo: Computing-topsalarissen

Werken met GAREN

  • Inzicht in hulpbronnenbeheer in Hadoop
  • Werken met ResourceManager, NodeManager, Applicatiemaster
  • Taken plannen onder YARN
  • Planning voor grote aantallen knooppunten en clusters
  • Demo: Taakplanning

Integratie van Hadoop met Spark

  • Opslag instellen voor Spark (HDFS, Amazon, S3, NoSQL, etc.)
  • Veerkrachtige gedistribueerde datasets (RDD's) begrijpen
  • Een RDD maken
  • Implementatie van RDD-transformaties
  • Demo: implementatie van een tekstprogramma Search voor filmtitels

Beheer van een Hadoop cluster

  • Toezicht Hadoop
  • Het beveiligen van een Hadoop cluster
  • Knooppunten toevoegen en verwijderen
  • Het uitvoeren van een prestatiebenchmark
  • Een Hadoop cluster afstemmen op het optimaliseren van de prestaties
  • Back-up-, herstel- en bedrijfscontinuïteitsplanning
  • Zorgen voor hoge beschikbaarheid (HA)

Een Hadoop cluster upgraden en migreren

  • Beoordelen van de werklastvereisten
  • Upgraden Hadoop
  • Van on-premise naar de cloud en vice versa
  • Herstellen van mislukkingen

Probleemoplossen

Samenvatting en conclusie

Requirements

  • Ervaring met systeembeheer
  • Ervaring met de opdrachtregel Linux.
  • Een goed begrip van big data-concepten

Publiek

  • Systeembeheerders
  • DBA's
 35 Hours

Getuigenissen (7)

Related Courses

Related Categories