Course Outline

Invoering

  • Waarom en hoe projectteams adopteren Hadoop
  • Hoe het allemaal begon
  • De rol van de projectmanager in Hadoop projecten

De architectuur en sleutelconcepten van Hadoop begrijpen

  • HDFS
  • KaartVerminderen
  • Andere delen van het Hadoop ecosysteem

Wat is Big Data?

Verschillende benaderingen van opslag Big Data

HDFS (Hadoop Distributed File System) als basis

Hoe Big Data wordt verwerkt

  • De kracht van gedistribueerde verwerking

Gegevens verwerken met MapReduce

  • Hoe data stap voor stap uit elkaar worden gehaald

De rol van clustering bij grootschalige gedistribueerde verwerking

  • Architectonisch overzicht
  • Clusterende benaderingen

Cluster uw gegevens en processen met YARN

De rol van niet-relationele Database in Big Data opslag

Werken met niet-relationele Database van Hadoop: HBase

Architectuuroverzicht datawarehousing

Je Data Warehouse beheren met Hive

Uitvoeren van Hadoop vanuit Shell-Scripts

Werken met Hadoop Streaming

Overige Hadoop Tools en hulpprogramma's

Aan de slag met een Hadoop-project

  • Demystificerende complexiteit

Een bestaand project migreren naar Hadoop

  • Overwegingen bij infrastructuur
  • Schaal verder dan uw toegewezen resources

Hadoop Projectbelanghebbenden en hun toolkits

  • Ontwikkelaars, datawetenschappers, businessanalisten en projectmanagers

Hadoop als basis voor nieuwe technologieën en benaderingen

Slotopmerkingen

Requirements

  • Een algemeen begrip van programmeren
  • Een goed begrip van databases
  • Basiskennis van Linux
  14 Hours
 

Getuigenissen (3)

Related Courses

Related Categories