Course Outline

Introductie

  • Overzicht van de functies en architectuur van Spark en Hadoop
  • Inzicht in big data
  • Python Basisprincipes van programmeren

Slag

  • Instellen van Python, Spark en Hadoop
  • Inzicht in datastructuren in Python
  • Inzicht in PySpark API
  • Inzicht in HDFS en MapReduce

Integratie van Spark en Hadoop met Python

  • Spark RDD implementeren in Python
  • Gegevens verwerken met MapReduce
  • Gedistribueerde gegevenssets maken in HDFS

Machine Learning met Spark MLlib

Verwerken Big Data met Spark Streaming

Werken met aanbevelingssystemen

Werken met Kafka, Sqoop, Kafka en Flume

Apache Mahout met Spark en Hadoop

Probleemoplossing

Samenvatting en volgende stappen

Requirements

  • Ervaring met Spark en Hadoop
  • Python programmeerervaring

Publiek

  • Datawetenschappers
  • Ontwikkelaars
 21 Hours

Getuigenissen (3)

Related Courses

Related Categories