Course Outline
Introductie
- Overzicht van de functies en architectuur van Spark en Hadoop
- Inzicht in big data
- Python Basisprincipes van programmeren
Slag
- Instellen van Python, Spark en Hadoop
- Inzicht in datastructuren in Python
- Inzicht in PySpark API
- Inzicht in HDFS en MapReduce
Integratie van Spark en Hadoop met Python
- Spark RDD implementeren in Python
- Gegevens verwerken met MapReduce
- Gedistribueerde gegevenssets maken in HDFS
Machine Learning met Spark MLlib
Verwerken Big Data met Spark Streaming
Werken met aanbevelingssystemen
Werken met Kafka, Sqoop, Kafka en Flume
Apache Mahout met Spark en Hadoop
Probleemoplossing
Samenvatting en volgende stappen
Requirements
- Ervaring met Spark en Hadoop
- Python programmeerervaring
Publiek
- Datawetenschappers
- Ontwikkelaars
Getuigenissen (3)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
I liked that it managed to lay the foundations of the topic and go to some quite advanced exercises. Also provided easy ways to write/test the code.
Ionut Goga - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
The live examples