Course Outline

Snel overzicht

  • Gegevensbronnen
  • Gegevens in de gaten houden
  • Aanbevelingssystemen
  • Doel Marketing

Datatypes

  • Gestructureerd versus ongestructureerd
  • Statisch versus gestreamd
  • Attitude-, gedrags- en demografische gegevens
  • Datagestuurde versus gebruikersgestuurde analyses
  • Geldigheid van de gegevens
  • Volume, snelheid en verscheidenheid aan gegevens

Modellen

  • Modellen bouwen
  • Statistische modellen
  • Machinaal leren

Classificatie van gegevens

  • Clustering
  • kGroepen, k-betekent, de naaste buren
  • Mierenkolonies, vogels die massaal toestromen

Voorspellende modellen

  • Beslisbomen
  • Ondersteuning vectormachine
  • Naïeve Bayes-classificatie
  • Neurale netwerken
  • Markov Model
  • Regressie
  • Ensemble methoden

ROI

  • Kosten-batenverhouding
  • Kosten van software
  • Kosten van ontwikkeling
  • Potentiële voordelen

Modellen bouwen

  • Voorbereiding van gegevens (MapReduce)
  • Gegevens opschonen
  • Methoden kiezen
  • Model ontwikkelen
  • Model testen
  • Evaluatie van het model
  • Implementatie en integratie van modellen

Overzicht van Open Source en commerciële software

  • Selectie R-projectpakket
  • Python Bibliotheken
  • Hadoop en Mahout
  • Geselecteerde Apache-projecten met betrekking tot Big Data en Analytics
  • Geselecteerde commerciële oplossing
  • Integratie met bestaande software en databronnen

Requirements

Inzicht in traditionele databeheer- en analysemethoden zoals SQL, datawarehouses, business intelligence, OLAP, enz... Inzicht in basisstatistieken en waarschijnlijkheid (gemiddelde, variantie, waarschijnlijkheid, voorwaardelijke waarschijnlijkheid, enz...)

 21 Hours

Getuigenissen (1)

Related Courses

Data Vault: Building a Scalable Data Warehouse

28 Hours

Spark Streaming with Python and Kafka

7 Hours

Confluent KSQL

7 Hours

Apache Ignite for Developers

14 Hours

Unified Batch and Stream Processing with Apache Beam

14 Hours

Apache Apex: Processing Big Data-in-Motion

21 Hours

Apache Storm

28 Hours

Apache NiFi for Administrators

21 Hours

Apache NiFi for Developers

7 Hours

Apache Flink Fundamentals

28 Hours

Python and Spark for Big Data (PySpark)

21 Hours

Introduction to Graph Computing

28 Hours

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

21 Hours

Apache Spark MLlib

35 Hours

Knowledge Discovery in Databases (KDD)

21 Hours

Related Categories