Course Outline

Inleiding tot Data Analysis en Big Data

    Wat maakt Big Data "groot"? Snelheid, volume, variëteit, waarheidsgetrouwheid (VVVV)
Grenzen aan traditionele gegevensverwerking
  • Gedistribueerde verwerking
  • Statistische analyse
  • Soorten Machine Learning analyses
  • Data Visualization
  • Big Data Rollen en verantwoordelijkheden
  • Beheerders Ontwikkelaars Data-analisten

      Languages Gebruikt voor gegevensanalyse

    R Language Waarom R voor data-analyse? Gegevensmanipulatie, berekening en grafische weergave

      Python Waarom Python voor data-analyse?
    Gegevens manipuleren, verwerken, opschonen en verwerken
  • Benaderingen van Data Analysis
  • Statistische analyse Tijdreeksanalyse Prognoses met correlatie- en regressiemodellen Inferentieel Statistics (schatten) Beschrijvend Statistics in Big Data-sets (bijv. gemiddelde berekenen)
  • Machine Learning Begeleid versus onbewaakt leren

      Classificatie en clustering
    Het schatten van de kosten van specifieke methoden
  • Filteren
  • Natuurlijke taalverwerking Tekst verwerken
  • Betekenis van de tekst begrijpen
  • Automatische tekstgeneratie
  • Sentimentanalyse / topicanalyse
  • Computer Vision Beelden verwerven, verwerken, analyseren en begrijpen
  • Reconstrueren, interpreteren en begrijpen van 3D-scènes
  • Beeldgegevens gebruiken om beslissingen te nemen
  • Big Data Infrastructuur
  • Gegevensopslag Relationele databases (SQL) MijnSQL Postgres Oracle
  • Niet-relationele databases (NeeSQL) Cassandra
  • MongoDB
  • Neo4js
  • De nuances begrijpen Hiërarchische databases

      Objectgeoriënteerde databases
    Documentgeoriënteerde databases
  • Grafiekgeoriënteerde databases
  • Ander
  • Gedistribueerde verwerking Hadoop HDFS als gedistribueerd bestandssysteem
  • MapReduce voor gedistribueerde verwerking
  • Spark Alles-in-één in-memory cluster computing-framework voor grootschalige gegevensverwerking
  • Gestructureerde streaming
  • Vonk SQL
  • Machine Learning bibliotheken: MLlib
  • Grafiekverwerking met GraphX
  • Scalamogelijkheid Publieke cloud AWS, Google, Aliyun, enz.Privécloud OpenStack, Cloud Foundry, enz.
  • Automatische schaalbaarheid
  • Het kiezen van de juiste oplossing voor het probleem
  • De toekomst van Big Data
  • Samenvatting en conclusie
  • Requirements

    • Een algemeen begrip van wiskunde.
    • Een algemeen begrip van programmeren.
    • Een algemeen begrip van databases.

    Publiek

    • Ontwikkelaars / programmeurs
    • IT-consultants
     35 Hours

    Getuigenissen (2)

    Related Courses

    Related Categories