Cursusaanbod

Inleiding tot Gegevensanalyse en Big Data

  • Wat maakt Big Data 'groot'?
    • Snelheid, Volume, Variëteit, Betrouwbaarheid (VVVV)
  • Limieten van traditionele gegevensverwerking
  • Gedistribueerde verwerking
  • Statistische analyse
  • Type Machine Learning-analyse
  • Data visualisatie

Rollen en verantwoordelijkheden in Big Data

  • Beheerders
  • Ontwikkelaars
  • Dataanalisten

Talen die worden gebruikt voor gegevensanalyse

  • R-taal
    • Waarom R voor gegevensanalyse?
    • Gegevensmanipulatie, berekening en grafische weergave
  • Python
    • Waarom Python voor gegevensanalyse?
    • Manipuleren, verwerken, reinigen en samenvatten van gegevens

Benaderingen voor gegevensanalyse

  • Statistische analyse
    • Tijdreeksanalyse
    • Vooruitblik met correlatie- en regressiemodellen
    • Inferentiële statistiek (schatting)
    • Descriptieve statistiek in Big Data-sets (bijv. het berekenen van het gemiddelde)
  • Machine Learning
    • Toezichthoudend vs niet-toezichthoudend leren
    • Classificatie en clustering
    • Schatting van kosten voor specifieke methoden
    • Filtering
  • Natuurlijke taalverwerking
    • Tekstverwerking
    • Begrijpen van de betekenis van tekst
    • Automatische tekstgeneratie
    • Sentiment- en themaanalyse
  • Computer Vision
    • Afbeeldingen verkrijgen, verwerken, analyseren en begrijpen
    • 3D-scènes reconstrueren, interpreteren en begrijpen
    • Afbeeldingsgegevens gebruiken om beslissingen te nemen

Big Data-infrastructuur

  • Gegevensopslag
    • Gestructureerde databases (SQL)
      • MySQL
      • Postgres
      • Oracle
    • Niet-gestructureerde databases (NoSQL)
      • Cassandra
      • MongoDB
      • Neo4j
    • Inzicht in nuances
      • Hierarchische databases
      • Objectgeoriënteerde databases
      • Documentgeoriënteerde databases
      • Grafgeoriënteerde databases
      • Andere
  • Gedistribueerde verwerking
    • Hadoop
      • HDFS als gedistribueerd bestandssysteem
      • MapReduce voor gedistribueerde verwerking
    • Spark
      • All-in-one in-memory cluster computing framework voor grote gegevensverwerking
      • Gestructureerde streaming
      • Spark SQL
      • Machine Learning-bibliotheken: MLlib
      • Grafische verwerking met GraphX
  • Schaalbaarheid
    • Publieke cloud
      • AWS, Google, Aliyun, etc.
    • Prive-cloud
      • OpenStack, Cloud Foundry, etc.
    • Automatische schaalbaarheid

Het juiste oplossing kiezen voor het probleem

De toekomst van Big Data

Samenvatting en volgende stappen

Vereisten

  • Een algemeen begrip van wiskunde
  • Een algemeen begrip van programmeren
  • Een algemeen begrip van databases

Doelgroep

  • Ontwikkelaars / programmeurs
  • IT consultants
 35 Uren

Leveringsopties

PRIVÉGROEPSTRAINING

Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.

  • Pre-cursusgesprek met uw trainer
  • Aanpassing van de leerervaring om uw doelen te bereiken -
    • Op maat gemaakte overzichten
    • Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
  • Training gepland op een datum naar keuze
  • Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen

Private Group Prices RRP from €11400 online delivery, based on a group of 2 delegates, €3600 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.

Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen


OPENBARE TRAINING

Kijk op onze public courses

Reviews (7)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën