Course Outline

  1. Grondbeginselen van big data
    • Big Data en zijn rol in de bedrijfswereld
    • De fasen van de ontwikkeling van een Big Data strategie binnen een bedrijf
    • Leg de grondgedachte uit die ten grondslag ligt aan een holistische benadering van Big Data
    • Componenten die nodig zijn in een Big Data platform
    • Oplossing voor grote gegevensopslag
    • Grenzen van traditionele technologieën
    • Overzicht van databasetypen
    • De vier dimensies van Big Data
  2. De impact van big data op het bedrijfsleven
    • Business belang van Big Data
    • Uitdagingen bij het extraheren van nuttige gegevens
    • Big data integreren met traditionele data
  3. Technologieën voor big data-opslag
    • Overzicht van big data-technologieën
      • Modellen voor gegevensopslag
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Het kiezen van de juiste big data-technologie
  4. Het verwerken van grote gegevens
    • Gegevens verbinden en extraheren uit de database
    • Gegevens transformeren en voorbereiden voor verwerking
    • Hadoop MapReduce gebruiken voor het verwerken van gedistribueerde gegevens
    • Bewaken en uitvoeren van Hadoop MapReduce-taken
    • Hadoop bouwstenen voor gedistribueerde bestandssystemen
    • Mapreduce en Yarn
    • Streaminggegevens verwerken met Spark
  5. Big data-analysetools en -technologieën
    • Programming Hadoop met varkenslatijnse taal
    • Big data opvragen met Hive
    • Gegevens delven met Mahout
    • Visualisatie- en rapportagetools
  6. Big data in het bedrijfsleven
    • Beheren en vaststellen van Big Data behoeften
    • Business belang van Big Data
    • Het selecteren van de juiste big data-tools voor het probleem

Datawarehousing-concepten

  • Wat is Datawarehouse?
  • Verschil tussen OLTP en Data Ware Housing
  • Gegevensverzameling
  • Data-extractie
  • Gegevenstransformatie.
  • Gegevens laden
  • Datamarts
  • Afhankelijke versus onafhankelijke data Mart
  • Database-ontwerp

ETL-testconcepten:

  • Invoering.
  • Levenscyclus van softwareontwikkeling.
  • Methodologieën testen.
  • ETL-testen van werkstroomproces.
  • ETL-testverantwoordelijkheden in de datafase.

Grondbeginselen van big data

  • Big Data en zijn rol in de bedrijfswereld
  • De fasen van de ontwikkeling van een Big Data strategie binnen een bedrijf
  • Leg de grondgedachte uit die ten grondslag ligt aan een holistische benadering van Big Data
  • Componenten die nodig zijn in een Big Data platform
  • Oplossing voor grote gegevensopslag
  • Grenzen van traditionele technologieën
  • Overzicht van databasetypen

NoSQL Databases

Hadoop

Kaart verkleinen

Apache Spark

Requirements

Afgevaardigden moeten zich bewust zijn van en enige ervaring hebben met opslaghulpmiddelen en zich bewust zijn van het omgaan met grote datasets

 14 Hours

Getuigenissen (4)

Related Courses

Unified Batch and Stream Processing with Apache Beam

14 Hours

Related Categories