Course Outline

Invoering

    De Data Science procesrollen en verantwoordelijkheden van een datawetenschapper

Het voorbereiden van de ontwikkelomgeving

    Bibliotheken, raamwerken, talen en hulpmiddelen Lokale ontwikkeling Gezamenlijke webgebaseerde ontwikkeling

Gegevensverzameling

    Verschillende soorten gegevens Gestructureerd Lokale databases Databaseconnectoren Algemene formaten: xlxs, XML, Json, csv, ...
Ongestructureerde klikken, censors, smartphones
  • API's
  • Internet of Things (IoT)
  • Documenten, afbeeldingen, video's, geluiden
  • Casestudy: Het continu verzamelen van grote hoeveelheden ongestructureerde gegevens
  • Data opslagRelationele databases Niet-relationele databases Hadoop: Distributed File System (HDFS) Spark: Veerkrachtige Distributed Dataset (RDD) Cloudopslag
  • Data voorbereiding
  • Opname, selectie, opschoning en transformatie Waarborgen van gegevenskwaliteit - correctheid, betekenis en veiligheid Uitzonderingsrapporten

      Languages gebruikt voor voorbereiding, verwerking en analyse

    R-taal Inleiding tot R Gegevensmanipulatie, berekening en grafische weergave

      Python Inleiding tot Python

    Gegevens manipuleren, verwerken, opschonen en verwerken

      Gegevensanalyse
    Verkennende analyse Basisstatistieken Visualisaties opstellen Begrijp gegevens
  • Causaliteit
  • Kenmerken en transformaties
  • Machine Learning Onder toezicht versus niet-gesurpeviseerd

      Wanneer gebruik je welk model?
    Natural Language Processing (NLP)
  • Data Visualization
  • Best Practices Het juiste diagram voor de juiste gegevens selecteren Kleurenpallets Naar een hoger niveau tillen Dashboards Interactieve visualisaties
  • Verhalen vertellen met data
  • Samenvatting en conclusie
  • Requirements

    • Een algemeen begrip van databaseconcepten
    • Een basiskennis van statistiek
     35 Hours

    Getuigenissen (2)

    Related Categories