Course Outline

Introductie

Dataiku installeren en configureren Data Science Studio (DSS)

  • Systeemvereisten voor Dataiku DSS
  • Apache Hadoop en Apache Spark integraties instellen
  • Dataiku DSS configureren met webproxy's
  • Migreren van andere platformen naar Dataiku DSS

Overzicht van Dataiku DSS-functies en -architectuur

  • Kernobjecten en grafieken die fundamenteel zijn voor Dataiku DSS
  • Wat is een recept in Dataiku DSS?
  • Soorten datasets die worden ondersteund door Dataiku DSS

Een Dataiku DSS-project maken

Gegevenssets definiëren om verbinding te maken met gegevensbronnen in Dataiku DSS

  • Werken met DSS-connectors en bestandsindelingen
  • Standaard DSS-indelingen versus Hadoop-specifieke indelingen
  • Bestanden uploaden voor een Dataiku DSS-project

Overzicht van het serverbestandssysteem in Dataiku DSS

Beheerde mappen maken en gebruiken

  • Dataiku DSS-recept voor samenvoegmap
  • Lokale versus niet-lokaal beheerde mappen

Een gegevensset van een bestandssysteem samenstellen met behulp van de inhoud van beheerde mappen

  • Opschonen met een DSS-coderecept

Werken met metrische gegevensset en interne gegevensset met statistieken

Implementatie van het DSS-downloadrecept voor HTTP-gegevensset

Verplaatsen van SQL datasets en HDFS-datasets met behulp van DSS

Datasets ordenen in Dataiku DSS

  • Schrijver bestellen vs. leestijd bestellen

Datavisuals verkennen en voorbereiden voor een Dataiku DSS-project

Overzicht van Dataiku-schema's, opslagtypen en betekenissen

Scripts voor het opschonen, normaliseren en verrijken van gegevens uitvoeren in Dataiku DSS

Werken met Dataiku DSS Charts Interface en soorten visuele aggregaties

Gebruikmakend van de interactieve Statistics-functie van DSS

  • Univariate analyse vs. bivariate analyse
  • Gebruik maken van de Principal Component Analysis (PCA) DSS-tool

Overzicht van Machine Learning met Dataiku DSS

  • ML onder toezicht versus ML zonder toezicht
  • Referenties voor DSS ML-algoritmen en -functies
  • Deep Learning met Dataiku DSS

Overzicht van de stroom afgeleid van DSS-datasets en -recepten

Bestaande gegevenssets in DSS transformeren met visuele recepten

DSS-recepten gebruiken op basis van door de gebruiker gedefinieerde code

Codeverkenning en -experimenten optimaliseren met DSS Code Notebooks

Geavanceerde DSS-visualisaties en aangepaste frontend-functies schrijven met webapps

Werken met Dataiku DSS Code Reports-functie

Gegevensprojecten delen Elements en vertrouwd raken met het DSS-dashboard

Ontwerpen en verpakken van een Dataiku DSS-project als een herbruikbare applicatie

Overzicht van geavanceerde methoden in Dataiku DSS

  • Geoptimaliseerde partitionering van gegevenssets implementeren met behulp van DSS
  • Uitvoeren van specifieke DSS-verwerkingsonderdelen door middel van berekeningen in Kubernetes containers

Overzicht van Collaboration en versiebeheer in Dataiku DSS

Automatiseringsscenario's, metrische gegevens en controles implementeren voor het testen van DSS-projecten

Een project implementeren en bijwerken met het DSS-automatiseringsknooppunt en de DSS-bundels

Werken met Real-Time API's in Dataiku DSS

  • Aanvullende API's en REST-API's in DSS

Analyseren en Forecasting Dataiku DSS-tijdreeksen

Een project beveiligen in Dataiku DSS

  • Projectmachtigingen en dashboardautorisaties beheren
  • Geavanceerde beveiligingsopties implementeren

Dataiku DSS integreren met de cloud

Probleemoplossing

Samenvatting en conclusie

Requirements

  • Ervaring met de programmeertalen Python, SQL en R
  • Basiskennis van gegevensverwerking met Apache Hadoop en Spark
  • Begrip van machine learning-concepten en datamodellen
  • Achtergrond in statistische analyses en data science-concepten
  • Ervaring met het visualiseren en communiceren van data

Publiek

  • Ingenieurs
  • Datawetenschappers
  • Data-analisten
 21 Hours

Related Courses

Related Categories