Talend Big Data Integration Training Cursus
Talend Open Studio voor Big Data is een open source ETL-tool voor het verwerken van grote gegevens. Het omvat een ontwikkelingsomgeving om te interageren met Big Data bronnen en doelen, en werk te doen zonder te moeten schrijven code.
Deze instructeur geleide, live training (online of on-site) is gericht op technische personen die Open Studio voor Big Data willen implementeren om het proces van lezen en crunching door Big Data te vereenvoudigen.
Aan het einde van deze training zullen de deelnemers in staat zijn:
- Installeer en installeer Talend Open Studio voor Big Data.
- Verbinden met Big Data systemen zoals Cloudera, HortonWorks, MapR, Amazon EMR en Apache.
- Begrijp en installeer Open Studio's big data componenten en verbinders.
- Configureer parameters om automatisch MapReduce-code te genereren.
- Gebruik Open Studio's drag-and-drop interface om Hadoop werkzaamheden uit te voeren.
- Prototype big data pipelines.
- Automatische big data integratieprojecten.
Format van de cursus
- Interactieve lezingen en discussie.
- Veel oefeningen en oefeningen.
- Hand-on implementatie in een live-lab-omgeving.
Cursus aanpassingsopties
- Om een aangepaste training voor deze cursus te vragen, neem dan contact met ons op om te organiseren.
Cursusaanbod
Invoering
Overzicht van de functies en architectuur van "Open Studio voor Big Data".
Open Studio instellen voor Big Data
Navigeren door de gebruikersinterface
Inzicht in Big Data componenten en connectoren
Verbinding maken met een Hadoop cluster
Gegevens lezen en schrijven
Gegevens verwerken met Hive en MapReduce
Het analyseren van de resultaten
Verbetering van de kwaliteit van Big Data
Een Big Data-pijplijn bouwen
Gebruikers, groepen, rollen en projecten beheren
Open Studio implementeren voor productie
Toezicht op Open Studio
Probleemoplossen
Samenvatting en conclusie
Vereisten
- Inzicht in relationele databases
- Inzicht in datawarehousing
- Een goed begrip van ETL-concepten (Extract, Transform, Load).
Publiek
- Professionals op het gebied van business intelligence
- Databaseprofessionals
- SQL Ontwikkelaars
- ETL-ontwikkelaars
- Oplossingsarchitecten
- Data-architecten
- Professionals op het gebied van datawarehousing
- Systeembeheerders en integrators
Leveringsopties
PRIVÉGROEPSTRAINING
Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.
- Pre-cursusgesprek met uw trainer
- Aanpassing van de leerervaring om uw doelen te bereiken -
- Op maat gemaakte overzichten
- Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
- Training gepland op een datum naar keuze
- Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen
Private Group Prices RRP from €9120 online delivery, based on a group of 2 delegates, €2880 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
OPENBARE TRAINING
Kijk op onze public courses
Hulp nodig bij het kiezen van de juiste cursus?
opleidingen@nobleprog.com of +31 208 080 666
Talend Big Data Integration Training Cursus - Enquiry
Talend Big Data Integration - Consultancyaanvraag
Consultancyaanvraag
Reviews (5)
Veel praktijkvoorbeelden, verschillende manieren om hetzelfde probleem aan te pakken, en soms niet zo voor de hand liggende trucs om de huidige oplossing te verbeteren
Rafal - Nordea
Cursus - Apache Spark MLlib
Automatisch vertaald
how the trainor shows his knowledge in the subject he's teachign
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Cursus - Data Vault: Building a Scalable Data Warehouse
During the exercises, James explained me every step whereever I was getting stuck in more detail. I was completely new to NIFI. He explained the actual purpose of NIFI, even the basics such as open source. He covered every concept of Nifi starting from Beginner Level to Developer Level.
Firdous Hashim Ali - MOD A BLOCK
Cursus - Apache NiFi for Administrators
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Cursus - Impala for Business Intelligence
That I had it in the first place.
Peter Scales - CACI Ltd
Cursus - Apache NiFi for Developers
Voorlopige Aankomende Cursussen
Gerelateerde cursussen
Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
21 UrenDeze cursus is bedoeld voor ontwikkelaars en datawetenschappers die AI willen begrijpen en implementeren in hun toepassingen. Er wordt speciale aandacht besteed aan data-analyse, gedistribueerde kunstmatige intelligentie en natuurlijke taalverwerking.
Unified Batch and Stream Processing with Apache Beam
14 UrenApache Beam is een open source, uniform programmeermodel voor het definiëren en uitvoeren van parallelle gegevensverwerkingspijplijnen. De kracht ligt in de mogelijkheid om zowel batch- als streaming-pijplijnen uit te voeren, waarbij de uitvoering wordt uitgevoerd door een van de ondersteunde gedistribueerde verwerkingsback-ends van Beam: Apache Apex, Apache Flink, Apache Spark en Google Cloud Dataflow. Apache Beam is handig voor ETL-taken (Extract, Transform en Load), zoals het verplaatsen van gegevens tussen verschillende opslagmedia en gegevensbronnen, het transformeren van gegevens naar een meer wenselijk formaat en het laden van gegevens op een nieuw systeem.
In deze live training onder leiding van een instructeur (op locatie of op afstand) leren deelnemers hoe ze de Apache Beam SDK's kunnen implementeren in een Java of Python applicatie die een gegevensverwerkingspijplijn definieert voor het opsplitsen van een grote dataset in kleinere brokken voor onafhankelijke, parallelle verwerking.
Aan het einde van deze training zijn de deelnemers in staat om:
- Installeer en configureer Apache Beam.
- Gebruik een enkel programmeermodel om zowel batch- als streamverwerking uit te voeren vanuit hun Java of Python toepassing.
- Voer pijplijnen uit in meerdere omgevingen.
Vorm van de cursus
- Deels lezing, deels discussie, oefeningen en zware hands-on oefening
Notitie
- Deze cursus zal in de toekomst beschikbaar zijn Scala. Neem contact met ons op om dit te regelen.
Data Vault: Building a Scalable Data Warehouse
28 UrenIn deze live training onder leiding van een instructeur in Nederland leren deelnemers hoe ze een Data Vault kunnen bouwen.
Aan het einde van deze training zijn de deelnemers in staat om:
- Begrijp de architectuur- en ontwerpconcepten achter Data Vault 2.0 en de interactie met Big Data, NoSQL en AI.
- Gebruik technieken voor het opslaan van gegevens om controles, traceringen en inspecties van historische gegevens in een datawarehouse mogelijk te maken.
- Ontwikkel een consistent en herhaalbaar ETL-proces (Extract, Transform, Load).
- Bouw en implementeer zeer schaalbare en herhaalbare magazijnen.
Data Virtualization with Denodo Platform
14 UrenDeze live training onder leiding van een instructeur in Nederland (online of ter plaatse) is bedoeld voor architecten, ontwikkelaars en beheerders die Denodo Platform willen gebruiken om gegevensbeheer te optimaliseren en te versnellen door middel van gegevensvirtualisatie.
Aan het einde van deze training zijn de deelnemers in staat om:
- Installeer en configureer Denodo Platform.
- Begrijp de functies en architectuur van Denodo Platform.
- Krijg inzicht in de belangrijkste concepten, voordelen en gebruiksscenario's voor gegevensvirtualisatie.
- Meer informatie over het configureren en beheren van de Denodo Platform-server.
- Implementeer gegevensbeveiliging, gebruikerstoegang en serviceverificatie.
- Pas de tools en technieken toe voor operationele monitoring en prestatie-optimalisatie.
Apache Flink Fundamentals
28 UrenDeze live training onder leiding van een instructeur in Nederland (online of ter plaatse) introduceert de principes en benaderingen achter gedistribueerde stream- en batchgegevensverwerking, en begeleidt deelnemers bij het maken van een real-time toepassing voor gegevensstreaming in Apache Flink.
Aan het einde van deze training zijn de deelnemers in staat om:
- Zet een omgeving op voor het ontwikkelen van toepassingen voor data-analyse.
- Begrijp hoe de grafische verwerkingsbibliotheek van Apache Flink (Gelly) werkt.
- Verpak, voer uit en bewaak op Fusen gebaseerde, fouttolerante toepassingen voor gegevensstreaming.
- Beheer diverse workloads.
- Voer geavanceerde analyses uit.
- Stel een Flink-cluster met meerdere knooppunten in.
- Meet en optimaliseer prestaties.
- Integreer Flink met verschillende Big Data systemen.
- Vergelijk de mogelijkheden van Flink met die van andere frameworks voor de verwerking van big data.
Introduction to Graph Computing
28 UrenIn deze door een instructeur geleide, live training in Nederland, leren deelnemers over het technologieaanbod en de implementatiebenaderingen voor het verwerken van grafiekgegevens. Het doel is om objecten uit de echte wereld, hun kenmerken en relaties te identificeren, deze relaties vervolgens te modelleren en ze als gegevens te verwerken met behulp van een Graph Computing (ook bekend als Graph Analytics) benadering. We beginnen met een breed overzicht en beperken ons tot specifieke tools terwijl we een reeks casestudy's, hands-on oefeningen en live implementaties doorlopen.
Aan het einde van deze training zijn de deelnemers in staat om:
- Begrijp hoe grafiekgegevens worden bewaard en doorkruist.
- Selecteer het beste framework voor een bepaalde taak (van graph databases tot batch processing frameworks).
- Implementeer Hadoop, Spark, GraphX en Pregel om grafiekberekeningen op veel machines parallel uit te voeren.
- Bekijk real-world big data-problemen in termen van grafieken, processen en traversals.
Hortonworks Data Platform (HDP) for Administrators
21 UrenDeze live training onder leiding van een instructeur in Nederland (online of ter plaatse) introduceert Hortonworks Data Platform (HDP) en leidt deelnemers door de implementatie van de Spark + Hadoop-oplossing.
Aan het einde van deze training zijn de deelnemers in staat om:
- Gebruik Hortonworks om op grote schaal betrouwbaar Hadoop uit te voeren.
- Integreer de beveiligings-, governance- en operationele mogelijkheden van Hadoop met de flexibele analytische workflows van Spark.
- Gebruik Hortonworks om elk van de componenten in een Spark-project te onderzoeken, te valideren, te certificeren en te ondersteunen.
- Verwerk verschillende soorten gegevens, waaronder gestructureerde, ongestructureerde, in-beweging en stilstaande gegevens.
Data Analysis with Hive/HiveQL
7 UrenDeze cursus behandelt het gebruik van Hive SQL taal (AKA: Hive HQL, SQL on Hive , Hive QL) voor mensen die gegevens uit Hive
Impala for Business Intelligence
21 UrenCloudera Impala is een open source massively parallel processing (MPP) SQL query engine voor Apache Hadoop clusters.
Impala stelt gebruikers in staat om SQL query's met lage latentie uit te voeren op gegevens die zijn opgeslagen in Hadoop Distributed File System en Apache Hbase zonder dat gegevensverplaatsing of -transformatie nodig is.
Audiëntie
Deze cursus is bedoeld voor analisten en datawetenschappers die analyses uitvoeren op gegevens die zijn opgeslagen in Hadoop via Business Intelligence of SQL tools.
Na afloop van deze cursus zijn de deelnemers in staat om
- Haal zinvolle informatie uit Hadoop clusters met Impala.
- Schrijf specifieke programma's om Business Intelligentie in Impala SQL Dialect te vergemakkelijken.
- Problemen oplossen Impala.
Confluent KSQL
7 UrenDeze live training onder leiding van een instructeur in Nederland (online of ter plaatse) is bedoeld voor ontwikkelaars die Apache Kafka streamverwerking willen implementeren zonder code te schrijven.
Aan het einde van deze training zijn de deelnemers in staat om:
- Installeer en configureer Confluent KSQL.
- Stel een stroomverwerkingspijplijn in met alleen SQL opdrachten (geen Java of Python codering).
- Voer gegevensfiltering, transformaties, aggregaties, joins, windowing en sessionization volledig uit in SQL.
- Ontwerp en implementeer interactieve, continue query's voor streaming ETL en realtime analyses.
Apache NiFi for Administrators
21 UrenIn deze live training onder leiding van een instructeur in Nederland (ter plaatse of op afstand) leren deelnemers hoe ze Apache NiFi kunnen implementeren en beheren in een live labomgeving.
Aan het einde van deze training zijn de deelnemers in staat om:
- Installeer en configureer Apachi NiFi.
- Bron, transformeer en beheer gegevens uit ongelijksoortige, gedistribueerde gegevensbronnen, waaronder databases en big data lakes.
- Automatiseer gegevensstromen.
- Schakel streaminganalyse in.
- Pas verschillende benaderingen toe voor gegevensopname.
- Transformeer Big Data en naar zakelijke inzichten.
Apache NiFi for Developers
7 UrenIn deze door een instructeur geleide, live training in Nederland leren deelnemers de basisprincipes van flow-based programmeren terwijl ze een aantal demo-extensies, componenten en processors ontwikkelen met behulp van Apache NiFi.
Aan het einde van deze training zijn de deelnemers in staat om:
- Begrijp de architectuur en dataflowconcepten van NiFi.
- Ontwikkel extensies met behulp van NiFi en API's van derden.
- Op maat ontwikkelen van hun eigen Apache Nifi processor.
- Neem real-time gegevens op en verwerk ze uit ongelijksoortige en ongebruikelijke bestandsindelingen en gegevensbronnen.
Python and Spark for Big Data (PySpark)
21 UrenIn deze door een instructeur geleide, live training in Nederland, leren deelnemers hoe ze Python en Spark samen kunnen gebruiken om big data te analyseren terwijl ze werken aan praktische oefeningen.
Aan het einde van deze training zijn de deelnemers in staat om:
- Leer hoe u Spark kunt gebruiken met Python om Big Data te analyseren.
- Werk aan oefeningen die gevallen uit de echte wereld nabootsen.
- Gebruik verschillende tools en technieken voor big data-analyse met behulp van PySpark.
Spark Streaming with Python and Kafka
7 UrenDeze live training onder leiding van een instructeur in Nederland (online of ter plaatse) is bedoeld voor data-engineers, datawetenschappers en programmeurs die Spark Streaming functies willen gebruiken bij het verwerken en analyseren van realtime gegevens.
Aan het einde van deze training zijn deelnemers in staat om Spark Streaming te gebruiken om live datastromen te verwerken voor gebruik in databases, bestandssystemen en live dashboards.
Apache Spark MLlib
35 UrenMLlib is Spark's machine learning (ML) bibliotheek. Het doel is om praktische machine learning schaalbaar en eenvoudig te maken. Het bestaat uit algemene leeralgoritmen en hulpprogramma's, waaronder classificatie, regressie, clustering, collaboratieve filtering, vermindering van de dimensionaliteit, evenals optimalisatieprimitieven op een lager niveau en pijplijn-API's op een hoger niveau.
Het is verdeeld in twee pakketten:
spark.mllib bevat de originele API gebouwd bovenop RDD's.
spark.ml biedt een API op een hoger niveau gebouwd bovenop DataFrames voor het construeren van ML-pijpleidingen.
Publiek
Deze cursus is bedoeld voor ingenieurs en ontwikkelaars die een ingebouwde machinebibliotheek voor Apache Spark