Big Data Training Courses

Big Data Training Courses

Lokale, door een instructeur geleide, live Big Data-trainingen beginnen met een inleiding tot elementaire concepten van Big Data en vervolgens de voortgang in de programmeertalen en -methodieken die worden gebruikt om gegevensanalyse uit te voeren. Tools en infrastructuur voor het inschakelen van Big Data-opslag, gedistribueerde verwerking en schaalbaarheid worden besproken, vergeleken en geïmplementeerd in demo-oefensessies. Big Data-training is beschikbaar als 'live training op locatie' of 'live training op afstand'. Onsite live training kan lokaal worden uitgevoerd op het terrein van de klant in Nederland of in NobleProg bedrijfsopleidingscentra in Nederland . Live-training op afstand wordt uitgevoerd via een interactieve, externe desktop. NobleProg - uw lokale trainingsaanbieder

Machine Translated

Getuigenissen

★★★★★
★★★★★

Big Data Cursusoverzicht

Course Name
Duration
Overview
Course Name
Duration
Overview
21 hours
Overview
Apache Accumulo is een gesorteerde, gedistribueerde sleutel / waarde-opslag die robuuste, schaalbare gegevensopslag en Apache Accumulo biedt. Het is gebaseerd op het ontwerp van Go ogle's BigTable en wordt aangedreven door Apache Hadoop , Apache Zookeeper en Apache Thrift .

Deze instructeur geleide, live cursussen behandelt de werkprincipes achter Accumulo en leidt deelnemers door de ontwikkeling van een voorbeeldapplicatie op Apache Accumulo .

Indeling van de cursus

- Deelcollege, deelbespreking, hands-on ontwikkeling en implementatie, incidentele tests om begrip te peilen
7 hours
Overview
Kafka Streams is een client-side bibliotheek voor het bouwen van applicaties en microservices waarvan de gegevens worden doorgegeven aan en van een Kafka-berichtensysteem. Traditioneel vertrouwde Apache Kafka op Apache Spark of Apache Storm om gegevens tussen berichtproducenten en consumenten te verwerken. Door de Kafka Streams API vanuit een applicatie aan te roepen, kunnen gegevens direct in Kafka worden verwerkt, waardoor de noodzaak om de gegevens naar een afzonderlijk cluster te sturen voor verwerking wordt omzeild.

In deze live training onder leiding van een instructeur leren deelnemers hoe ze Kafka Streams kunnen integreren in een reeks voorbeeld Java applicaties die gegevens van en naar Apache Kafka doorgeven voor stroomverwerking.

Aan het einde van deze training kunnen deelnemers:

- Begrijp de functies en voordelen van Kafka Streams ten opzichte van andere frameworks voor stroomverwerking
- Process stream gegevens rechtstreeks binnen een Kafka-cluster
- Schrijf een Java of Scala applicatie of microservice die kan worden geïntegreerd met Kafka en Kafka Streams
- Schrijf beknopte code die invoer Kafka-onderwerpen omzet in uitvoer Kafka-onderwerpen
- Bouw, verpak en implementeer de applicatie

Publiek

- ontwikkelaars

Formaat van de cursus

- Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen

Notes

- Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen
28 hours
Overview
Mem SQL is een in het geheugen verdeeld, SQL databasebeheersysteem voor cloud en on-premises. Het is een realtime datawarehouse dat onmiddellijk inzichten levert uit live en historische gegevens.

In deze door een instructeur geleide, live training leren deelnemers de essentie van Mem SQL voor ontwikkeling en beheer.

Aan het einde van deze training kunnen deelnemers:

- Begrijp de belangrijkste concepten en kenmerken van Mem SQL
- Mem SQL installeren, ontwerpen, onderhouden en bedienen
- Optimaliseer schema's in Mem SQL
- Verbeter vragen in Mem SQL
- Benchmarkprestaties in Mem SQL
- Bouw realtime datatoepassingen met behulp van Mem SQL

Publiek

- ontwikkelaars
- Administrators
- Operation Engineers

Formaat van de cursus

- Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen
21 hours
Overview
Voorspellende analyses zijn het gebruik van gegevensanalyses om voorspellingen over de toekomst te doen Dit proces gebruikt gegevens samen met datamining, statistieken en machinale leertechnieken om een ​​voorspellend model te maken voor het voorspellen van toekomstige gebeurtenissen Tijdens deze live training met instructeur leren deelnemers Matlab te gebruiken om voorspellende modellen te bouwen en deze toe te passen op grote voorbeeldgegevenssets om toekomstige gebeurtenissen te voorspellen op basis van de gegevens Aan het einde van deze training kunnen deelnemers: Creëer voorspellende modellen om patronen in historische en transactionele gegevens te analyseren Gebruik voorspellende modellering om risico's en kansen te identificeren Bouw wiskundige modellen die belangrijke trends vastleggen Gebruik gegevens van apparaten en bedrijfssystemen om afval te verminderen, tijd te besparen of kosten te besparen Publiek ontwikkelaars ingenieurs Domein experts Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
7 hours
Overview
In deze live training onder leiding van een instructeur leren deelnemers de kernconcepten achter MapR Stream Architecture bij het ontwikkelen van een realtime streamingapplicatie.

Tegen het einde van deze training kunnen de deelnemers producent- en consumententoepassingen bouwen voor realtime stroomgegevensverwerking.

Publiek

- ontwikkelaars
- Administrators

Formaat van de cursus

- Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen

Notitie

- Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
14 hours
Overview
Magellan is an open-source distributed execution engine for geospatial analytics on big data. Implemented on top of Apache Spark, it extends Spark SQL and provides a relational abstraction for geospatial analytics.

This instructor-led, live training introduces the concepts and approaches for implementing geospacial analytics and walks participants through the creation of a predictive analysis application using Magellan on Spark.

By the end of this training, participants will be able to:

- Efficiently query, parse and join geospatial datasets at scale
- Implement geospatial data in business intelligence and predictive analytics applications
- Use spatial context to extend the capabilities of mobile devices, sensors, logs, and wearables

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
14 hours
Overview
Apache Kylin is een extreme, gedistribueerde analyse-engine voor big data.

In deze door een instructeur geleide live training leren deelnemers hoe ze Apache Kylin kunnen gebruiken om een realtime datawarehouse op te zetten.

Aan het einde van deze training kunnen deelnemers:

- Gebruik realtime streaminggegevens met Kylin
- Gebruik de krachtige functies van Apache Kylin , de rijke SQL interface, spark cubing en subseconden query latency

Notitie

- We gebruiken de nieuwste versie van Kylin (vanaf dit moment, Apache Kylin v2.0)

Publiek

- Big data-ingenieurs
- Big Data analisten

Formaat van de cursus

- Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen
7 hours
Overview
Confluent K SQL is een stroomverwerkingsraamwerk dat bovenop Apache Kafka . Het maakt real-time gegevensverwerking mogelijk met behulp van SQL bewerkingen.

Deze instructeur-geleide, live training (op locatie of op afstand) is gericht op ontwikkelaars die Apache Kafka streamverwerking willen implementeren zonder code te schrijven.

Aan het einde van deze training kunnen deelnemers:

- Installeer en configureer Confluent K SQL .
- Stel een stroomverwerkingspijplijn in met alleen SQL opdrachten (geen Java of Python codering).
- Voer datafiltering, transformaties, aggregaties, joins, windowing en sessie volledig uit in SQL .
- Ontwerp en implementeer interactieve, continue zoekopdrachten voor het streamen van ETL en realtime analyses.

Indeling van de cursus

- Interactieve lezing en discussie.
- Veel oefeningen en oefenen.
- Praktische implementatie in een live-labomgeving.

Cursusaanpassingsopties

- Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
35 hours
Overview
KNIME is a free and open-source data analytics, reporting and integration platform. KNIME integrates various components for machine learning and data mining through its modular data pipelining concept. A graphical user interface and use of JDBC allows assembly of nodes blending different data sources, including preprocessing (ETL: Extraction, Transformation, Loading), for modeling, data analysis and visualization without, or with only minimal, programming. To some extent as advanced analytics tool KNIME can be considered as a SAS alternative.

Since 2006, KNIME has been used in pharmaceutical research, it also used in other areas like CRM customer data analysis, business intelligence and financial data analysis.
21 hours
Overview
KNIME Analytics Platform is een toonaangevende open source-optie voor datagestuurde innovatie, waarmee u het potentieel in uw gegevens kunt ontdekken, nieuwe inzichten kunt vinden of nieuwe toekomstvoorspellingen kunt voorspellen. Met meer dan 1000 modules, honderden kant-en-klare voorbeelden, een uitgebreid scala aan geïntegreerde tools en de breedste keuze aan geavanceerde beschikbare algoritmen, is KNIME Analytics Platform de perfecte toolbox voor elke KNIME en bedrijfsanalist.

Deze cursus voor KNIME Analytics Platform is een ideale gelegenheid voor beginners, gevorderde gebruikers en KNIME experts om kennis te maken met KNIME , om te leren hoe het effectiever te gebruiken en om duidelijke, uitgebreide rapporten te maken op basis van KNIME workflows
21 hours
Overview
Kennisontdekking in databases (KDD) is het proces waarbij nuttige kennis uit een verzameling gegevens wordt ontdekt. Real-life toepassingen voor deze dataminingtechniek omvatten marketing, fraudedetectie, telecommunicatie en productie.

In deze door een instructeur geleide, live cursus introduceren we de processen die betrokken zijn bij KDD en voeren we een reeks oefeningen uit om de implementatie van die processen te oefenen.

Publiek

- Gegevensanalisten of iedereen die geïnteresseerd is in het leren interpreteren van gegevens om problemen op te lossen

Indeling van de cursus

- Na een theoretische bespreking van KDD zal de instructeur real-life cases presenteren waarin de toepassing van KDD wordt gevraagd om een probleem op te lossen. Deelnemers zullen voorbeeldgegevenssets voorbereiden, selecteren en opschonen en hun voorkennis over de gegevens gebruiken om oplossingen voor te stellen op basis van de resultaten van hun waarnemingen.
21 hours
Overview
In tegenstelling tot andere technologieën is IoT veel complexer en omvat het bijna elke tak van engineering, mechanica, Electron , firmware, middleware, cloud, analytics en mobiel. Voor elk van zijn technische lagen zijn er aspecten van economie, normen, voorschriften en evoluerende stand van de techniek. Dit is voor de eerste keer, een bescheiden cursus wordt aangeboden om al deze kritieke aspecten van IoT Engineering te behandelen.

Samenvatting

-

Een geavanceerd trainingsprogramma over de huidige stand van zaken in Internet of Things

-

Snijdt over meerdere technologiedomeinen om de bekendheid van een IoT-systeem en de componenten ervan te ontwikkelen en hoe het bedrijven en organisaties kan helpen.

-

Live demo van model IoT-applicaties om praktische IoT-implementaties in verschillende industriële domeinen te demonstreren, zoals Industrial IoT, Smart Cities, Retail, Travel & Transport en use cases rond verbonden apparaten en dingen

Doelgroep

-

Managers die verantwoordelijk zijn voor zakelijke en operationele processen binnen hun respectieve organisaties en willen weten hoe ze IoT kunnen inzetten om hun systemen en processen efficiënter te maken.

-

Ondernemers en investeerders die nieuwe ondernemingen willen bouwen en een beter begrip van het IoT-technologielandschap willen ontwikkelen om te zien hoe zij dit op een effectieve manier kunnen benutten.

De schattingen voor Internet of Things of IoT-marktwaarde zijn enorm, omdat de IoT per definitie een geïntegreerde en diffuse laag apparaten, sensoren en rekenkracht is die de volledige consumenten-, business-to-business- en overheidsindustrieën overlapt. Het IoT zal verantwoordelijk zijn voor een steeds groter aantal verbindingen: vandaag 1,9 miljard apparaten en 9 miljard tegen 2018. Dat jaar zal het ongeveer gelijk zijn aan het aantal smartphones, smart-tv's, tablets, draagbare computers en pc's samen.

In de consumentenruimte zijn veel producten en diensten al overgestapt naar het IoT, waaronder keuken- en huishoudelijke apparaten, parkeer-, RFID-, verlichtings- en verwarmingsproducten en een aantal toepassingen op industrieel internet.

De onderliggende technologieën van IoT zijn echter niets nieuws, aangezien M2M-communicatie bestond sinds de geboorte van internet. Wat de afgelopen jaren echter is veranderd, is de opkomst van een aantal goedkope draadloze technologieën die zijn toegevoegd door de overweldigende aanpassing van smartphones en tablets in elk huis. Explosieve groei van mobiele apparaten leidde tot de huidige vraag naar IoT.

Vanwege onbegrensde kansen in IoT-business, sprong een groot aantal kleine en middelgrote ondernemers op een kar van IoT-goudkoorts. Mede door de opkomst van open source elektronica en het IoT-platform worden de kosten van de ontwikkeling van het IoT-systeem en het verder beheren van de omvangrijke productie ervan steeds betaalbaarder. Bestaande eigenaars van elektronische producten ondervinden druk om hun apparaat te integreren met de internet- of mobiele app.

Deze training is bedoeld voor een technologische en zakelijke evaluatie van een opkomende industrie, zodat IoT-enthousiastelingen / ondernemers de basis kunnen begrijpen van IoT-technologie en het bedrijfsleven.

Doel van de cursus

Hoofddoel van de cursus is het introduceren van opkomende technologische opties, platforms en case studies van IoT-implementatie in thuis- en stadsautomatisering (slimme huizen en steden), industrieel internet, gezondheidszorg, Go vt., Mobile Cellular en andere gebieden.

-

Basisintroductie van alle elementen van IoT-Mechanical, Electron ics / sensor platform, Wireless en wireline protocollen, Mobile to Electron ics integratie, Mobile to enterprise integratie, Data-analyse en Total control plane

-

M2M Draadloze protocollen voor IoT- WiFi, Zigbee / Zwave, Bluetooth, ANT +: Wanneer en waar welke gebruiken?

-

Mobiele / Desktop / Web-app - voor registratie, data-acquisitie en controle - Beschikbaar M2M data-acquisitieplatform voor IoT - Xively, Omega en NovoTech, etc.

-

Beveiligingsproblemen en beveiligingsoplossingen voor IoT

-

Open source / commercieel elektronische platform voor IoT- Raspberry Pi , Arduino , ArmMbedLPC enz

-

Open source / commercieel enterprise cloudplatform voor AWS-IoT-apps, Azure -IOT, Watson-IOT cloud in aanvulling op andere kleine IoT-clouds

-

Studies van bedrijven en technologie van enkele van de meest voorkomende IoT-apparaten, zoals domotica, rookmelders, voertuigen, militairen, gezondheid in huis, enz.
28 hours
Overview
MonetDB is een open-source database die pionier was op het gebied van technologie voor kolomopslag.

In deze door een instructeur geleide, live training leren deelnemers hoe ze MonetDB kunnen gebruiken en hoe ze er de meeste waarde uit kunnen halen.

Aan het einde van deze training kunnen deelnemers:

- Begrijp MonetDB en zijn functies
- Installeer en ga aan de slag met MonetDB
- Ontdek en voer verschillende functies en taken uit in MonetDB
- Versnel de levering van hun project door de mogelijkheden van MonetDB te maximaliseren

Publiek

- ontwikkelaars
- Technische experts

Formaat van de cursus

- Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen
21 hours
Overview
Stream Processing verwijst naar de realtime verwerking van "gegevens in beweging", dat wil zeggen het uitvoeren van berekeningen op gegevens terwijl deze worden ontvangen. Dergelijke gegevens worden gelezen als continue stromen van gegevensbronnen zoals sensorgebeurtenissen, website-gebruikersactiviteit, financiële transacties, creditcardbewegingen, klikstromen, enz. Stream Processing frameworks kunnen grote hoeveelheden inkomende gegevens lezen en bieden vrijwel onmiddellijk waardevolle inzichten.

In deze door een instructeur geleide, live training (op locatie of op afstand), leren deelnemers hoe ze verschillende Stream Processing frameworks kunnen opzetten en integreren met bestaande big data-opslagsystemen en gerelateerde softwareapplicaties en microservices.

Aan het einde van deze training kunnen deelnemers:

- Installeer en configureer verschillende Stream Processing frameworks, zoals Spark Streaming en Kafka Streaming.
- Begrijp en selecteer het meest geschikte kader voor de taak.
- Verwerking van gegevens continu, gelijktijdig en op recordniveau.
- Integreer Stream Processing oplossingen met bestaande databases, datawarehouses, datameren, etc.
- Integreer de meest geschikte stroomverwerkingsbibliotheek met bedrijfstoepassingen en microservices.

Publiek

- ontwikkelaars
- Software architecten

Indeling van de cursus

- Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen

Notes

- Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
14 hours
Overview
publiek

- ontwikkel

formaat van de cursus

- lezingen, hands-on praktijk, kleine testen langs de weg te meten begrip
21 hours
Overview
Cloudera Impala is een open source massaal parallelle verwerking (MPP) SQL query-engine voor Apache Hadoop clusters.

Impala stelt gebruikers in staat om SQL query's met lage latentie te geven aan gegevens die zijn opgeslagen in Hadoop Distributed File System en Apache Hbase zonder dat gegevens moeten worden verplaatst of getransformeerd.

Publiek

Deze cursus is bedoeld voor analisten en datawetenschappers die analyses uitvoeren op gegevens die zijn opgeslagen in Hadoop via Business Intelligence of SQL tools.

Na deze cursus kunnen afgevaardigden dat doen

- Haal betekenisvolle informatie uit Hadoop clusters met Impala .
- Schrijf specifieke programma's om Business Intelligence in Impala SQL Dialect te vergemakkelijken.
- Problemen met Impala oplossen.
7 hours
Overview
Deze cursus behandelt het gebruik van Hive SQL taal (AKA: Hive HQL, SQL on Hive , Hive QL) voor mensen die gegevens uit Hive
21 hours
Overview
Hortonworks Data Platform (HDP) is een open-source Apache Hadoop ondersteuningsplatform dat een stabiele basis biedt voor het ontwikkelen van big data-oplossingen op het Apache Hadoop ecosysteem.

Deze instructeur-geleide, live training (op locatie of op afstand) introduceert Hortonworks Data Platform (HDP) en Hortonworks Data Platform (HDP) deelnemers door de implementatie van de Spark + Hadoop oplossing.

Aan het einde van deze training kunnen deelnemers:

- Gebruik Hortonworks om Hadoop op grote schaal betrouwbaar te runnen.
- Breng de capaciteiten van Hadoop van beveiliging, beheer en operaties samen met de agile analytische workflows van Spark.
- Gebruik Hortonworks om alle componenten in een Spark-project te onderzoeken, valideren, certificeren en ondersteunen.
- Verwerk verschillende soorten gegevens, waaronder gestructureerd, ongestructureerd, in beweging en in rust.

Indeling van de cursus

- Interactieve lezing en discussie.
- Veel oefeningen en oefenen.
- Praktische implementatie in een live-labomgeving.

Cursusaanpassingsopties

- Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
21 hours
Overview
Deze cursus introduceert HBase - een No SQL store bovenop Hadoop . De cursus is bedoeld voor ontwikkelaars die HBase gaan gebruiken om applicaties te ontwikkelen, en beheerders die HBase-clusters gaan beheren.

We zullen een ontwikkelaar door HBase-architectuur en datamodellering en applicatie-ontwikkeling op HBase leiden. Er wordt ook ingegaan op het gebruik van MapReduce met HBase en enkele beheeronderwerpen met betrekking tot prestatieoptimalisatie. De cursus is zeer praktisch met veel laboratoriumoefeningen.

Duur : 3 dagen

Publiek : ontwikkelaars en beheerders
28 hours
Overview
Hadoop is een populair Big Data verwerkingsraamwerk. Python is een programmeertaal op hoog niveau die bekend staat om zijn duidelijke syntaxis en leesbaarheid van code.

In deze door een instructeur geleide live training leren deelnemers hoe ze met Python , Hadoop , MapReduce, Pig en Spark kunnen werken, terwijl ze door meerdere voorbeelden en use cases bladeren.

Aan het einde van deze training kunnen deelnemers:

- Begrijp de basisconcepten achter Hadoop , MapReduce, Pig en Spark
- Gebruik Python met Hadoop Distributed File System (HDFS), MapReduce, Pig en Spark
- Gebruik Snakebite voor programmatische toegang tot HDFS binnen Python
- Gebruik mrjob om banen voor MapReduce in Python te schrijven
- Schrijf Spark-programma's met Python
- Breid de functionaliteit van varken uit met behulp van Python UDF's
- Beheer MapReduce-taken en Pig-scripts met Luigi

Publiek

- ontwikkelaars
- IT-professionals

Formaat van de cursus

- Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen
28 hours
Overview
Publiek:

Deze cursus is bedoeld om big data / hadoop-technologie te demystificeren en aan te tonen dat het niet moeilijk te begrijpen is.
14 hours
Overview
Naarmate meer en meer software- en IT-projecten migreren van lokale verwerking en gegevensbeheer naar gedistribueerde verwerking en big data-opslag, vinden projectmanagers de behoefte om hun kennis en vaardigheden te upgraden om de concepten en werkwijzen te begrijpen die relevant zijn voor Big Data projecten en kansen.

Deze cursus laat projectmanagers kennismaken met het meest populaire Big Data verwerkingsraamwerk: Hadoop .

In deze door instructeurs geleide training leren deelnemers de kerncomponenten van het Hadoop ecosysteem en hoe deze technologieën kunnen worden gebruikt om grootschalige problemen op te lossen. Door deze basis te leren, zullen deelnemers ook hun vermogen verbeteren om te communiceren met de ontwikkelaars en implementeerders van deze systemen, evenals met de datawetenschappers en analisten die bij veel IT-projecten betrokken zijn.

Publiek

- Projectmanagers die Hadoop willen implementeren in hun bestaande ontwikkelings- of IT-infrastructuur
- Projectmanagers die moeten communiceren met cross-functionele teams, waaronder big data-ingenieurs, datawetenschappers en bedrijfsanalisten

Formaat van de cursus

- Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen
7 hours
Overview
Deze door een instructeur geleide, live training (ter plaatse of op afstand) is gericht op technische personen die willen leren hoe een machine learning-strategie te implementeren en tegelijkertijd het gebruik van big data te maximaliseren.

Aan het einde van deze training zullen de deelnemers:

- Begrijp de evolutie en trends voor machine learning.
- Weet hoe machine learning wordt gebruikt in verschillende industrieën.
- Raak vertrouwd met de tools, vaardigheden en services die beschikbaar zijn om machine learning in een organisatie te implementeren.
- Begrijp hoe machine learning kan worden gebruikt om datamining en -analyse te verbeteren.
- Ontdek wat een data-backend in het midden is en hoe deze door bedrijven wordt gebruikt.
- Begrijp de rol die big data en intelligente applicaties spelen in verschillende industrieën.

Indeling van de cursus

- Interactieve lezing en discussie.
- Veel oefeningen en oefenen.
- Praktische implementatie in een live-labomgeving.

Cursusaanpassingsopties

- Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
21 hours
Overview
Apache NiFi (Hortonworks DataFlow) is een realtime geïntegreerde datalogistiek en een eenvoudig platform voor gebeurtenisverwerking waarmee gegevens tussen systemen kunnen worden verplaatst, gevolgd en geautomatiseerd. Het is geschreven met behulp van flow-based programmeren en biedt een webgebaseerde gebruikersinterface om gegevensstromen in realtime te beheren.

In deze door een instructeur geleide, live training (op locatie of op afstand), leren deelnemers hoe ze Apache NiFi kunnen implementeren en beheren in een live labomgeving.

Aan het einde van deze training kunnen deelnemers:

- Installeer en configureer Apachi NiFi.
- Bron, transformeer en beheer gegevens uit ongelijksoortige, gedistribueerde gegevensbronnen, waaronder databases en grote gegevensmeren.
- Automatiseer gegevensstromen.
- Schakel streaming-analyse in.
- Pas verschillende benaderingen toe voor gegevensopname.
- Transformeer Big Data naar zakelijke inzichten.

Indeling van de cursus

- Interactieve lezing en discussie.
- Veel oefeningen en oefenen.
- Praktische implementatie in een live-labomgeving.

Cursusaanpassingsopties

- Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
21 hours
Overview
Apache Hadoop is een van de populairste kaders voor het verwerken van Big Data op clusters van servers. Deze cursus gaat in op gegevensbeheer in HDFS, geavanceerde Pig, Hive en HBase. Deze geavanceerde programmeertechnieken zullen voordelig zijn voor ervaren Hadoop ontwikkelaars.

Publiek : ontwikkelaars

Duur: drie dagen

Formaat: hoorcolleges (50%) en hands-on labs (50%).
35 hours
Overview
MLlib is Spark's machine learning (ML) bibliotheek. Het doel is om praktische machine learning schaalbaar en eenvoudig te maken. Het bestaat uit algemene leeralgoritmen en hulpprogramma's, waaronder classificatie, regressie, clustering, collaboratieve filtering, vermindering van de dimensionaliteit, evenals optimalisatieprimitieven op een lager niveau en pijplijn-API's op een hoger niveau.

Het is verdeeld in twee pakketten:

-

spark.mllib bevat de originele API gebouwd bovenop RDD's.

-

spark.ml biedt een API op een hoger niveau gebouwd bovenop DataFrames voor het construeren van ML-pijpleidingen.

Publiek

Deze cursus is bedoeld voor ingenieurs en ontwikkelaars die een ingebouwde machinebibliotheek voor Apache Spark
14 hours
Overview
Apache Zeppelin is een webbased notebook voor het vastleggen, onderzoeken, visualiseren en delen van Hadoop- en Spark-data Deze instructieve, live training introduceert de concepten achter interactieve data-analyse en leidt deelnemers door de inzet en het gebruik van Zeppelin in een omgeving met één gebruiker of meerdere gebruikers Aan het einde van deze training kunnen deelnemers: Installeer en configureer Zeppelin Ontwikkelen, organiseren, uitvoeren en delen van gegevens in een browsergebaseerde interface Visualiseer resultaten zonder naar de opdrachtregel of clusterdetails te verwijzen Uitvoeren en samenwerken aan lange workflows Werk met een van een aantal plugin-taal / dataprocessing-backends, zoals Scala (met Apache Spark), Python (met Apache Spark), Spark SQL, JDBC, Markdown en Shell Integreer Zeppelin met Spark, Flink en Map Reduce Beveiligde multi-user-instanties van Zeppelin met Apache Shiro Publiek Gegevensingenieurs Data-analisten Datawetenschappers Software ontwikkelaars Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
14 hours
Overview
Vespa en opensource big data processing and serving engine gemaakt door Yahoo Het wordt gebruikt om te reageren op vragen van gebruikers, aanbevelingen te doen en in realtime gepersonaliseerde inhoud en advertenties te bieden Deze instructieve, live training introduceert de uitdagingen van het bedienen van grootschalige gegevens en wandelt deelnemers door het creëren van een applicatie die antwoorden op gebruikersaanvragen kan berekenen, over grote datasets in realtime Aan het einde van deze training kunnen deelnemers: Gebruik Vespa om snel gegevens te berekenen (opslaan, zoeken, rangschikken, organiseren) tijdens het gebruik van de tijd terwijl een gebruiker wacht Implementeer Vespa in bestaande applicaties met functies zoeken, aanbevelingen en personalisatie Integreer en implementeer Vespa met bestaande big data-systemen zoals Hadoop en Storm Publiek ontwikkelaars Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
14 hours
Overview
Tigon is een opensource, realtime, lowlatency, highthroughput, native YARN, stream processing framework dat bovenop HDFS en HBase voor persistentie zit Tigon-applicaties richten zich op use-cases zoals detectie en analyse van netwerkintrus- sies, marktanalyses van sociale media, locatieanalyses en realtime aanbevelingen aan gebruikers Deze instructieve, live training introduceert Tigon's benadering van het mengen van realtime en batchverwerking terwijl het deelnemers door de creatie van een voorbeeldtoepassing leidt Aan het einde van deze training kunnen deelnemers: Maak krachtige, stroomverwerkingsprogramma's voor het verwerken van grote hoeveelheden gegevens Processtroombronnen zoals Twitter en Webserver Logs Gebruik Tigon voor snel samenvoegen, filteren en aggregeren van streams Publiek ontwikkelaars Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
21 hours
Overview
Teradata is een van de populaire Relational Database Management System. Het is vooral geschikt voor het bouwen van grootschalige data warehousing-applicaties. Teradata bereikt dit door het concept van parallellisme.

Deze cursus laat de afgevaardigden kennis maken met Teradata .
Weekend Big Data cursus, Avond Big Data training, Avond Big Data opleiding Big Data boot camp, Big Data instructeur geleid, Weekend Big Data training, Avond Big Data cursus, Big Data coaching, Big Data instructeur, Big Data trainer, Big Data training cursus, Big Data lessen, Big Data on-site, Big Data privé cursus, Big Data een op een training, Big Data op locatie, Weekend Big Data opleiding

Cursussen met korting

Course Discounts Newsletter

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Een aantal van onze klanten

is growing fast!

We are looking to expand our presence in the Netherlands!

As a Business Development Manager you will:

  • expand business in the Netherlands
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!