Lokale, door een instructeur geleide live Stream Processing-trainingscursussen demonstreren door middel van interactieve discussie en praktische oefening de grondbeginselen en geavanceerde onderwerpen van Stream Processing. Stream Processing-training is beschikbaar als 'live training op afstand' of 'live training op afstand'. Online live training (ook bekend als "live training op afstand") wordt uitgevoerd via een interactieve, externe desktop . Live training op locatie kan lokaal worden uitgevoerd op het terrein van de klant in Nederland of in NobleProg bedrijfstrainingscentra in Nederland. NobleProg -- Uw lokale trainingsaanbieder
Deze instructeur-geleide, live training (ter plaatse of op afstand) is gericht op ingenieurs die Confluent (een distributie van Kafka) willen gebruiken om een realtime gegevensverwerkingsplatform voor hun toepassingen te bouwen en te beheren. Aan het einde van deze training kunnen deelnemers:
Installeer en configureer Confluent Platform.
Gebruik de beheertools en -services van Confluent om Kafka gemakkelijker uit te voeren.
Bewaar en verwerk inkomende stroomgegevens.
Optimaliseer en beheer Kafka-clusters.
Veilige datastromen.
Indeling van de cursus
Interactieve lezing en discussie.
Veel oefeningen en oefenen.
Praktische implementatie in een live-labomgeving.
Opties voor cursusaanpassing
Deze cursus is gebaseerd op de open source-versie van Confluent: Confluent Open Source.
Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
Stream Processing verwijst naar de realtime verwerking van "gegevens in beweging", dat wil zeggen het uitvoeren van berekeningen op gegevens terwijl deze worden ontvangen. Dergelijke gegevens worden gelezen als continue stromen van gegevensbronnen zoals sensorgebeurtenissen, website-gebruikersactiviteit, financiële transacties, creditcardbewegingen, klikstromen, enz. Stream Processing frameworks kunnen grote hoeveelheden inkomende gegevens lezen en bieden vrijwel onmiddellijk waardevolle inzichten. In deze door een instructeur geleide, live training (op locatie of op afstand), leren deelnemers hoe ze verschillende Stream Processing frameworks kunnen opzetten en integreren met bestaande big data-opslagsystemen en gerelateerde softwareapplicaties en microservices. Aan het einde van deze training kunnen deelnemers:
Installeer en configureer verschillende Stream Processing frameworks, zoals Spark Streaming en Kafka Streaming.
Begrijp en selecteer het meest geschikte kader voor de taak.
Verwerking van gegevens continu, gelijktijdig en op recordniveau.
Integreer Stream Processing oplossingen met bestaande databases, datawarehouses, datameren, etc.
Integreer de meest geschikte stroomverwerkingsbibliotheek met bedrijfstoepassingen en microservices.
Publiek
ontwikkelaars
Software architecten
Indeling van de cursus
Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen
Notes
Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
Apache Kafka is een open-source stream-verwerkingsplatform die een snelle, betrouwbare en lage latentie-platform biedt voor het verwerken van real-time gegevensanalyse. Apache Kafka kan worden geïntegreerd met beschikbare programmeringsspraken zoals Python.
Deze instructeur geleide, live training (online of on-site) is gericht op data ingenieurs, data wetenschappers en programmeurs die willen gebruiken Apache Kafka functies in data streaming met Python.
Aan het einde van deze training zullen de deelnemers in staat zijn om Apache Kafka te gebruiken om de omstandigheden te monitoren en te beheren in voortdurende gegevensstromen met behulp van Python programmering.
Format van de cursus
Interactieve lezingen en discussie.
Veel oefeningen en oefeningen.
Hand-on implementatie in een live-lab-omgeving.
Cursus aanpassingsopties
Om een aangepaste training voor deze cursus te vragen, neem dan contact met ons op om te organiseren.
Kafka Streams is een client-side bibliotheek voor het bouwen van applicaties en microservices waarvan de gegevens worden doorgegeven aan en van een Kafka-berichtensysteem. Traditioneel vertrouwde Apache Kafka op Apache Spark of Apache Storm om gegevens tussen berichtproducenten en consumenten te verwerken. Door de Kafka Streams API vanuit een applicatie aan te roepen, kunnen gegevens direct in Kafka worden verwerkt, waardoor de noodzaak om de gegevens naar een afzonderlijk cluster te sturen voor verwerking wordt omzeild. In deze live training onder leiding van een instructeur leren deelnemers hoe ze Kafka Streams kunnen integreren in een reeks voorbeeld Java applicaties die gegevens van en naar Apache Kafka doorgeven voor stroomverwerking. Aan het einde van deze training kunnen deelnemers:
Begrijp de functies en voordelen van Kafka Streams ten opzichte van andere frameworks voor stroomverwerking
Process stream gegevens rechtstreeks binnen een Kafka-cluster
Schrijf een Java of Scala applicatie of microservice die kan worden geïntegreerd met Kafka en Kafka Streams
Schrijf beknopte code die invoer Kafka-onderwerpen omzet in uitvoer Kafka-onderwerpen
Bouw, verpak en implementeer de applicatie
Publiek
ontwikkelaars
Formaat van de cursus
Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen
Notes
Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen
In deze live training onder leiding van een instructeur leren deelnemers de kernconcepten achter MapR Stream Architecture bij het ontwikkelen van een realtime streamingapplicatie. Tegen het einde van deze training kunnen de deelnemers producent- en consumententoepassingen bouwen voor realtime stroomgegevensverwerking. Publiek
ontwikkelaars
Administrators
Formaat van de cursus
Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen
Notitie
Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
Apache Samza is een open-source bijna realtime, asynchroon computationeel raamwerk voor stroomverwerking. Het maakt gebruik van Apache Kafka voor berichten en Apache Hadoop YARN voor fouttolerantie, processorisolatie, beveiliging en bronbeheer. Deze instructeur-geleide, live training introduceert de principes achter berichtensystemen en gedistribueerde streamverwerking, terwijl deelnemers worden begeleid door het maken van een voorbeeld van een Samza-gebaseerd project en taakuitvoering. Aan het einde van deze training kunnen deelnemers:
Gebruik Samza om de code te vereenvoudigen die nodig is om berichten te produceren en te consumeren.
Koppel de afhandeling van berichten van een applicatie los.
Gebruik Samza om asynchrone berekening in bijna realtime te implementeren.
Gebruik stroomverwerking om een hoger abstractieniveau te bieden dan berichtensystemen.
Publiek
ontwikkelaars
Formaat van de cursus
Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen
Tigon is een opensource, realtime, lowlatency, highthroughput, native YARN, stream processing framework dat bovenop HDFS en HBase voor persistentie zit Tigon-applicaties richten zich op use-cases zoals detectie en analyse van netwerkintrus- sies, marktanalyses van sociale media, locatieanalyses en realtime aanbevelingen aan gebruikers Deze instructieve, live training introduceert Tigon's benadering van het mengen van realtime en batchverwerking terwijl het deelnemers door de creatie van een voorbeeldtoepassing leidt Aan het einde van deze training kunnen deelnemers: Maak krachtige, stroomverwerkingsprogramma's voor het verwerken van grote hoeveelheden gegevens Processtroombronnen zoals Twitter en Webserver Logs Gebruik Tigon voor snel samenvoegen, filteren en aggregeren van streams Publiek ontwikkelaars Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
Apache Flink is een open-sourceframework voor schaalbare stream- en batchgegevensverwerking.Deze door een instructeur geleide, live training (op locatie of op afstand) introduceert de principes en benaderingen achter gedistribueerde stream- en batchgegevensverwerking, en begeleidt deelnemers bij het creëren van een realtime datastreamingapplicatie in Apache Flink.Aan het einde van deze training kunnen deelnemers:
Zet een omgeving op voor het ontwikkelen van data-analyseapplicaties. Begrijp hoe de grafiekverwerkingsbibliotheek van Apache Flink (Gelly) werkt. Pakket, voer uit en bewaak Flink-gebaseerde, fouttolerante datastreaming-applicaties. Beheer diverse werklasten. Voer geavanceerde analyses uit. Stel een Flink-cluster met meerdere knooppunten in. Meet en optimaliseer prestaties. Integreer Flink met verschillende Big Data systemen. Vergelijk de mogelijkheden van Flink met die van andere raamwerken voor big data-verwerking.
Formaat van de cursus
Interactieve lezing en discussie. Veel oefeningen en oefeningen. Praktische implementatie in een live-labomgeving.
Opties voor cursusaanpassing
Als u een training op maat voor deze cursus wilt aanvragen, kunt u contact met ons opnemen om een afspraak te maken.
Apache NiFi (Hortonworks DataFlow) is een realtime geïntegreerde datalogistiek en een eenvoudig platform voor gebeurtenisverwerking waarmee gegevens tussen systemen kunnen worden verplaatst, gevolgd en geautomatiseerd. Het is geschreven met behulp van flow-based programmeren en biedt een webgebaseerde gebruikersinterface om gegevensstromen in realtime te beheren. In deze door een instructeur geleide, live training (op locatie of op afstand), leren deelnemers hoe ze Apache NiFi kunnen implementeren en beheren in een live labomgeving. Aan het einde van deze training kunnen deelnemers:
Installeer en configureer Apachi NiFi.
Bron, transformeer en beheer gegevens uit ongelijksoortige, gedistribueerde gegevensbronnen, waaronder databases en grote gegevensmeren.
Automatiseer gegevensstromen.
Schakel streaming-analyse in.
Pas verschillende benaderingen toe voor gegevensopname.
Transformeer Big Data naar zakelijke inzichten.
Indeling van de cursus
Interactieve lezing en discussie.
Veel oefeningen en oefenen.
Praktische implementatie in een live-labomgeving.
Cursusaanpassingsopties
Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
Apache NiFi (Hortonworks DataFlow) is een realtime geïntegreerde datalogistiek en een eenvoudig platform voor gebeurtenisverwerking waarmee gegevens tussen systemen kunnen worden verplaatst, gevolgd en geautomatiseerd. Het is geschreven met behulp van flow-based programmeren en biedt een webgebaseerde gebruikersinterface om gegevensstromen in realtime te beheren. In deze door een instructeur geleide, live training leren deelnemers de basisprincipes van flow-based programmeren bij het ontwikkelen van een aantal demo-extensies, componenten en processors met Apache NiFi . Aan het einde van deze training kunnen deelnemers:
Begrijp de architectuur en dataflow-concepten van NiFi.
Ontwikkel extensies met behulp van NiFi en API's van derden.
Aangepaste ontwikkeling van hun eigen Apache Nifi-processor.
Inname en verwerk realtime gegevens uit ongelijksoortige en ongewone bestandsindelingen en gegevensbronnen.
Indeling van de cursus
Interactieve lezing en discussie.
Veel oefeningen en oefenen.
Praktische implementatie in een live-labomgeving.
Cursusaanpassingsopties
Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
Apache Storm is een gedistribueerde, real-time computing engine gebruikt om real-time business intelligence te vergemakkelijken. Dit gebeurt door toepassingen in staat te stellen onbeperkte gegevensstromen betrouwbaar te verwerken (bv. de stroomverwerking).
"Storm is voor real-time verwerking wat Hadoop is voor batch verwerking!"
In deze instructeur geleide live training zullen de deelnemers leren hoe te installeren en configureren Apache Storm, vervolgens een Apache Storm applicatie ontwikkelen en implementeren voor het verwerken van grote gegevens in real-time.
Enkele van de onderwerpen die in deze training zijn opgenomen, zijn:
Apache Storm in de context van Hadoop
Werken met onbeperkte gegevens
voortdurende berekening
Realtime analyse
Distribueerde RPC en ETL verwerking
Vraag deze cursus nu!
Het publiek
Software en ETL ontwikkelaars
Mainframe professionals
Data wetenschappers
Big data analisten
[ 1 ] Professionals
Format van de cursus
Deel lezing, deel discussie, oefeningen en zware praktijken
Apache Apex is een YARNnative-platform dat stream- en batchverwerking combineert Het verwerkt grote datainmotion op een manier die schaalbaar, performant, faulttolerant, stateful, veilig, gedistribueerd en eenvoudig te bedienen is Deze geinspireerde live training introduceert de uniforme stream-processingarchitectuur van Apache Apex en leidt deelnemers door de creatie van een gedistribueerde applicatie met Apex op Hadoop Aan het einde van deze training kunnen deelnemers: Begrijp gegevensverwerkingspijplijnconcepten zoals aansluitingen voor bronnen en putten, algemene gegevenstransformaties, enz Bouw, schaal en optimaliseer een Apex-applicatie Verwerk realtime datastreams betrouwbaar en met minimale latency Gebruik Apex Core en de Apex Malhar-bibliotheek om snelle applicatie-ontwikkeling mogelijk te maken Gebruik de Apex API om bestaande Java-code te schrijven en opnieuw te gebruiken Integreer Apex in andere applicaties als een verwerkingsengine Stem, test en schaal Apex-toepassingen Publiek ontwikkelaars Enterprise architecten Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
Apache Beam is een open source, uniform programmeermodel voor het definiëren en uitvoeren van parallelle pijplijnen voor gegevensverwerking De kracht zit hem in de mogelijkheid om zowel batch- als streamingpijplijnen uit te voeren, waarbij de uitvoering wordt uitgevoerd door een van Beam's ondersteunde backends voor gedistribueerde verwerking: Apache Apex, Apache Flink, Apache Spark en Google Cloud Dataflow Apache Beam is nuttig voor ETL-taken (Extract, Transform en Load), zoals het verplaatsen van gegevens tussen verschillende opslagmedia en gegevensbronnen, het transformeren van gegevens in een meer wenselijk formaat en het laden van gegevens op een nieuw systeem In deze live training met instructor (op locatie of op afstand) leren deelnemers hoe de Apache Beam SDK's in een Java- of Python-toepassing kunnen worden geïmplementeerd die een gegevensverwerkingspijplijn definieert voor het decomposeren van een grote dataset in kleinere chunks voor onafhankelijke, parallelle verwerking Aan het einde van deze training kunnen deelnemers: Installeer en configureer Apache Beam Gebruik een enkel programmeermodel om zowel batch- als streamverwerking uit te voeren met behulp van hun Java- of Python-toepassing Voer pijpleidingen uit in meerdere omgevingen Publiek ontwikkelaars Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen Notitie Deze cursus zal in de toekomst beschikbaar zijn voor Scala Neem contact met ons op om dit te regelen .
Apache Ignite is een in-memory computerplatform dat zich tussen de applicatie- en datalaag bevindt om de snelheid, schaal en beschikbaarheid te verbeteren.Deze door een instructeur geleide, live training (op locatie of op afstand) is gericht op ontwikkelaars die de principes willen leren achter persistente en pure in-memory opslag terwijl ze de creatie van een voorbeeld in-memory computing-project doorlopen.Aan het einde van deze training kunnen deelnemers:
Gebruik Ignite voor persistentie in het geheugen, op schijf en voor een puur gedistribueerde database in het geheugen. Bereik persistentie zonder gegevens terug te synchroniseren naar een relationele database. Gebruik Ignite om SQL en gedistribueerde joins uit te voeren. Verbeter de prestaties door gegevens dichter bij de CPU te plaatsen en RAM als opslag te gebruiken. Verspreid datasets over een cluster om horizontale schaalbaarheid te bereiken. Integreer Ignite met RDBMS-, NoSQL-, Hadoop- en machine learning-processors.
Formaat van de cursus
Interactieve lezing en discussie. Veel oefeningen en oefeningen. Praktische implementatie in een live-labomgeving.
Opties voor cursusaanpassing
Als u een training op maat voor deze cursus wilt aanvragen, kunt u contact met ons opnemen om een afspraak te maken.
Confluent K SQL is een stroomverwerkingsraamwerk dat bovenop Apache Kafka . Het maakt real-time gegevensverwerking mogelijk met behulp van SQL bewerkingen. Deze instructeur-geleide, live training (op locatie of op afstand) is gericht op ontwikkelaars die Apache Kafka streamverwerking willen implementeren zonder code te schrijven. Aan het einde van deze training kunnen deelnemers:
Installeer en configureer Confluent K SQL .
Stel een stroomverwerkingspijplijn in met alleen SQL opdrachten (geen Java of Python codering).
Voer datafiltering, transformaties, aggregaties, joins, windowing en sessie volledig uit in SQL .
Ontwerp en implementeer interactieve, continue zoekopdrachten voor het streamen van ETL en realtime analyses.
Indeling van de cursus
Interactieve lezing en discussie.
Veel oefeningen en oefenen.
Praktische implementatie in een live-labomgeving.
Cursusaanpassingsopties
Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
Apache Spark Streaming is een schaalbaar, open-source streamsysteem dat gebruikers in real-time gegevens van ondersteunde bronnen kan verwerken. Spark Streaming maakt het mogelijk om gegevensstromen met een foutgevoelige verwerking te verwerken.
Deze instructeur geleide, live training (online of on-site) is gericht op data ingenieurs, data wetenschappers en programmeurs die willen gebruiken Spark Streaming functies in de verwerking en analyse van real-time gegevens.
Aan het einde van deze training zullen de deelnemers in staat zijn om Spark Streaming te gebruiken om live gegevensstromen te verwerken voor gebruik in databases, bestandsystemen en live dashboards.
Format van de cursus
Interactieve lezingen en discussie.
Veel oefeningen en oefeningen.
Hand-on implementatie in een live-lab-omgeving.
Cursus aanpassingsopties
Om een aangepaste training voor deze cursus te vragen, neem dan contact met ons op om te organiseren.
We respect the privacy of your email address. We will not pass on or sell your address to others. You can always change your preferences or unsubscribe completely.