Gegevensstreaming en real time gegevensverwerking Training Cursus
Cursusoverzicht
Deze cursus biedt een praktische en gestructureerde introductie in het bouwen van real time gegevensstreaming-systemen. De nadruk ligt op kernconcepten, architectuurpatronen en industriële tools die worden gebruikt om continue gegevens op grote schaal te verwerken. Deelnemers leren hoe ze streaming-pijplijnen ontwerpen, implementeren en optimaliseren met behulp van moderne frameworks. De cursus loopt van fundamentele ideeën naar praktische toepassingen, waardoor deelnemers zelfverzekerd productieklaar real time oplossingen kunnen bouwen.
Vorm van de training
• Trainingsessies onder leiding van een instructeur met begeleidende uitleg
• Conceptuele doorloop met voorbeelden uit de praktijk
• Praktische demonstraties en programmeeroefeningen
• Geleidelijk opgebouwde labs die aansluiten bij de dagelijkse onderwerpen
• Interactieve discussies en vragen en antwoorden
Doelstellingen van de cursus
• Begrijpen van de concepten van real time gegevensstreaming en systeemarchitectuur
• Verschillen begrijpen tussen batchverwerking en streaming-gegevensverwerkingsmodellen
• Schaalbare en fouttolerante streaming-pijplijnen ontwerpen
• Werken met gedistribueerde streaming-tools en frameworks
• Toepassen van event-time processing, windowing en stateful operaties
Echt tijd gegevensoplossingen bouwen en optimaliseren voor bedrijfsdoelstellingen
Cursusaanbod
Cursusprogramma Dag 1
• Introductie tot concepten van gegevensstreaming
• Grondslagen van batch- versus real time-verwerking
• Basisprincipes van gebeurtenisgestuurde architectuur
• Veelvoorkomende use cases in de industrie
• Overzicht van het streaming-ecosysteem
Dag 2
• Architectuurontwerppatronen voor streaming
• Grondslagen van gedistribueerde boodschappsysteem
• Producers en consumers
• Topics, partitions en gegevensstroom
• Strategieën voor gegevensinbreng
Dag 3
• Concepten en frameworks voor stream processing
• Event-time versus processing-time
• Windowing-technieken en use cases
• Stateful stream processing
• Grondslagen van fouttolerantie en checkpointing
Dag 4
• Gegevenstransformatie in streaming-pijplijnen
• ETL en ELT in real time systemen
• Schema-beheer en evolutie
• Stream joins en verrijking
• Introductie tot cloudgebaseerde streamingdiensten
Dag 5
• Monitoring en observabiliteit in streaming-systemen
• Grondslagen van beveiliging en toegangsbeheer
• Prestatievertraging en optimalisatie
• Ontwerpevaluatie van end-to-end pijplijnen
• Real world use cases, zoals fraude detectie en IoT verwerking
Aangepaste bedrijfsopleiding
Opleidingsoplossingen ontworpen exclusief voor bedrijven.
- Aangepaste inhoud: We passen de syllabus en praktijkopdrachten aan naar de echte doelen en behoeften van uw project.
- Voor flexibel schema: Datums en tijden aangepast aan het rooster van uw team.
- Formaat: Online (live), In-company (bij uw kantoren) of Hybride.
Prijs per privégroep, online live training, startend vanaf 8000 € + BTW*
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
(*De eindprijs kan variëren afhankelijk van de technische specialisatie van het cursus, het aangepaste niveau, de methode van levering en het aantal leerlingen)
Hulp nodig bij het kiezen van de juiste cursus?
opleidingen@nobleprog.com of +31 208 080 666
Gegevensstreaming en real time gegevensverwerking Training Cursus - Navraag
Gegevensstreaming en real time gegevensverwerking - Consultancyaanvraag
Reviews (1)
Praktijkopdrachten. De cursus had eigenlijk vijf dagen moeten duren, maar de drie dagen hebben al veel van mijn vragen beantwoord die ik had na het werken met NiFi.
James - BHG Financial
Cursus - Apache NiFi for Administrators
Automatisch vertaald
Voorlopige Aankomende Cursussen
Gerelateerde cursussen
Advanced Apache Iceberg
21 UrenDeze door een instructeur geleide, live training (online of ter plekke) is gericht op geavanceerde dataprofessionals die dataverwerkingswerkstromen willen optimaliseren, data-integriteit willen waarborgen en robuuste data lakehouse-oplossingen willen implementeren die de complexiteiten van moderne big data-applicaties kunnen aan.
Aan het einde van deze training zullen de deelnemers in staat zijn om:
- Een diepgaande kennis te verwerven van de architectuur van Iceberg, inclusief metadata-beheer en bestandsindeling.
- Iceberg te configureren voor optimale prestaties in verschillende omgevingen en te integreren met meerdere dataverwerkingsmotoren.
- Grote Iceberg-tabellen beheren, complexe schemacomponenten uitvoeren en partitie-evolutie beheren.
- Technieken beheersen om de queryprestaties en de efficiëntie van datascans te optimaliseren voor grote datasets.
- Mechanismen implementeren om data-consistentie te waarborgen, transactiegaranties te beheren en fouten in gedistribueerde omgevingen te verhelpen.
Apache Iceberg Fundamentals
14 UrenDeze door een instructeur geleide, live training (online of op locatie) is gericht op beginnende data-professionals die de kennis en vaardigheden willen verwerven die nodig zijn om Apache Iceberg effectief te gebruiken voor het beheren van grote datasets, het waarborgen van gegevensintegriteit en het optimaliseren van gegevensverwerkingsworkflows.
Aan het einde van deze training kunnen de deelnemers:
- Een diepgaand begrip krijgen van de architectuur, kenmerken en voordelen van Apache Iceberg.
- Meer te weten komen over tabelformaten, partitie-onderverdeling, schema-evolutie en tijdreizen-mogelijkheden.
- Apache Iceberg installeren en configureren in verschillende omgevingen.
- Iceberg-tabellen aanmaken, beheren en manipuleren.
- Het proces van het migreren van gegevens van andere tabelformaten naar Iceberg begrijpen.
Big Data-analyse met Google Colab en Apache Spark
14 UrenDeze door een instructeur geleide live training (online of op locatie) is bedoeld voor datascientists en ingenieurs op intermediair niveau die Google Colab en Apache Spark willen gebruiken voor big data verwerking en analyse.
Aan het einde van deze training kunnen deelnemers:
- Een big data omgeving instellen met behulp van Google Colab en Spark.
- Grote datasets efficiënt verwerken en analyseren met Apache Spark.
- Big data visualiseren in een samenwerkingsomgeving.
- Apache Spark integreren met cloudgebaseerde hulpmiddelen.
Big Data Business Intelligence voor Overheidsinstanties
35 UrenTechnologische vorderingen en de toenemende hoeveelheid informatie veranderen hoe bedrijven in vele sectoren, inclusief het overheidsapparaat, hun zaken doen. De generatie en digitale archivering van overheidsgegevens nemen toe door de snelle groei van mobiele apparaten en toepassingen, slimme sensoren en apparaten, cloudcomputing-oplossingen en burgers gerichte portalen. Naarmate digitale informatie uitbreidt en complexer wordt, worden informatiebeheer, verwerking, opslag, beveiliging en verwerking eveneens complexer. Nieuwe hulpmiddelen voor vangen, zoeken, ontdekken en analyseren helpen organisaties inzichten te krijgen uit hun ongestructureerde gegevens. De overheidsmarkt staat op een waterscheid en realiseert dat informatie een strategisch bezit is, en het overheid nodig heeft om zowel gestructureerde als ongestructureerde informatie te beschermen, te benutten en te analyseren om de burger beter te dienen en missionaire vereisten te voldoen. Terwijl overheidsleiders streven naar een data-drijvende organisatie om hun missie succesvol uit te voeren, leggen zij de basis om afhankelijkheden tussen gebeurtenissen, mensen, processen en informatie samen te brengen.
Waardevolle overheidsoplossingen zullen ontstaan door een mengsel van de meest disruptieve technologieën:
- Mobiele apparaten en toepassingen
- Cloudservices
- Sociale bedrijvstechnologieën en netwerken
- Big Data en analytics
Big Data is één van de intelligente industrieoplossingen en maakt het mogelijk voor overheidsinstanties betere beslissingen te nemen door actie te ondernemen op basis van patronen die worden onthuld door de analyse van grote hoeveelheden gegevens - gerelateerd of niet, gestructureerd of ongestructureerd.
Maar het bereiken van deze prestaties vraagt meer dan alleen het vergaren van enorme hoeveelheden gegevens. “Het begrijpen van deze hoeveelheden Big Data vereist snijrandtechnologieën die kunnen analyseren en nuttige kennis kunnen winnen uit omvangrijke en diverse informatiestromen,” schreven Tom Kalil en Fen Zhao van het Witte Huis Office of Science and Technology Policy in een blogpost.
Het Witte Huis zette een stap richting het helpen van instanties bij het vinden van deze technologieën toen het de National Big Data Research and Development Initiative in 2012 lanceerde. De initiatief omvat meer dan $200 miljoen om het beste uit te halen van de explosieve groei van Big Data en de tools die nodig zijn om het te analyseren.
De uitdagingen waarmee Big Data gepaard gaat, zijn bijna even ontmoedigend als de beloften eropvallend aanmoedigend. Een efficiënte gegevensopslag is één van deze uitdagingen. Budgets blijven strak, dus instanties moeten de prijs per megabyte voor opslag minimaliseren en de gegevens gemakkelijk toegankelijk houden zodat gebruikers ze kunnen krijgen wanneer ze dat willen en hoe ze het nodig hebben. Het back-uppen van enorme hoeveelheden gegevens verhoogt deze uitdaging.
Effectief analyseren van de gegevens is een andere grote uitdaging. Veel instanties gebruiken commerciële tools die hun mogelijk maken door bergen gegevens heen te ploegen, trends te ontdekken die hen helpen efficiënter te opereren. (Een recent onderzoek door MeriTalk toonde aan dat federale IT-uitvoerenden denken dat Big Data instanties meer dan $500 miljard kan helpen besparen terwijl het ook missionaire doelstellingen vervult.)
Aangepaste ontwikkelde Big Data-tools maken het ook mogelijk voor instanties om de noodzaak te benaderen om hun gegevens te analyseren. Bijvoorbeeld, het Computational Data Analytics Group van het Oak Ridge National Laboratory heeft zijn Piranha-gegevensanalyse systeem beschikbaar gemaakt voor andere instanties. Het systeem heeft medische onderzoekers geholpen een link te vinden die artsen kan waarschuwen voor aortaverwijdingen voordat ze optreden. Het wordt ook gebruikt voor meer alledaagse taken, zoals het doorzoeken van CV's om sollicitanten met werkgevers in contact te brengen.
Een Pratique Inleiding tot Data Analysis en Big Data - 3 Dagen
21 UrenDeelnemers die deze door een instructeur geleide, live training in Nederland voltooien, krijgen een praktisch, real-world begrip van Big Data en de bijbehorende technologieën, methodologieën en hulpmiddelen.
Deelnemers krijgen de kans om deze kennis in de praktijk te brengen door middel van praktische oefeningen. Groepsinteractie en feedback van de instructeur vormen een belangrijk onderdeel van de klas.
De cursus begint met een inleiding tot elementaire concepten van Big Data en gaat vervolgens verder met de programmeertalen en methodologieën die worden gebruikt om uit te voeren Data Analysis. Ten slotte bespreken we de tools en infrastructuur die Big Data opslag, gedistribueerde verwerking en Scalabiliteit mogelijk maken.
Big Data en Geavanceerde Analytica
42 UrenBig Data en Geavanceerde Analytische Oplossingen is het toepassen van geavanceerde technieken en hulpmiddelen om grote, complexe datasets te analyseren voor handelbare inzichten en strategische besluitvorming.
Deze instructeurgeleide, live training (online of ter plaatse) is bedoeld voor geavanceerde dataprofessionals die geavanceerde analytische methoden en big data technologieën willen benutten voor voorspellende, voorschrijvende en real-time analytische oplossingen.
Aan het einde van deze training zullen deelnemers in staat zijn om:
- Grootschalige dataverwerkingspijplijnen te ontwerpen en implementeren voor gestructureerde en ongestructureerde data.
- Geavanceerde machine learning- en deep learningtechnieken toe te passen op grote datasets.
- Verdeelde rekenkaders te benutten voor real-time analytische oplossingen en data streaming.
- Big data analytische oplossingen te integreren in business intelligence- en besluitvormingssystemen.
Formaat van de Cursus
- Interactieve lezingen en discussies.
- Veel oefeningen en praktijkopdrachten.
- Handson implementatie in een live-labomgeving.
Opties voor Cursusaanpassing
- Om een aangepaste training voor deze cursus aan te vragen, neem contact met ons op om te regelen.
Apache NiFi voor Beheerders
21 UrenApache NiFi is een open-source, op stromen gebaseerd platform voor gegevensintegratie en -verwerking. Het stelt automatische, real-time dataverzending, transformatie en systeemediatie tussen verschillende systemen mogelijk, met een webinterface en fijnmazige controle.
Dit instructeurgeleide, live training (op locatie of op afstand) is gericht op beheerders en ingenieurs van middelbare niveau die willen implementeren, beheren, beveiligen en optimaliseren van NiFi-dataflows in productieomgevingen.
Na het volgen van deze training zullen de deelnemers in staat zijn:
- Apache NiFi-clusters installeren, configureren en onderhouden.
- Dataflows van verschillende bronnen en doelen ontwerpen en beheren.
- Flow-automatisering, -routering en -transformatielogica implementeren.
- Prestaties optimaliseren, bewerkingen monitoren en problemen oplossen.
Format van de cursus
- Interactieve lezing met discussie over echte architectuur.
- Praktijkopdrachten: bouwen, implementeren en beheren van flows.
- Scenario-gebaseerde oefeningen in een live-labomgeving.
Cursusaanpassingsmogelijkheden
- Voor een aangepaste training voor deze cursus kunt u ons contacteren om de details te bespreken.
PySpark en Machine Learning
21 UrenDeze training biedt een praktische introductie tot het opzetten van schaalbare dataprocessen en Machine Learning-werkstromen met PySpark. Deelnemers leren hoe Apache Spark functioneert binnen moderne Big Data-ecosystemen en hoe ze grote datasets efficiënt kunnen verwerken met behulp van principes van gedistribueerde computing.
Apache Spark Fundamentals
21 UrenDit instructeur-geloodste live-training in Nederland (online of on-site) is bedoeld voor ingenieurs die Apache Spark willen instellen en implementeren voor het verwerken van zeer grote hoeveelheden gegevens.
Na afloop van deze training zullen de deelnemers in staat zijn om:
- Apache Spark te installeren en configureren.
- Zeer grote gegevenssets snel te verwerken en te analyseren.
- Het verschil tussen Apache Spark en Hadoop MapReduce te begrijpen, en wanneer welk systeem gebruikt moet worden.
- Apache Spark te integreren met andere machine learning-tools.
Administration van Apache Spark
35 UrenDeze live training onder leiding van een instructeur in Nederland (online of op locatie) is bedoeld voor beginnende tot gemiddelde systeembeheerders die Spark-clusters willen implementeren, onderhouden en optimaliseren.
Aan het einde van deze training zijn de deelnemers in staat om:
- Installeer en configureer Apache Spark in verschillende omgevingen.
- Clusterresources beheren en Spark-toepassingen bewaken.
- Optimaliseer de prestaties van Spark-clusters.
- Implementeer beveiligingsmaatregelen en zorg voor een hoge beschikbaarheid.
- Veelvoorkomende problemen met Spark opsporen en oplossen.
Apache Spark in de Cloud
21 UrenDe leercurve van Apache Spark begint traag en stijgt langzaam in het begin, het vereist veel moeite om de eerste resultaten te behalen. Deze cursus helpt u over het eerste moeilijke deel te springen. Na het volgen van deze cursus zullen de deelnemers de basis van Apache Spark begrijpen, ze zullen RDD duidelijk van DataFrame kunnen onderscheiden, ze zullen de Python- en Scala-API leren, ze zullen executors en taken begrijpen, enzovoort. Ook door de beste praktijken te volgen, richt deze cursus zich sterk op cloud-deployments, Databricks en AWS. De studenten zullen ook de verschillen tussen AWS EMR en AWS Glue begrijpen, een van de meest recente Spark-diensten van AWS.
AANWENDINGSGEBIED:
Data Engineer, DevOps, Data Scientist
Python en Spark voor Big Data (PySpark)
21 UrenIn deze door een instructeur geleide, live training in Nederland, leren deelnemers hoe ze Python en Spark samen kunnen gebruiken om big data te analyseren terwijl ze werken aan praktische oefeningen.
Aan het einde van deze training zijn de deelnemers in staat om:
- Leer hoe u Spark kunt gebruiken met Python om Big Data te analyseren.
- Werk aan oefeningen die gevallen uit de echte wereld nabootsen.
- Gebruik verschillende tools en technieken voor big data-analyse met behulp van PySpark.
Python, Spark, en Hadoop voor Big Data
21 UrenDeze live training in Nederland onder leiding van een instructeur (online of op locatie) is bedoeld voor ontwikkelaars die Spark, Hadoop en Python willen gebruiken en integreren om grote en complexe datasets te verwerken, analyseren en transformeren.
Aan het einde van deze training zijn de deelnemers in staat om:
- Zet de benodigde omgeving in om te beginnen met het verwerken van big data met Spark, Hadoop en Python.
- Krijg inzicht in de functies, kernonderdelen en architectuur van Spark en Hadoop.
- Leer hoe u Spark, Hadoop en Python kunt integreren voor de verwerking van big data.
- Verken de tools in het Spark-ecosysteem (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka en Flume).
- Bouw gezamenlijke filteraanbevelingssystemen die vergelijkbaar zijn met Netflix, YouTube, Amazon, Spotify en Google.
- Gebruik Apache Mahout om machine learning-algoritmen te schalen.
Stratio: Rocket en Intelligence Modules met PySpark
14 UrenStratio is een datacentrisch platform dat big data, AI en governance integreert in één oplossing. De Rocket- en Intelligence-modules maken snelle data-exploratie, transformatie en geavanceerde analyse mogelijk in bedrijfsumgevingen.
Deze door instructeurs geleide, live-training (online of op locatie) is gericht op geavanceerde data-professionals die de Rocket- en Intelligence-modules in Stratio effectief willen gebruiken met PySpark, met focus op lusstructuren, gebruikersgedefinieerde functies en geavanceerde datalogica.
Aan het einde van deze training zullen de deelnemers in staat zijn om:
- Te navigeren en te werken binnen het Stratio-platform met behulp van de Rocket- en Intelligence-modules.
- PySpark toe te passen in de context van data-inname, transformatie en analyse.
- Lussen en conditionele logica te gebruiken om data-workflows en feature-engineeringtaken te besturen.
- Gebruikersgedefinieerde functies (UDFs) te creëren en beheren voor herbruikbare data-operaties in PySpark.
Formaat van de cursus
- Interactieve colleges en discussies.
- Veel oefeningen en praktijk.
- Hands-on implementatie in een live-laboratoriumomgeving.
Opties voor cursusaanpassing
- Voor het aanvragen van een aangepaste training voor deze cursus, neem dan contact met ons op om dit te regelen.