Big Data Training Courses

Big Data Training Courses

Lokale, door een instructeur geleide, live Big Data-trainingen beginnen met een inleiding tot elementaire concepten van Big Data en vervolgens de voortgang in de programmeertalen en -methodieken die worden gebruikt om gegevensanalyse uit te voeren. Tools en infrastructuur voor het inschakelen van Big Data-opslag, gedistribueerde verwerking en schaalbaarheid worden besproken, vergeleken en geïmplementeerd in demo-oefensessies. Big Data-training is beschikbaar als 'live training op locatie' of 'live training op afstand'. Onsite live training kan lokaal worden uitgevoerd op het terrein van de klant in Nederland of in NobleProg bedrijfsopleidingscentra in Nederland . Live-training op afstand wordt uitgevoerd via een interactieve, externe desktop. NobleProg - uw lokale trainingsaanbieder

Getuigenissen

★★★★★
★★★★★

Big Data Cursusoverzicht

Title
Duration
Overview
Title
Duration
Overview
14 hours
Overview
Doel:

Leren werken met SPSS op het niveau van onafhankelijkheid

De geadresseerden:

Analisten, onderzoekers, wetenschappers, studenten en al diegenen die de mogelijkheid willen verwerven om het SPSS-pakket te gebruiken en populaire dataminingtechnieken te leren.
28 hours
Overview
Modellering van gegevenskluizen is een techniek voor databasemodellering die historische gegevensopslag op lange termijn mogelijk maakt die afkomstig is van meerdere bronnen Een gegevenskluis slaat één enkele versie van de feiten op, of "alle gegevens, de hele tijd" Het flexibele, schaalbare, consistente en aanpasbare ontwerp omvat de beste aspecten van 3rd normal form (3NF) en star schema In deze live training met instructeur leren deelnemers hoe ze een Data Vault kunnen bouwen Aan het einde van deze training kunnen deelnemers: Begrijp de architectuur- en ontwerpconcepten achter Data Vault 20 en de interactie met Big Data, NoSQL en AI Gebruik technieken voor gegevensgewelven om auditing, tracing en inspectie van historische gegevens in een datawarehouse in te schakelen Ontwikkel een consistent en herhaalbaar ETL-proces (Extract, Transform, Load) Bouw en implementeer zeer schaalbare en herhaalbare magazijnen Publiek Datamodellen Data warehousing specialist Business Intelligence-specialisten Gegevensingenieurs Databasebeheerders Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
21 hours
Overview
Python is een programmeertaal op hoog niveau die bekend staat om zijn duidelijke syntaxis en codele leesbaarheid Spark is een gegevensverwerkingsengine die wordt gebruikt voor het opvragen, analyseren en transformeren van big data Met PySpark kunnen gebruikers Spark met Python verbinden In deze live training met instructeur leren deelnemers hoe ze Python en Spark samen kunnen gebruiken om big data te analyseren terwijl ze aan handsonoefeningen werken Aan het einde van deze training kunnen deelnemers: Leer hoe u Spark met Python kunt gebruiken om Big Data te analyseren Werk aan oefeningen die de omstandigheden in de echte wereld nabootsen Gebruik verschillende hulpmiddelen en technieken voor big data-analyse met PySpark Publiek ontwikkelaars IT-professionals Data-wetenschappers Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
35 hours
Overview
Vooruitgang in technologieën en de toenemende hoeveelheid informatie veranderen de manier waarop wetshandhaving wordt uitgevoerd De uitdagingen die Big Data vormen zijn bijna net zo ontmoedigend als de belofte van Big Data Efficiënt gegevens opslaan is een van deze uitdagingen; effectief analyseren is een andere Tijdens deze live training met instructeur leren deelnemers de denkwijze om Big Data-technologieën te benaderen, beoordelen ze hun impact op bestaande processen en beleid en implementeren ze deze technologieën om criminele activiteiten te identificeren en criminaliteit te voorkomen Case studies van wetshandhavingsorganisaties over de hele wereld zullen worden onderzocht om inzicht te krijgen in hun adoptiebenaderingen, uitdagingen en resultaten Aan het einde van deze training kunnen deelnemers: Combineer Big Data-technologie met traditionele gegevensverzamelingsprocessen om een ​​verhaal samen te stellen tijdens een onderzoek Implementeer industriële big data opslag- en verwerkingsoplossingen voor data-analyse Een voorstel voorbereiden voor de goedkeuring van de meest geschikte hulpmiddelen en processen om een ​​datadriven aanpak van strafrechtelijk onderzoek mogelijk te maken Publiek Law Enforcement-specialisten met een technische achtergrond Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
14 hours
Overview
Om te voldoen aan de voorschriften van de regulatoren, kunnen CSP's (Communication Service Providers) gebruikmaken van Big Data-analyse die hen niet alleen helpt om aan de compliantie te voldoen, maar ook binnen de reikwijdte daarvan valt project kunnen ze de klanttevredenheid verhogen en zo de churn verminderen Eigenlijk sindsdien naleving is gerelateerd aan Quality of Service gebonden aan een contract, elk initiatief om de naleving, zal het "concurrentievoordeel" van de CSP's verbeteren Daarom is het belangrijk dat Regelgevende instanties moeten in staat zijn om een ​​aantal Big Data-analysepraktijken voor CSP's te adviseren / begeleiden die dat wel zullen doen van wederzijds voordeel zijn tussen de regelgevende instanties en de CSP's 2 dagen natuurlijk: 8 modules, 2 uur elk = 16 uur .
28 hours
Overview
Een groot aantal echte wereldproblemen kan worden beschreven in termen van grafieken Bijvoorbeeld de webgrafiek, de sociale netwerkgrafiek, de treinnetwerkgrafiek en de taalgrafiek Deze grafieken zijn over het algemeen extreem groot; de verwerking ervan vereist een gespecialiseerde set van tools en processen Deze tools en processen kunnen worden aangeduid als Graph Computing (ook bekend als Graph Analytics) Tijdens deze live training met instructeur leren deelnemers over het technologische aanbod en de implementatiebenaderingen voor het verwerken van grafiekgegevens Het doel is om realworld-objecten, hun kenmerken en relaties te identificeren, vervolgens deze relaties te modelleren en ze als gegevens te verwerken met behulp van een grafische computing-aanpak We beginnen met een breed overzicht en beperken ons tot specifieke tools terwijl we een reeks casestudy's, handsonoefeningen en live-implementaties doorlopen Aan het einde van deze training kunnen deelnemers: Begrijp hoe grafiekgegevens worden behouden en doorlopen Selecteer het beste raamwerk voor een bepaalde taak (van grafiedatabases tot kaders voor batchverwerking) Implementeer Hadoop, Spark, GraphX ​​en Pregel voor het tegelijkertijd uitvoeren van graafcomputers op veel verschillende machines Bekijk realworld big data-problemen in termen van grafieken, processen en traversalen Publiek ontwikkelaars Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
21 hours
Overview
Voorspellende analyses zijn het gebruik van gegevensanalyses om voorspellingen over de toekomst te doen Dit proces gebruikt gegevens samen met datamining, statistieken en machinale leertechnieken om een ​​voorspellend model te maken voor het voorspellen van toekomstige gebeurtenissen Tijdens deze live training met instructeur leren deelnemers Matlab te gebruiken om voorspellende modellen te bouwen en deze toe te passen op grote voorbeeldgegevenssets om toekomstige gebeurtenissen te voorspellen op basis van de gegevens Aan het einde van deze training kunnen deelnemers: Creëer voorspellende modellen om patronen in historische en transactionele gegevens te analyseren Gebruik voorspellende modellering om risico's en kansen te identificeren Bouw wiskundige modellen die belangrijke trends vastleggen Gebruik gegevens van apparaten en bedrijfssystemen om afval te verminderen, tijd te besparen of kosten te besparen Publiek ontwikkelaars ingenieurs Domein experts Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
7 hours
Overview
Apache NiFi (Hortonworks gegevensstroom) is een real-time geïntegreerde data logistiek en eenvoudige gebeurtenis processing platform dat de verhuizing, tracking en automatisering van gegevens tussen systemen mogelijk maakt. Het is geschreven met behulp van flow-based programmeren en biedt een web-based gebruikersinterface te beheren dataflows in real time.

in deze instructeur-LED, live training, zullen de deelnemers leren de fundamenten van de flow-based programmeren als ze de ontwikkeling van een aantal demo-extensies, componenten en processors met behulp van Apache NiFi.

aan het einde van deze training kunnen de deelnemers:

- begrijpen NiFi & #39; s architectuur en gegevensstroom concepten.
- ontwikkelen extensies met behulp van NiFi en Third-Party Api's.
- Custom ontwikkelen van hun eigen Apache Nifi processor.
- inslikken en verwerken real-time gegevens van ongelijksoortige en ongewone bestandsformaten en gegevensbronnen.

formaat van de cursus

- interactieve lezing en bespreking.
- veel oefeningen en praktijk.
- hands-on implementatie in een live-lab omgeving.

cursus customization opties

- voor het aanvragen van een aangepaste opleiding voor deze cursus, neem dan contact met ons op te regelen.
21 hours
Overview
Apache NiFi (Hortonworks DataFlow) is een realtime geïntegreerde datalogistiek en een eenvoudig platform voor evenementverwerking dat het verplaatsen, volgen en automatiseren van gegevens tussen systemen mogelijk maakt Het is geschreven met behulp van flowbased programmering en biedt een webgebaseerde gebruikersinterface om dataflows in realtime te beheren Tijdens deze live training met instructeur leren deelnemers hoe ze Apache NiFi kunnen inzetten en beheren in een live-laboratoriumomgeving Aan het einde van deze training kunnen deelnemers: Installeer en configureer Apachi NiFi Bronnen, transformeren en beheren van gegevens uit ongelijksoortige, gedistribueerde gegevensbronnen, inclusief databases en big data-meren Automatiseer dataflows Schakel streaming-analyse in Pas verschillende benaderingen toe voor data-inname Transformeer Big Data en naar zakelijke inzichten Publiek Systeembeheerders Gegevensingenieurs ontwikkelaars DevOps Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
14 hours
Overview
Apache SolrCloud is een gedistribueerde gegevensverwerkingsengine die het zoeken en indexeren van bestanden op een gedistribueerd netwerk mogelijk maakt In deze live training met instructeur leren deelnemers hoe ze een SolrCloud-instantie kunnen opzetten op Amazon AWS Aan het einde van deze training kunnen deelnemers: De functies van SolCloud begrijpen en hoe ze zich verhouden tot die van conventionele masterslave-clusters Configureer een SolCloud gecentraliseerde cluster Automatiseer processen zoals communiceren met scherven, documenten toevoegen aan de scherven, enz Gebruik Zookeeper in combinatie met SolrCloud om processen verder te automatiseren Gebruik de interface om foutrapportage te beheren Load-balans van een SolrCloud-installatie Configureer SolrCloud voor continue verwerking en failover Publiek Solr-ontwikkelaars Project managers Systeembeheerders Zoek analisten Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
14 hours
Overview
Datameer is een business intelligence en analytics-platform gebouwd op Hadoop Het stelt eindgebruikers in staat om op grote schaal gemakkelijk toegang te krijgen tot grootschalige, gestructureerde, semigestructureerde en ongestructureerde gegevens, deze te verkennen en te correleren Tijdens deze live training met instructeur leren deelnemers Datameer te gebruiken om de steile leercurve van Hadoop te overwinnen terwijl ze de opstelling en analyse van een reeks big data-bronnen doorlopen Aan het einde van deze training kunnen deelnemers: Creëer, ontwikkel en exploreer interactief een datameer voor bedrijven Toegang tot datawarehouses voor business intelligence, transactiedatabases en andere analytische winkels Gebruik een spreadsheetgebruikersinterface om endtoend gegevensverwerkingspijplijnen te ontwerpen Toegang tot vooraf gebouwde functies om complexe gegevensrelaties te verkennen Gebruik draganddrop-wizards om gegevens te visualiseren en dashboards te maken Gebruik tabellen, grafieken, grafieken en kaarten om queryresultaten te analyseren Publiek Data-analisten Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
28 hours
Overview
MemSQL is een inkomende, gedistribueerd SQL-databasebeheersysteem voor cloud en onpremises Het is een realtime datawarehouse dat onmiddellijk inzichten uit live en historische gegevens oplevert In deze live training met instructeur leren deelnemers de essentie van MemSQL voor ontwikkeling en beheer Aan het einde van deze training kunnen deelnemers: Begrijp de belangrijkste concepten en kenmerken van MemSQL MemSQL installeren, ontwerpen, onderhouden en bedienen Optimaliseer schema's in MemSQL Verbeter zoekopdrachten in MemSQL Benchmarkprestaties in MemSQL Bouw realtime datatoepassingen met behulp van MemSQL Publiek ontwikkelaars Administrators Operatie Engineers Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
14 hours
Overview
Tigon is een opensource, realtime, lowlatency, highthroughput, native YARN, stream processing framework dat bovenop HDFS en HBase voor persistentie zit Tigon-applicaties richten zich op use-cases zoals detectie en analyse van netwerkintrus- sies, marktanalyses van sociale media, locatieanalyses en realtime aanbevelingen aan gebruikers Deze instructieve, live training introduceert Tigon's benadering van het mengen van realtime en batchverwerking terwijl het deelnemers door de creatie van een voorbeeldtoepassing leidt Aan het einde van deze training kunnen deelnemers: Maak krachtige, stroomverwerkingsprogramma's voor het verwerken van grote hoeveelheden gegevens Processtroombronnen zoals Twitter en Webserver Logs Gebruik Tigon voor snel samenvoegen, filteren en aggregeren van streams Publiek ontwikkelaars Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
14 hours
Overview
Apache Ignite is een in-Memory computing platform dat zit tussen de toepassing en data laag om de snelheid te verbeteren, schaal, en de beschikbaarheid 。

in deze instructeur-LED, live training, zullen de deelnemers leren de principes achter persistente en pure in-Memory opslag als ze stap door de oprichting van een monster in-Memory computing project.

aan het einde van deze training kunnen de deelnemers:

- gebruik Ignite voor in-Memory, op schijf persistentie evenals een zuiver verspreid in het geheugendata base.
- bereiken persistentie zonder het synchroniseren van gegevens terug naar een relationele database.
- gebruik Ignite uit te voeren SQL en Distributed joins.
- verbeteren de prestaties door het verplaatsen van gegevens dichter bij de CPU, met behulp van RAM als opslag.
- verspreidt gegevenssets over een cluster om horizontale schaalbaarheid te bereiken.
- integreert Ignite met RDBMS, NoSQL, Hadoop en machine learning processors.

formaat van de cursus

- interactieve lezing en bespreking.
- veel oefeningen en praktijk.
- hands-on implementatie in een live-lab omgeving.

cursus customization opties

- voor het aanvragen van een aangepaste opleiding voor deze cursus, neem dan contact met ons op te regelen.
14 hours
Overview
Vespa en opensource big data processing and serving engine gemaakt door Yahoo Het wordt gebruikt om te reageren op vragen van gebruikers, aanbevelingen te doen en in realtime gepersonaliseerde inhoud en advertenties te bieden Deze instructieve, live training introduceert de uitdagingen van het bedienen van grootschalige gegevens en wandelt deelnemers door het creëren van een applicatie die antwoorden op gebruikersaanvragen kan berekenen, over grote datasets in realtime Aan het einde van deze training kunnen deelnemers: Gebruik Vespa om snel gegevens te berekenen (opslaan, zoeken, rangschikken, organiseren) tijdens het gebruik van de tijd terwijl een gebruiker wacht Implementeer Vespa in bestaande applicaties met functies zoeken, aanbevelingen en personalisatie Integreer en implementeer Vespa met bestaande big data-systemen zoals Hadoop en Storm Publiek ontwikkelaars Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
21 hours
Overview
Apache Apex is een YARNnative-platform dat stream- en batchverwerking combineert Het verwerkt grote datainmotion op een manier die schaalbaar, performant, faulttolerant, stateful, veilig, gedistribueerd en eenvoudig te bedienen is Deze geinspireerde live training introduceert de uniforme stream-processingarchitectuur van Apache Apex en leidt deelnemers door de creatie van een gedistribueerde applicatie met Apex op Hadoop Aan het einde van deze training kunnen deelnemers: Begrijp gegevensverwerkingspijplijnconcepten zoals aansluitingen voor bronnen en putten, algemene gegevenstransformaties, enz Bouw, schaal en optimaliseer een Apex-applicatie Verwerk realtime datastreams betrouwbaar en met minimale latency Gebruik Apex Core en de Apex Malhar-bibliotheek om snelle applicatie-ontwikkeling mogelijk te maken Gebruik de Apex API om bestaande Java-code te schrijven en opnieuw te gebruiken Integreer Apex in andere applicaties als een verwerkingsengine Stem, test en schaal Apex-toepassingen Publiek ontwikkelaars Enterprise architecten Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
7 hours
Overview
Alexio is een open source virtueel gedistribueerd opslagsysteem dat ongelijksoortige opslagsystemen verenigt en applicaties in staat stelt om te communiceren met gegevens op geheugensnelheid Het wordt gebruikt door bedrijven zoals Intel, Baidu en Alibaba In deze live training met instructeur leren deelnemers Alexio te gebruiken om verschillende berekeningsraamwerken met opslagsystemen te overbruggen en op een efficiënte manier multipetabyte schaalgegevens te beheren terwijl ze een Alluxio-toepassing maken Aan het einde van deze training kunnen deelnemers: Ontwikkel een applicatie met Alluxio Verbind big data-systemen en applicaties met behoud van één naamruimte Haal op efficiënte wijze waarde uit big data in elk opslagformaat Verbeter de prestaties van de workloads Implementeer en beheer Alluxio standalone of geclusterd Publiek Data scientist Ontwikkelaar Systeem administrator Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
28 hours
Overview
Apache flink is een open-source framework voor schaalbare Stream en batch data processing.

deze instructeur-LED, live training introduceert de principes en benaderingen achter Distributed Stream en batch-gegevensverwerking, en wandelingen deelnemers door de oprichting van een real-time, data streaming applicatie in Apache flink.

aan het einde van deze training kunnen de deelnemers:

- het opzetten van een omgeving voor het ontwikkelen van data-analysetoepassingen.
- pakket, uitvoeren, en monitor flink-based, fouttolerante, data streaming toepassingen.
- beheert diverse workloads.
- uitvoeren van geavanceerde Analytics met behulp van flink ML.
- het opzetten van een multi-node flink cluster.
- meten en optimaliseren van de prestaties.
- integreert flink met verschillende grote data systemen.
- vergelijk flink mogelijkheden met die van andere grote gegevensverwerkings kaders.

formaat van de cursus

- deel lezing, deel bespreking, oefeningen en zware hands-on praktijk
14 hours
Overview
Apache Samza is een opensource nearrealtime, asynchroon computationeel framework voor stream processing Het gebruikt Apache Kafka voor berichten en Apache Hadoop YARN voor fouttolerantie, processorisolatie, beveiliging en resourcebeheer Deze instructieve, live training introduceert de principes achter berichtensystemen en gedistribueerde streamverwerking, terwijl deelnemers wandelen door het creëren van een voorbeeldproject in Samzabased en het uitvoeren van opdrachten Aan het einde van deze training kunnen deelnemers: Gebruik Samza om de code te vereenvoudigen die nodig is om berichten te produceren en te consumeren Ontkoppel de afhandeling van berichten van een applicatie Gebruik Samza om asynchrone berekeningen in de nabije omgeving te implementeren Gebruik stream-processing om een ​​hoger niveau van abstractie over berichtensystemen te bieden Publiek ontwikkelaars Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
14 hours
Overview
Apache Zeppelin is een webbased notebook voor het vastleggen, onderzoeken, visualiseren en delen van Hadoop- en Spark-data Deze instructieve, live training introduceert de concepten achter interactieve data-analyse en leidt deelnemers door de inzet en het gebruik van Zeppelin in een omgeving met één gebruiker of meerdere gebruikers Aan het einde van deze training kunnen deelnemers: Installeer en configureer Zeppelin Ontwikkelen, organiseren, uitvoeren en delen van gegevens in een browsergebaseerde interface Visualiseer resultaten zonder naar de opdrachtregel of clusterdetails te verwijzen Uitvoeren en samenwerken aan lange workflows Werk met een van een aantal plugin-taal / dataprocessing-backends, zoals Scala (met Apache Spark), Python (met Apache Spark), Spark SQL, JDBC, Markdown en Shell Integreer Zeppelin met Spark, Flink en Map Reduce Beveiligde multi-user-instanties van Zeppelin met Apache Shiro Publiek Gegevensingenieurs Data-analisten Datawetenschappers Software ontwikkelaars Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
14 hours
Overview
Magellan is een opensource gedistribueerde uitvoeringsengine voor georuimtelijke analyses van big data Het wordt bovenop Apache Spark geïmplementeerd en breidt Spark SQL uit en biedt een relationele abstractie voor georuimtelijke analyses Deze instructieve live training introduceert de concepten en benaderingen voor het implementeren van geospaciale analyses en leidt deelnemers door het maken van een voorspellende analysetoepassing met Magellan on Spark Aan het einde van deze training kunnen deelnemers: Efficiënt query's, parseren en samenvoegen van georuimtelijke datasets op schaal Geospatiale gegevens implementeren in toepassingen voor bedrijfsinformatie en voorspellende analyse Gebruik ruimtelijke context om de mogelijkheden van mobiele apparaten, sensoren, logboeken en wearables uit te breiden Publiek Applicatie-ontwikkelaars Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
28 hours
Overview
Hadoop is een populair kader voor verwerking van Big Data Python is een programmeertaal op hoog niveau die bekend staat om zijn duidelijke syntaxis en codele leesbaarheid In deze live training met instructeur leren deelnemers hoe met Hadoop, MapReduce, Pig en Spark te werken met Python terwijl ze door meerdere voorbeelden stappen en cases gebruiken Aan het einde van deze training kunnen deelnemers: Begrijp de basisbegrippen achter Hadoop, MapReduce, Pig en Spark Gebruik Python met Hadoop Distributed File System (HDFS), MapReduce, Pig en Spark Gebruik Snakebite om binnen Python programmatisch toegang te krijgen tot HDFS Gebruik mrjob om MapReduce-taken in Python te schrijven Schrijf Spark-programma's met Python Breid de functionaliteit van varken uit met Python UDF's Beheer MapReduce-taken en Pig-scripts met Luigi Publiek ontwikkelaars IT-professionals Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
28 hours
Overview
MonetDB is een opensource-database die een pionier was in de benadering van de columnstore-technologie Tijdens deze live training met instructeur leren deelnemers hoe MonetDB te gebruiken en hoe je er de meeste waarde uit haalt Aan het einde van deze training kunnen deelnemers: Begrijp MonetDB en de bijbehorende functies Installeer en ga aan de slag met MonetDB Verken en voer verschillende functies en taken uit in MonetDB Versnel de levering van hun project door de MonetDB-mogelijkheden te maximaliseren Publiek ontwikkelaars Technische experts Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
21 hours
Overview
Pentaho Data Integration is een opensource data-integratietool voor het definiëren van banen en datatransformaties Tijdens deze live training met instructeur leren deelnemers hoe gebruik te maken van de krachtige ETL-mogelijkheden en rijke GUI van Pentaho Data Integration om een ​​hele big data lifecycle te beheren, waarbij de waarde van data voor de organisatie wordt gemaximaliseerd Aan het einde van deze training kunnen deelnemers: Basisdatatransformaties met stappen en hops maken, voorvertonen en uitvoeren Configureer en beveilig de Pentaho Enterprise Repository Gebruik verschillende gegevensbronnen en genereer een enkele, uniforme versie van de waarheid in een analyticsready-indeling Geef resultaten aan derde-deeltoepassingen voor verdere verwerking Publiek Data-analist ETL-ontwikkelaars Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .
21 hours
Overview
Stream Processing verwijst naar de realtime verwerking van "data in beweging", dat wil zeggen, het uitvoeren van berekeningen op data terwijl deze wordt ontvangen Dergelijke gegevens worden gelezen als continue streams van gegevensbronnen zoals sensorgebeurtenissen, website-gebruikersactiviteiten, financiële transacties, creditcard-swipes, klikstreams, etc Stream Processing-frameworks zijn in staat om grote hoeveelheden inkomende gegevens te lezen en vrijwel direct waardevolle inzichten te leveren In deze live training met instructor (op locatie of op afstand) leren deelnemers verschillende Stream Processing-frameworks in te stellen en te integreren met bestaande big data-opslagsystemen en gerelateerde softwaretoepassingen en microservices Aan het einde van deze training kunnen deelnemers: Installeer en configureer verschillende Stream Processing-frameworks, zoals Spark Streaming en Kafka Streaming Begrijp en selecteer het meest geschikte kader voor de taak Proces van gegevens continu, gelijktijdig en op record-gebaseerde manier Integreer Stream Processing-oplossingen met bestaande databases, datawarehouses, datameren, enz Integratie van de meest geschikte stream-processing-bibliotheek met bedrijfsapplicaties en microservices Publiek ontwikkelaars Software architecten Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen Notes Om een ​​aangepaste training aan te vragen voor deze cursus, neem dan contact met ons op om dit te regelen .
14 hours
Overview
deze instructeur-LED, live training (ter plaatse of op afstand) is gericht op Data analisten en data wetenschappers die willen meer geavanceerde Data Analytics technieken voor Data Mining met behulp van python uit te voeren.

aan het einde van deze training kunnen de deelnemers:

- begrijpen belangrijke gebieden van data mining, met inbegrip van vereniging regel mijnbouw, tekst sentiment analyse, automatische tekst samenvatting, en data anomalie detectie.
- vergelijken en implementeren van verschillende strategieën voor het oplossen van Real-World Data Mining problemen.
- begrijpen en interpreteren de resultaten.

formaat van de cursus

- interactieve lezing en bespreking.
- veel oefeningen en praktijk.
- hands-on implementatie in een live-lab omgeving.

cursus customization opties

- voor het aanvragen van een aangepaste opleiding voor deze cursus, neem dan contact met ons op te regelen.
21 hours
Overview
Apache Spark's learning curve is slowly increasing at the begining, it needs a lot of effort to get the first return. This course aims to jump through the first tough part. After taking this course the participants will understand the basics of Apache Spark , they will clearly differentiate RDD from DataFrame, they will learn Python and Scala API, they will understand executors and tasks, etc. Also following the best practices, this course strongly focuses on cloud deployment, Databricks and AWS. The students will also understand the differences between AWS EMR and AWS Glue, one of the lastest Spark service of AWS.

AUDIENCE:

Data Engineer, DevOps, Data Scientist
21 hours
Overview
KNIME Analytics Platform is een toonaangevende open source-optie voor datadriven innovatie, die u helpt het potentieel verborgen in uw gegevens te ontdekken, de mijne voor nieuwe inzichten, of nieuwe futures te voorspellen Met meer dan 1000 modules, honderden readytorun-voorbeelden, een uitgebreid assortiment geïntegreerde tools en de breedste keuze aan geavanceerde algoritmen die beschikbaar zijn, is KNIME Analytics Platform de perfecte toolbox voor elke data scientist en bedrijfsanalist Deze cursus voor KNIME Analytics Platform is een ideale gelegenheid voor beginners, gevorderde gebruikers en KNIME-experts om kennis te maken met KNIME, om te leren hoe het effectiever te gebruiken en om heldere, uitgebreide rapporten te maken op basis van KNIME-workflows .
21 hours
Overview
Big data-analyse omvat het proces van het onderzoeken van grote hoeveelheden gevarieerde datasets om correlaties, verborgen patronen en andere nuttige inzichten bloot te leggen De gezondheidsindustrie heeft enorme hoeveelheden complexe heterogene medische en klinische gegevens Het toepassen van big data-analyse op gezondheidsgegevens biedt enorm veel potentieel om inzichten te verkrijgen voor het verbeteren van de levering van gezondheidszorg De enorme omvang van deze datasets vormt echter een grote uitdaging voor analyses en praktische toepassingen in een klinische omgeving In deze live training (op afstand) met instructor leren deelnemers hoe ze big data-analyse in gezondheid kunnen uitvoeren terwijl ze een reeks handson-oefeningen doorlopen Aan het einde van deze training kunnen deelnemers: Analysehulpmiddelen voor big data installeren en configureren, zoals Hadoop MapReduce en Spark Begrijp de kenmerken van medische gegevens Big Data-technieken toepassen om met medische gegevens om te gaan Bestudeer big data-systemen en algoritmen in de context van gezondheidstoepassingen Publiek ontwikkelaars Data-wetenschappers Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen Notitie Om een ​​aangepaste training aan te vragen voor deze cursus, neem dan contact met ons op om dit te regelen .
14 hours
Overview
Apache Arrow is een opensource inmemorieel gegevensverwerkingsraamwerk Het wordt vaak samen met andere data science-tools gebruikt voor toegang tot ongelijksoortige datastores voor analyse Het kan goed worden geïntegreerd met andere technologieën zoals GPU-databases, machine-learningbibliotheken en -hulpmiddelen, uitvoeringsengines en datavisualisatiekaders In deze onsite training, live training, leren deelnemers om Apache Arrow te integreren met verschillende Data Science-frameworks om toegang te krijgen tot gegevens uit ongelijksoortige gegevensbronnen Aan het einde van deze training kunnen deelnemers: Installeer en configureer Apache Arrow in een gedistribueerde geclusterde omgeving Gebruik Apache Arrow om toegang te krijgen tot gegevens uit ongelijksoortige gegevensbronnen Gebruik Apache Arrow om de noodzaak voor het bouwen en onderhouden van complexe ETL-pijpleidingen te omzeilen Analyseer gegevens over ongelijksoortige gegevensbronnen zonder deze te consolideren in een gecentraliseerde opslagplaats Publiek Datawetenschappers Gegevensingenieurs Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen Notitie Om een ​​aangepaste training aan te vragen voor deze cursus, neem dan contact met ons op om dit te regelen .
Weekend Big Data cursus, Avond Big Data training, Avond Big Data opleiding Big Data boot camp, Big Data instructeur geleid, Weekend Big Data training, Avond Big Data cursus, Big Data coaching, Big Data instructeur, Big Data trainer, Big Data training cursus, Big Data lessen, Big Data on-site, Big Data privé cursus, Big Data een op een training, Big Data op locatie, Weekend Big Data opleiding

Cursussen met korting

Course Discounts Newsletter

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Een aantal van onze klanten

is growing fast!

We are looking to expand our presence in the Netherlands!

As a Business Development Manager you will:

  • expand business in the Netherlands
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!