Big Data Training Courses

Big Data Training Courses

Lokale, door een instructeur geleide, live Big Data-trainingen beginnen met een inleiding tot elementaire concepten van Big Data en vervolgens de voortgang in de programmeertalen en -methodieken die worden gebruikt om gegevensanalyse uit te voeren. Tools en infrastructuur voor het inschakelen van Big Data-opslag, gedistribueerde verwerking en schaalbaarheid worden besproken, vergeleken en geïmplementeerd in demo-oefensessies. Big Data-training is beschikbaar als 'live training op locatie' of 'live training op afstand'. Onsite live training kan lokaal worden uitgevoerd op het terrein van de klant in Nederland of in NobleProg bedrijfsopleidingscentra in Nederland . Live-training op afstand wordt uitgevoerd via een interactieve, externe desktop. NobleProg - uw lokale trainingsaanbieder

Machine Translated

Getuigenissen

★★★★★
★★★★★

Big Data Cursusoverzicht

Course Name
Duration
Overview
Course Name
Duration
Overview
14 hours
Overview
Go al:

Leren werken met SPSS op het niveau van onafhankelijkheid

De geadresseerden:

Analisten, onderzoekers, wetenschappers, studenten en iedereen die de mogelijkheid wil verwerven om het SPSS-pakket te gebruiken en populaire dataminingtechnieken te leren.
35 hours
Overview
Vooruitgang in technologieën en de toenemende hoeveelheid informatie transformeert de manier waarop zaken worden gedaan in veel bedrijfstakken, waaronder de overheid. Go vernment genereren van gegevens en digitale archivering tarieven zijn op de stijging te wijten aan de snelle groei van mobiele apparaten en toepassingen, intelligente sensoren en apparaten, cloud computing-oplossingen, en op de burger gerichte portals. Naarmate digitale informatie zich uitbreidt en complexer wordt, worden informatiebeheer, verwerking, opslag, beveiliging en dispositie ook complexer. Nieuwe tools voor vastleggen, zoeken, ontdekken en analyseren helpen organisaties inzicht te krijgen in hun ongestructureerde gegevens. De overheidsmarkt bevindt zich op een kantelpunt en beseft dat informatie een strategisch voordeel is en dat de overheid zowel gestructureerde als ongestructureerde informatie moet beschermen, benutten en analyseren om missievereisten beter te kunnen bedienen en te voldoen. Terwijl regeringsleiders ernaar streven datagestuurde organisaties te ontwikkelen om met succes een missie te volbrengen, leggen zij de basis voor het correleren van afhankelijkheden tussen evenementen, mensen, processen en informatie.

Hoogwaardige overheidsoplossingen worden gemaakt op basis van een mashup van de meest ontwrichtende technologieën:

- Mobiele apparaten en applicaties
- Cloud diensten
- Sociale bedrijfstechnologieën en netwerken
- Big Data en analyses

IDC voorspelt dat de IT-industrie tegen 2020 $ 5 biljoen zal bereiken, ongeveer $ 1,7 biljoen groter dan vandaag, en dat 80% van de groei van de industrie zal worden aangedreven door deze technologieën van het derde platform. Op de lange termijn zullen deze technologieën sleutelinstrumenten zijn om met de complexiteit van toegenomen digitale informatie om te gaan. Big Data is een van de intelligente oplossingen in de industrie en stelt de overheid in staat betere beslissingen te nemen door actie te ondernemen op basis van patronen die worden onthuld door het analyseren van grote hoeveelheden gegevensgerelateerde en niet-gerelateerde, gestructureerde en ongestructureerde.

Maar het realiseren van deze prestaties vergt veel meer dan alleen het verzamelen van enorme hoeveelheden gegevens. "Het begrijpen van de hoeveelheden Big Data vereist geavanceerde tools en technologieën die nuttige kennis kunnen analyseren en extraheren uit enorme en diverse informatiestromen", Tom Kalil en Fen Zhao van het Witte Huis Bureau voor Wetenschap en Technologiebeleid schreef in een bericht op de OSTP Blog.

Het Witte Huis heeft een stap gezet in de richting van het helpen van bureaus bij het vinden van deze technologieën toen het in 2012 het National Big Data Research and Development Initiative oprichtte. Het initiatief omvatte meer dan $ 200 miljoen om de explosie van Big Data en de tools die nodig zijn om het te analyseren .

De uitdagingen die Big Data meebrengt, zijn bijna net zo ontmoedigend als zijn belofte bemoedigend is. Gegevens efficiënt opslaan is een van deze uitdagingen. Zoals altijd zijn de budgetten krap, dus moeten bureaus de opslagprijs per megabyte minimaliseren en de gegevens binnen handbereik houden zodat gebruikers het kunnen krijgen wanneer ze het willen en hoe ze het nodig hebben. Een back-up maken van enorme hoeveelheden gegevens vergroot de uitdaging.

Een effectieve analyse van de gegevens is een andere grote uitdaging. Veel bureaus maken gebruik van commerciële hulpmiddelen waarmee ze door de bergen aan gegevens kunnen bladeren en trends ontdekken die hen kunnen helpen efficiënter te werken. (Uit een recent onderzoek van MeriTalk is gebleken dat federale IT-managers denken dat Big Data agentschappen kan helpen om meer dan $ 500 miljard te besparen en tegelijkertijd de missiedoelstellingen te realiseren.).

Op maat ontwikkelde Big Data tools stellen bureaus ook in staat om de behoefte aan analyse van hun gegevens aan te pakken. De Computational Data Analytics Group van het Oak Ridge National Laboratory heeft bijvoorbeeld zijn Piranha data-analysesysteem beschikbaar gesteld aan andere instanties. Het systeem heeft medische onderzoekers geholpen een link te vinden die artsen kan waarschuwen voor aorta-aneurysma's voordat ze toeslaan. Het wordt ook gebruikt voor meer alledaagse taken, zoals het doorzoeken van cv's om sollicitanten in contact te brengen met personeelsmanagers.
35 hours
Overview
Overzicht

Communication serviceproviders van Communication (CSP) staan onder druk om de kosten te verlagen en de gemiddelde opbrengst per gebruiker (ARPU) te maximaliseren, terwijl ze een uitstekende klantervaring garanderen, maar datavolumes blijven groeien. Wereldwijd mobiel dataverkeer groeit met een samengestelde jaarlijkse groeisnelheid (CAGR) van 78 procent tot 2016 en bereikt 10,8 exabytes per maand.

Ondertussen genereren CSP's grote hoeveelheden gegevens, waaronder call detail records (CDR), netwerkgegevens en klantgegevens. Bedrijven die deze gegevens volledig benutten, behalen een voorsprong op de concurrentie. Volgens een recent onderzoek van The Economist Intelligence Unit, genieten bedrijven die gegevensgestuurde besluitvorming gebruiken, een productiviteitsverhoging van 5-6%. Toch gebruikt 53% van de bedrijven slechts de helft van hun waardevolle gegevens, en een vierde van de respondenten merkte op dat grote hoeveelheden bruikbare gegevens ongebruikt blijven. De datavolumes zijn zo hoog dat handmatige analyse onmogelijk is en de meeste oudere softwaresystemen kunnen dit niet bijhouden, waardoor waardevolle gegevens worden genegeerd of genegeerd.

Met de supersnelle, schaalbare big data-software van Big Data & Analytics kunnen CSP's al hun gegevens minen voor betere besluitvorming in minder tijd. Verschillende Big Data producten en -technieken bieden een end-to-end softwareplatform voor het verzamelen, voorbereiden, analyseren en presenteren van inzichten uit big data. Toepassingsgebieden zijn onder meer monitoring van netwerkprestaties, fraudedetectie, klantverloopdetectie en kredietrisicoanalyse. Big Data & Analytics-producten schalen om terabytes aan gegevens te verwerken, maar de implementatie van dergelijke tools heeft een nieuw soort cloudgebaseerd databasesysteem nodig, zoals Hadoop of een massale parallelle computerprocessor (KPU enz.)

Deze cursus werkt aan Big Data BI voor Telco en behandelt alle opkomende nieuwe gebieden waarin CSP's investeren voor productiviteitswinst en het openen van nieuwe inkomstenstromen voor bedrijven. De cursus biedt een volledig overzicht van 360 graden over Big Data BI in Telco, zodat besluitvormers en managers een zeer breed en uitgebreid overzicht hebben van de mogelijkheden van Big Data BI in Telco voor productiviteit en winst.

Cursus Doelstellingen

Belangrijkste doel van de cursus is om nieuwe te introduceren Big Data business intelligence technieken in 4 sectoren Telecom Business ( Marketing / Sales, Network Operation, financiële exploitatie en Customer Relation Management ). Studenten maken kennis met het volgende:

- Inleiding tot Big Data wat 4V's is (volume, snelheid, variëteit en waarheidsgetrouwheid) in Big Data - genereren, extraheren en beheren vanuit Telco-perspectief
- Hoe Big Data analyse verschilt van oudere gegevensanalyses
- Interne rechtvaardiging van Big Data -Telco-perspectief
- Inleiding tot het Hadoop ecosysteem - vertrouwdheid met alle Hadoop tools zoals Hive , Pig, SPARC - wanneer en hoe ze worden gebruikt om Big Data probleem op te lossen
- Hoe Big Data wordt geëxtraheerd om te analyseren voor analysetool - hoe Business Analysis 's hun pijnpunten bij het verzamelen en analyseren van gegevens kunnen verminderen via een geïntegreerde Hadoop dashboardbenadering
- Basisintroductie van Insight-analyses, visualisatieanalyses en voorspellende analyses voor Telco
- Analyse van klantverloop en Big Data hoe Big Data analyse kan klantverloop en klantontevredenheid in Telco-casestudies verminderen
- Netwerkfout- en servicefoutanalyse van netwerkmetagegevens en IPDR
- Financiële analyse-fraude, verspilling en ROI-schatting van verkoop- en operationele gegevens
- Klantwervingsprobleem - Target marketing, klantsegmentatie en cross-sales vanuit verkoopgegevens
- Introductie en samenvatting van alle Big Data analyseproducten en waar deze passen in de analytische ruimte van Telco
- Conclusie - stapsgewijze aanpak om Big Data Business Intelligence in uw organisatie te introduceren

Doelgroep

- Netwerkwerking, financiële managers, CRM-managers en IT-topmanagers in het CIO-kantoor van Telco.
- Business in Telco
- CFO office managers / analisten
- Operationele managers
- QA-managers
21 hours
Overview
De cursus is bedoeld voor IT-specialisten die op zoek zijn naar een oplossing voor het opslaan en verwerken van grote gegevenssets in een gedistribueerde systeemomgeving

Doel van de cursus:

Kennis verkrijgen over Hadoop clusterbeheer
35 hours
Overview
Publiek:

De cursus is bedoeld voor IT-specialisten die op zoek zijn naar een oplossing voor het opslaan en verwerken van grote gegevenssets in een gedistribueerde systeemomgeving

Go al:

Diepe kennis van Hadoop clusterbeheer.
21 hours
Overview
Natuurlijk kan elke tool worden geleverd, inclusief gratis open-source datamining-software en applicaties
21 hours
Overview
Publiek

Als u de gegevens waartoe u toegang heeft, wilt begrijpen of ongestructureerde gegevens op het internet wilt analyseren (zoals Twitter, Linked in, enz ...), is deze cursus iets voor u.

Het is vooral bedoeld voor besluitvormers en mensen die moeten kiezen welke gegevens het verzamelen waard zijn en wat het analyseren waard is.

Het is niet gericht op mensen die de oplossing configureren, die mensen zullen echter profiteren van het grote geheel.

Bezorgingsmodus

Tijdens de cursus krijgen de deelnemers werkvoorbeelden van voornamelijk open source-technologieën.

Korte lezingen worden gevolgd door een presentatie en eenvoudige oefeningen door de deelnemers

Gebruikte inhoud en software

Alle gebruikte software wordt elke keer dat de cursus wordt uitgevoerd bijgewerkt, dus we controleren de nieuwste versies mogelijk.

Het omvat het proces van het verkrijgen, formatteren, verwerken en analyseren van de gegevens, om uit te leggen hoe het besluitvormingsproces kan worden geautomatiseerd met machine learning.
14 hours
Overview
R is een open-source gratis programmeertaal voor statistisch computergebruik, gegevensanalyse en grafische afbeeldingen. R wordt gebruikt door een groeiend aantal managers en data-analisten binnen bedrijven en de academische wereld. R heeft een grote verscheidenheid aan pakketten voor datamining.
35 hours
Overview
Dag 1 - biedt een overzicht op hoog niveau van essentiële Big Data onderwerpgebieden. De module is verdeeld in een reeks secties, die elk vergezeld gaan van een praktische oefening.

Dag 2 - onderzoekt een reeks onderwerpen die betrekking hebben op analysepraktijken en hulpmiddelen voor Big Data omgevingen. Het gaat niet over implementatie- of programmadetails, maar houdt in plaats daarvan dekking op een conceptueel niveau, gericht op onderwerpen die deelnemers in staat stellen een uitgebreid begrip te ontwikkelen van de gemeenschappelijke analysefuncties en functies die door Big Data oplossingen worden aangeboden.

Dag 3 - biedt een overzicht van de fundamentele en essentiële onderwerpgebieden met betrekking tot de platformarchitectuur voor Big Data oplossingen. Het omvat Big Data mechanismen die nodig zijn voor de ontwikkeling van een Big Data oplossingsplatform en architecturale opties voor het samenstellen van een gegevensverwerkingsplatform. Er worden ook algemene scenario's gepresenteerd om een basiskennis te geven van hoe een Big Data oplossingsplatform in het algemeen wordt gebruikt.

Dag 4 - bouwt voort op dag 3 door geavanceerde onderwerpen te verkennen die betrekking hebben op de platformarchitectuur voor Big Data oplossingen. In het bijzonder worden verschillende architecturale lagen die deel uitmaken van het Big Data oplossingsplatform geïntroduceerd en besproken, waaronder gegevensbronnen, gegevensinvoer, gegevensopslag, gegevensverwerking en beveiliging.

Dag 5 - behandelt een aantal oefeningen en problemen die zijn ontworpen om het vermogen van de afgevaardigden om kennis van onderwerpen die op dag 3 en 4 zijn behandeld toe te passen, te testen.
21 hours
Overview
Big Data is een term die verwijst naar oplossingen die zijn bedoeld voor het opslaan en verwerken van grote gegevenssets. Go eerste instantie ontwikkeld door Go ogle, hebben deze Big Data oplossingen andere vergelijkbare projecten ontwikkeld en geïnspireerd, waarvan vele beschikbaar zijn als open-source. R is een populaire programmeertaal in de financiële sector.
28 hours
Overview
Audience:

This course is intended to demystify big data/hadoop technology and to show it is not difficult to understand.
14 hours
Overview
Het doel van de cursus is om deelnemers in staat te stellen om de beheersing van de SQL taal in Oracle database te beheersen voor data-extractie op intermediair niveau.
28 hours
Overview
Doelstelling: Gedelegeerden kunnen big data-sets analyseren, patronen extraheren, de juiste variabele kiezen die van invloed is op de resultaten, zodat een nieuw model wordt voorspeld met voorspellende resultaten .
28 hours
Overview
R is een open-source gratis programmeertaal voor statistisch computergebruik, gegevensanalyse en grafische afbeeldingen. R wordt gebruikt door een groeiend aantal managers en data-analisten binnen bedrijven en de academische wereld. R heeft ook volgers gevonden onder statistici, ingenieurs en wetenschappers zonder computerprogrammeervaardigheden die het gemakkelijk vinden om te gebruiken. De populariteit is te danken aan het toenemende gebruik van datamining voor verschillende doelen, zoals het instellen van advertentieprijzen, het sneller vinden van nieuwe medicijnen of het verfijnen van financiële modellen. R heeft een grote verscheidenheid aan pakketten voor datamining.
14 hours
Overview
Wanneer traditionele opslagtechnologieën niet omgaan met de hoeveelheid gegevens die u moet opslaan, zijn er honderden alternatieven. Deze cursus probeert de deelnemers te begeleiden wat alternatieven zijn voor het opslaan en analyseren van Big Data en wat hun voor- en nadelen zijn.

Deze cursus is vooral gericht op discussie en presentatie van oplossingen, hoewel praktische oefeningen op aanvraag beschikbaar zijn.
21 hours
Overview
DOELSTELLING:

Deze cursus introduceert Apache Spark . De studenten leren hoe Spark past in het Big Data ecosysteem en hoe Spark gebruikt kan worden voor data-analyse. De cursus behandelt Spark shell voor interactieve gegevensanalyse, Spark internals, Spark API's, Spark SQL , Spark streaming en machine learning en graphX.

PUBLIEK :

Ontwikkelaars / gegevensanalisten
28 hours
Overview
Apache Hadoop is het populairste framework voor het verwerken van Big Data op clusters van servers. Deze cursus zal een ontwikkelaar om verschillende componenten (HDFS, MapReduce, Pig, introduceren Hive en HBase) Hadoop ecosysteem.
21 hours
Overview
Apache Hadoop is een van de populairste kaders voor het verwerken van Big Data op clusters van servers. Deze cursus gaat in op gegevensbeheer in HDFS, geavanceerde Pig, Hive en HBase. Deze geavanceerde programmeertechnieken zullen voordelig zijn voor ervaren Hadoop ontwikkelaars.

Publiek : ontwikkelaars

Duur: drie dagen

Formaat: hoorcolleges (50%) en hands-on labs (50%).
21 hours
Overview
Deze cursus introduceert HBase - een No SQL store bovenop Hadoop . De cursus is bedoeld voor ontwikkelaars die HBase gaan gebruiken om applicaties te ontwikkelen, en beheerders die HBase-clusters gaan beheren.

We zullen een ontwikkelaar door HBase-architectuur en datamodellering en applicatie-ontwikkeling op HBase leiden. Er wordt ook ingegaan op het gebruik van MapReduce met HBase en enkele beheeronderwerpen met betrekking tot prestatieoptimalisatie. De cursus is zeer praktisch met veel laboratoriumoefeningen.

Duur : 3 dagen

Publiek : ontwikkelaars en beheerders
21 hours
Overview
Apache Hadoop is het populairste framework voor het verwerken van Big Data op clusters van servers. In deze drie (eventueel vier) dagen cursus, zullen de deelnemers leren over de zakelijke voordelen en use cases voor Hadoop en zijn ecosysteem, hoe cluster inzet en groei plannen, hoe te installeren, onderhouden, monitor, problemen oplossen en optimaliseren van Hadoop . Ze zullen ook oefenen met het bulksgewijs laden van gegevens, vertrouwd Hadoop met verschillende Hadoop distributies en oefenen met het installeren en beheren van Hadoop ecosysteemtools. De cursus eindigt met een bespreking van het beveiligen van cluster met Kerberos.

“… De materialen waren zeer goed voorbereid en grondig bedekt. Het lab was erg behulpzaam en goed georganiseerd ”
- Andrew Nguyen, hoofdintegratie DW Engineer, Microsoft Online Advertising

Publiek

Hadoop beheerders

Formaat

Lezingen en hands-on labs, bij benadering evenwicht 60% lezingen, 40% labs.
21 hours
Overview
Apache Hadoop is het meest populaire raamwerk voor het verwerken van Big Data Hadoop biedt een uitgebreide en diepgaande analysemogelijkheid en maakt een doorbraak naar de traditionele BI-analysewereld Deze cursus introduceert een analist voor de kerncomponenten van het Hadoop ecosysteem en zijn analyses Publiek Bedrijfsanalisten Looptijd drie dagen Formaat Hoorcolleges en practica .
14 hours
Overview
De cursus maakt deel uit van de vaardigheden van Data Scientist (Domain: Data and Technology).
14 hours
Overview
R is een opensource-vrije programmeertaal voor statistische gegevensverwerking, gegevensanalyse en grafische weergave R wordt gebruikt door een groeiend aantal managers en data-analisten binnen bedrijven en universiteiten R heeft een grote verscheidenheid aan pakketten voor datamining .
7 hours
Overview
Deze cursus behandelt het gebruik van Hive SQL taal (AKA: Hive HQL, SQL on Hive , Hive QL) voor mensen die gegevens uit Hive
21 hours
Overview
Cloudera Impala is een open source massaal parallelle verwerking (MPP) SQL query-engine voor Apache Hadoop clusters.

Impala stelt gebruikers in staat om SQL query's met lage latentie te geven aan gegevens die zijn opgeslagen in Hadoop Distributed File System en Apache Hbase zonder dat gegevens moeten worden verplaatst of getransformeerd.

Publiek

Deze cursus is bedoeld voor analisten en datawetenschappers die analyses uitvoeren op gegevens die zijn opgeslagen in Hadoop via Business Intelligence of SQL tools.

Na deze cursus kunnen afgevaardigden dat doen

- Haal betekenisvolle informatie uit Hadoop clusters met Impala .
- Schrijf specifieke programma's om Business Intelligence in Impala SQL Dialect te vergemakkelijken.
- Problemen met Impala oplossen.
35 hours
Overview
MLlib is Spark's machine learning (ML) bibliotheek. Het doel is om praktische machine learning schaalbaar en eenvoudig te maken. Het bestaat uit algemene leeralgoritmen en hulpprogramma's, waaronder classificatie, regressie, clustering, collaboratieve filtering, vermindering van de dimensionaliteit, evenals optimalisatieprimitieven op een lager niveau en pijplijn-API's op een hoger niveau.

Het is verdeeld in twee pakketten:

-

spark.mllib bevat de originele API gebouwd bovenop RDD's.

-

spark.ml biedt een API op een hoger niveau gebouwd bovenop DataFrames voor het construeren van ML-pijpleidingen.

Publiek

Deze cursus is bedoeld voor ingenieurs en ontwikkelaars die een ingebouwde machinebibliotheek voor Apache Spark
28 hours
Overview
Deze cursus is bedoeld voor ingenieurs en besluitvormers die werkzaam zijn in datamining en kennisdetectie.

U leert hoe u effectieve plots en manieren maakt om uw gegevens te presenteren en weer te geven op een manier die de besluitvormers zal aanspreken en hen helpt om verborgen informatie te begrijpen.
21 hours
Overview
Hadoop is het meest populaire framework voor Big Data-verwerking .
35 hours
Overview
Big data zijn datasets die zo omvangrijk en complex zijn dat traditionele applicatiesoftware voor gegevensverwerking onvoldoende is om hiermee om te gaan. Big data-uitdagingen zijn onder meer het vastleggen van gegevens, gegevensopslag, gegevensanalyse, zoeken, delen, overdragen, visualiseren, opvragen, bijwerken en informatieprivacy.
14 hours
Overview
ZooKeeper is een gecentraliseerde service voor het onderhouden van configuratie-informatie, naamgeving, gedistribueerde synchronisatie en groepsdiensten.
Weekend Big Data cursus, Avond Big Data training, Avond Big Data opleiding Big Data boot camp, Big Data instructeur geleid, Weekend Big Data training, Avond Big Data cursus, Big Data coaching, Big Data instructeur, Big Data trainer, Big Data training cursus, Big Data lessen, Big Data on-site, Big Data privé cursus, Big Data een op een training, Big Data op locatie, Weekend Big Data opleiding

Cursussen met korting

Course Discounts Newsletter

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Een aantal van onze klanten

This site in other countries/regions