Lokale, door instructeurs geleide live Apache Spark-trainingscursussen demonstreren door praktische oefening hoe Spark past in het Big Data-ecosysteem en hoe Spark kan worden gebruikt voor data-analyse. Apache Spark-training is beschikbaar als 'live training op afstand' of 'live training op locatie'. Online live training (ook bekend als "live training op afstand") wordt uitgevoerd via een interactieve, externe desktop . Live training op locatie kan lokaal worden uitgevoerd op het terrein van de klant in Leiden of in bedrijfstrainingscentra van NobleProg in Leiden. NobleProg -- Uw lokale trainingsaanbieder
Leiden
Golden Tulip/Tulip Inn Leiden Centre, Schipholweg 3, Leiden, Nederland, 2316XB
Het 4-sterrenhotel Golden Tulip Leiden Centre ligt direct naast het Tulip Inn Leiden Centre hotel; samen herbergen ze 7 sterren onder 1 dak. De hotels zijn ideaal gelegen met Leiden Centraal Station er direct tegenover en vele snelwegen binnen handbereik. Een prachtige locatie in het centrum van de historische stad Leiden vol musea en schilderachtige plekjes. Beleef, geniet en laat u inspireren.
Golden Tulip & Tulip Inn Leiden Centre beschikken over een grote diversiteit aan hotelkamers; van comfortabel en modern ingerichte standaard kamers tot luxe executive kamers. In totaal zijn er 155 kamers. Verder beschikken de hotels over een gerenoveerd restaurant genaamd "Rubens", een gezellige bar/lounge en een uitgebreid meeting & conference center.
De 6 multifunctionele zalen maken Golden Tulip & Tulip Inn Leiden Centre tot de ideale locatie voor kleine en middelgrote bijeenkomsten. De zalen hebben een capaciteit van 4 tot 100 personen. De vergaderzalen bieden talloze mogelijkheden wat betreft opstelling en technische faciliteiten. Gemak, efficiency, gastvrijheid en professionaliteit staan voorop. Alle zalen hebben airconditioning, gratis draadloos internet en daglicht.
Tot in de vroege 19e eeuw vormde de visserij de belangrijkste inkomstenbron in Noordwijk aan Zee. Na verloop van tijd begon de lokale bevolking zich echter steeds meer op het toerisme te richten. Tegenwoordig vinden er jaarlijks meer dan 1 miljoen overnachtingen plaats in het gebied. Noordwijk aan Zee bestaat uit verschillende wijken en is gelegen op de duinen. Het herbergt diverse horecagelegenheden, waaronder hotels, uitgaanscentra en restaurants, waarvan sommige direct aan het strand liggen. Bovendien is er een winkelcentrum dat op zondag geopend is. Elk jaar worden evenementen gehouden op de boulevard rond de vuurtoren op het Vuurtorenplein. De gemeente heeft een KNRM-reddingstation en een hervormde kerk uit 1647 met een preekstoel uit de 17e eeuw.
Na de fusie met de gemeente Noordwijkerhout is de grotere gemeente nu verdeeld in vier centra. Noordwijk aan Zee, oorspronkelijk een vissersdorp, is uitgegroeid tot een badplaats met een lang kustgebied van ongeveer 13 km. De stad heeft twee boulevards, elk vernoemd naar een koningin, de Koningin Wilhelmina Boulevard en de Koningin Astrid Boulevard.
Het Two Brothers Noordwijk Beach Hotel ligt aan de boulevard van Noordwijk met zicht op het dorp en de zee en heeft meerdere conferentiezalen en trainingslokalen die het de perfect plek maken voor zakelijke bijeenkomsten en stimulerende trainingen. Noordwijk is 30 minuten rijden verwijderd van Amsterdam en Den Haag en slechts 20 minuten vanaf Leiden.
Deze live training onder leiding van een instructeur in Leiden (online of ter plaatse) is bedoeld voor datawetenschappers en -ingenieurs van gemiddeld niveau die Google Colab en Apache Spark willen gebruiken voor de verwerking en analyse van big data.
Aan het einde van deze training zijn de deelnemers in staat om:
Zet een big data-omgeving op met behulp van Google Colab en Spark.
Verwerk en analyseer grote datasets efficiënt met Apache Spark.
Visualiseer big data in een samenwerkingsomgeving.
Deze live training in Leiden onder leiding van een instructeur (online of op locatie) is bedoeld voor ontwikkelaars die Spark, Hadoop en Python willen gebruiken en integreren om grote en complexe datasets te verwerken, analyseren en transformeren.
Aan het einde van deze training zijn de deelnemers in staat om:
Zet de benodigde omgeving in om te beginnen met het verwerken van big data met Spark, Hadoop en Python.
Krijg inzicht in de functies, kernonderdelen en architectuur van Spark en Hadoop.
Leer hoe u Spark, Hadoop en Python kunt integreren voor de verwerking van big data.
Verken de tools in het Spark-ecosysteem (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka en Flume).
Bouw gezamenlijke filteraanbevelingssystemen die vergelijkbaar zijn met Netflix, YouTube, Amazon, Spotify en Google.
Gebruik Apache Mahout om machine learning-algoritmen te schalen.
Deze live training onder leiding van een instructeur in Leiden (online of op locatie) is bedoeld voor beginnende tot gemiddelde systeembeheerders die Spark-clusters willen implementeren, onderhouden en optimaliseren.
Aan het einde van deze training zijn de deelnemers in staat om:
Installeer en configureer Apache Spark in verschillende omgevingen.
Clusterresources beheren en Spark-toepassingen bewaken.
Optimaliseer de prestaties van Spark-clusters.
Implementeer beveiligingsmaatregelen en zorg voor een hoge beschikbaarheid.
Veelvoorkomende problemen met Spark opsporen en oplossen.
In deze door een instructeur geleide, live training in Leiden, leren deelnemers hoe ze Python en Spark samen kunnen gebruiken om big data te analyseren terwijl ze werken aan praktische oefeningen.
Aan het einde van deze training zijn de deelnemers in staat om:
Leer hoe u Spark kunt gebruiken met Python om Big Data te analyseren.
Werk aan oefeningen die gevallen uit de echte wereld nabootsen.
Gebruik verschillende tools en technieken voor big data-analyse met behulp van PySpark.
Deze cursus is bedoeld voor ontwikkelaars en datawetenschappers die AI willen begrijpen en implementeren in hun toepassingen. Er wordt speciale aandacht besteed aan data-analyse, gedistribueerde kunstmatige intelligentie en natuurlijke taalverwerking.
Big data-analyse omvat het proces van het onderzoeken van grote hoeveelheden gevarieerde gegevenssets om correlaties, verborgen patronen en andere nuttige inzichten te ontdekken.
De gezondheidsindustrie heeft enorme hoeveelheden complexe heterogene medische en klinische gegevens. Het toepassen van big data-analyses op gezondheidsgegevens biedt een enorm potentieel voor het verkrijgen van inzichten voor het verbeteren van de gezondheidszorg. De enorme omvang van deze datasets vormt echter grote uitdagingen bij analyses en praktische toepassingen in een klinische omgeving.
In deze door een instructeur geleide, live training (op afstand), leren deelnemers hoe ze big data-analyses in gezondheid kunnen uitvoeren terwijl ze een reeks praktische live-laboefeningen doorlopen.
Aan het einde van deze training kunnen deelnemers:
Installeer en configureer big data-analysehulpmiddelen zoals Hadoop MapReduce en Spark
Begrijp de kenmerken van medische gegevens
Pas big data-technieken toe om met medische gegevens om te gaan
Bestudeer big data-systemen en algoritmen in het kader van gezondheidstoepassingen
Publiek
ontwikkelaars
Data Scientists
Indeling van de cursus
Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen.
Notitie
Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
In deze door een instructeur geleide, live training in Leiden, leren deelnemers over het technologieaanbod en de implementatiebenaderingen voor het verwerken van grafiekgegevens. Het doel is om objecten uit de echte wereld, hun kenmerken en relaties te identificeren, deze relaties vervolgens te modelleren en ze als gegevens te verwerken met behulp van een Graph Computing (ook bekend als Graph Analytics) benadering. We beginnen met een breed overzicht en beperken ons tot specifieke tools terwijl we een reeks casestudy's, hands-on oefeningen en live implementaties doorlopen.
Aan het einde van deze training zijn de deelnemers in staat om:
Begrijp hoe grafiekgegevens worden bewaard en doorkruist.
Selecteer het beste framework voor een bepaalde taak (van graph databases tot batch processing frameworks).
Implementeer Hadoop, Spark, GraphX en Pregel om grafiekberekeningen op veel machines parallel uit te voeren.
Bekijk real-world big data-problemen in termen van grafieken, processen en traversals.
Deze instructeur-geleide, live training in Leiden (op locatie of op afstand) is gericht op systeembeheerders die willen leren hoe ze clusters binnen hun organisatie kunnen opzetten, implementeren en beheren.
Aan het einde van deze training kunnen deelnemers:
Installeer en configureer Apache Hadoop.
Begrijp de vier belangrijkste componenten in het Hadoop-ecosysteem: HDFS, MapReduce, YARN en Hadoop Common.
Gebruik Hadoop Distributed File System (HDFS) om een cluster te schalen naar honderden of duizenden knooppunten.
Stel HDFS in om te functioneren als opslagengine voor on-premise Spark-implementaties.
Stel Spark in voor toegang tot alternatieve opslagoplossingen zoals Amazon S3 en NoSQL databasesystemen zoals Redis, Elasticsearch, Couchbase, Aerospike, enz.
Voer administratieve taken uit zoals het inrichten, beheren, monitoren en beveiligen van een Apache Hadoop-cluster.
Deze live training onder leiding van een instructeur in Leiden (online of ter plaatse) introduceert Hortonworks Data Platform (HDP) en leidt deelnemers door de implementatie van de Spark + Hadoop-oplossing.
Aan het einde van deze training zijn de deelnemers in staat om:
Gebruik Hortonworks om op grote schaal betrouwbaar Hadoop uit te voeren.
Integreer de beveiligings-, governance- en operationele mogelijkheden van Hadoop met de flexibele analytische workflows van Spark.
Gebruik Hortonworks om elk van de componenten in een Spark-project te onderzoeken, te valideren, te certificeren en te ondersteunen.
Verwerk verschillende soorten gegevens, waaronder gestructureerde, ongestructureerde, in-beweging en stilstaande gegevens.
In deze door een instructeur geleide, live training in Leiden (op locatie of op afstand), leren deelnemers hoe ze verschillende Stream Processing raamwerken kunnen opzetten en integreren met bestaande big data-opslagsystemen en gerelateerde softwareapplicaties en microservices.
Aan het einde van deze training kunnen deelnemers:
Installeer en configureer verschillende Stream Processing frameworks, zoals Spark Streaming en Kafka Streaming.
Begrijp en selecteer het meest geschikte raamwerk voor de taak.
Verwerken van gegevens continu, gelijktijdig en record voor record.
Integreer Stream Processing oplossingen met bestaande databases, datawarehouses, datameren, enz.
Integreer de meest geschikte bibliotheek voor streamverwerking met bedrijfsapplicaties en microservices.
Deze door een instructeur geleide, live training (op locatie of op afstand) is gericht op datawetenschappers die de SMACK-stack willen gebruiken om dataverwerkingsplatforms voor big data-oplossingen te bouwen.
Aan het einde van deze training kunnen deelnemers:
Implementeer een datapijplijnarchitectuur voor het verwerken van big data.
Ontwikkel een clusterinfrastructuur met Apache Mesos en Docker.
Analyseer gegevens met Spark en Scala.
Beheer ongestructureerde gegevens met Apache Cassandra.
Deze instructeur-geleide, live training in Leiden (op locatie of op afstand) is gericht op ingenieurs die een Apache Spark systeem willen opzetten en implementeren voor het verwerken van zeer grote hoeveelheden gegevens.
Aan het einde van deze training kunnen deelnemers:
Installeer en configureer Apache Spark.
Verwerk en analyseer snel zeer grote datasets.
Begrijp het verschil tussen Apache Spark en Hadoop MapReduce en wanneer u welke moet gebruiken.
Integreer Apache Spark met andere machine learning-tools.
Apache Spark leercurve van Apache Spark neemt in het begin langzaam toe, het kost veel inspanning om het eerste rendement te behalen. Deze cursus is bedoeld om door het eerste moeilijke gedeelte te springen. Na het volgen van deze cursus zullen de deelnemers de basisprincipes van Apache Spark begrijpen, ze zullen RDD duidelijk onderscheiden van DataFrame, ze zullen Python en Scala API leren kennen, ze zullen uitvoerders en taken begrijpen, etc. Ook volgens de best practices richt deze cursus zich sterk op cloud-implementatie, Databricks en AWS. De studenten zullen ook de verschillen begrijpen tussen AWS EMR en AWS Glue, een van de nieuwste Spark-services van AWS.
PUBLIEK:
Data Engineer, DevOps , Data Scientist
DOELSTELLING:
Deze cursus introduceert Apache Spark . De studenten leren hoe Spark past in het Big Data ecosysteem en hoe Spark gebruikt kan worden voor data-analyse. De cursus behandelt Spark shell voor interactieve gegevensanalyse, Spark internals, Spark API's, Spark SQL , Spark streaming en machine learning en graphX.
PUBLIEK :
Ontwikkelaars / gegevensanalisten
Deze live training onder leiding van een instructeur in Leiden (online of ter plaatse) is bedoeld voor datawetenschappers en -ontwikkelaars die Spark NLP, gebouwd op Apache Spark, willen gebruiken om tekstverwerkingsmodellen en pijplijnen in natuurlijke taal te ontwikkelen, implementeren en schalen.
Aan het einde van deze training zijn de deelnemers in staat om:
Zet de benodigde ontwikkelomgeving op om NLP-pijplijnen te gaan bouwen met Spark NLP.
Krijg inzicht in de functies, architectuur en voordelen van het gebruik van Spark NLP.
Gebruik de vooraf getrainde modellen die beschikbaar zijn in Spark NLP om tekstverwerking te implementeren.
Leer hoe u modellen Spark NLP bouwt, traint en schaalt voor projecten van productiekwaliteit.
Pas classificatie-, inferentie- en sentimentanalyse toe op real-world gebruiksscenario's (klinische gegevens, inzichten in klantgedrag, enz.).
Spark SQL is de module van Apache Spark voor het werken met gestructureerde en ongestructureerde gegevens. Spark SQL geeft informatie over de structuur van de gegevens en de berekeningen die worden uitgevoerd. Deze informatie kan worden gebruikt om optimalisaties uit te voeren. Twee veel voorkomende toepassingen voor Spark SQL zijn: - om SQL query's uit te voeren. - om gegevens van een bestaande Hive installatie te lezen.
In deze door een instructeur geleide, live training (op locatie of op afstand), leren deelnemers hoe ze verschillende soorten gegevenssets kunnen analyseren met Spark SQL .
Aan het einde van deze training kunnen deelnemers:
Installeer en configureer Spark SQL .
Voer gegevensanalyse uit met Spark SQL .
Query-gegevenssets in verschillende indelingen.
Visualiseer gegevens en queryresultaten.
Indeling van de cursus
Interactieve lezing en discussie.
Veel oefeningen en oefenen.
Praktische implementatie in een live-labomgeving.
Cursusaanpassingsopties
Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
MLlib is Spark's machine learning (ML) bibliotheek. Het doel is om praktische machine learning schaalbaar en eenvoudig te maken. Het bestaat uit algemene leeralgoritmen en hulpprogramma's, waaronder classificatie, regressie, clustering, collaboratieve filtering, vermindering van de dimensionaliteit, evenals optimalisatieprimitieven op een lager niveau en pijplijn-API's op een hoger niveau.
Het is verdeeld in twee pakketten:
spark.mllib bevat de originele API gebouwd bovenop RDD's.
spark.ml biedt een API op een hoger niveau gebouwd bovenop DataFrames voor het construeren van ML-pijpleidingen.
Publiek
Deze cursus is bedoeld voor ingenieurs en ontwikkelaars die een ingebouwde machinebibliotheek voor Apache Spark
Lees meer...
Laatst bijgewerkt:
Reviews (9)
Veel praktijkvoorbeelden, verschillende manieren om hetzelfde probleem aan te pakken, en soms niet zo voor de hand liggende trucs om de huidige oplossing te verbeteren
Rafal - Nordea
Cursus - Apache Spark MLlib
Automatisch vertaald
The live examples
Ahmet Bolat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Cursus - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Cursus - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Cursus - Apache Spark in the Cloud
practice tasks
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Cursus - Python and Spark for Big Data (PySpark)
The VM I liked very much
The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly
I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Cursus - Big Data Analytics in Health
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Cursus - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Richard is very calm and methodical, with an analytic insight - exactly the qualities needed to present this sort of course.
Apache Spark training cursus in Leiden, Apache Spark opleiding cursus in Leiden, Weekend Apache Spark cursus in Leiden, Avond Apache Spark training in Leiden, Spark instructeur geleid Leiden, Spark privé cursus in Leiden, Apache Spark on-site in Leiden, Weekend Spark training in Leiden, Avond Apache Spark cursus in Leiden, Apache Spark een op een training in Leiden, Spark instructeur in Leiden, Apache Spark coaching in Leiden, Spark boot camp in Leiden, Apache Spark trainer in Leiden, Spark instructeur geleid in Leiden,Apache Spark lessen in Leiden, Apache Spark op locatie in Leiden, Spark een op een opleiding in Leiden