From Data to Decision with Big Data and Predictive Analytics Training Cursus
Publiek
Als u de gegevens waartoe u toegang heeft, wilt begrijpen of ongestructureerde gegevens op het internet wilt analyseren (zoals Twitter, Linked in, enz ...), is deze cursus iets voor u.
Het is vooral bedoeld voor besluitvormers en mensen die moeten kiezen welke gegevens het verzamelen waard zijn en wat het analyseren waard is.
Het is niet gericht op mensen die de oplossing configureren, die mensen zullen echter profiteren van het grote geheel.
Bezorgingsmodus
Tijdens de cursus krijgen de deelnemers werkvoorbeelden van voornamelijk open source-technologieën.
Korte lezingen worden gevolgd door een presentatie en eenvoudige oefeningen door de deelnemers
Gebruikte inhoud en software
Alle gebruikte software wordt elke keer dat de cursus wordt uitgevoerd bijgewerkt, dus we controleren de nieuwste versies mogelijk.
Het omvat het proces van het verkrijgen, formatteren, verwerken en analyseren van de gegevens, om uit te leggen hoe het besluitvormingsproces kan worden geautomatiseerd met machine learning.
Course Outline
Snel overzicht
- Gegevensbronnen
- Gegevens in de gaten houden
- Aanbevelingssystemen
- Doel Marketing
Datatypes
- Gestructureerd versus ongestructureerd
- Statisch versus gestreamd
- Attitude-, gedrags- en demografische gegevens
- Datagestuurde versus gebruikersgestuurde analyses
- Geldigheid van de gegevens
- Volume, snelheid en verscheidenheid aan gegevens
Modellen
- Modellen bouwen
- Statistische modellen
- Machinaal leren
Classificatie van gegevens
- Clustering
- kGroepen, k-betekent, de naaste buren
- Mierenkolonies, vogels die massaal toestromen
Voorspellende modellen
- Beslisbomen
- Ondersteuning vectormachine
- Naïeve Bayes-classificatie
- Neurale netwerken
- Markov Model
- Regressie
- Ensemble methoden
ROI
- Kosten-batenverhouding
- Kosten van software
- Kosten van ontwikkeling
- Potentiële voordelen
Modellen bouwen
- Voorbereiding van gegevens (MapReduce)
- Gegevens opschonen
- Methoden kiezen
- Model ontwikkelen
- Model testen
- Evaluatie van het model
- Implementatie en integratie van modellen
Overzicht van Open Source en commerciële software
- Selectie R-projectpakket
- Python Bibliotheken
- Hadoop en Mahout
- Geselecteerde Apache-projecten met betrekking tot Big Data en Analytics
- Geselecteerde commerciële oplossing
- Integratie met bestaande software en databronnen
Requirements
Inzicht in traditionele databeheer- en analysemethoden zoals SQL, datawarehouses, business intelligence, OLAP, enz... Inzicht in basisstatistieken en waarschijnlijkheid (gemiddelde, variantie, waarschijnlijkheid, voorwaardelijke waarschijnlijkheid, enz...)
Need help picking the right course?
From Data to Decision with Big Data and Predictive Analytics Training Cursus - Booking
From Data to Decision with Big Data and Predictive Analytics Training Cursus - Enquiry
From Data to Decision with Big Data and Predictive Analytics - Consultancy Enquiry
Reviews (2)
De inhoud, want ik vond het erg interessant en denk dat het me zou helpen in mijn laatste jaar aan de universiteit.
Krishan - NBrown Group
Cursus - From Data to Decision with Big Data and Predictive Analytics
Machine Translated
Richard's training style kept it interesting, the real world examples used helped to drive the concepts home.
Jamie Martin-Royle - NBrown Group
Cursus - From Data to Decision with Big Data and Predictive Analytics
Upcoming Courses
Related Courses
Predictive AI in DevOps: Enhancing Software Delivery
14 HoursDeze live training onder leiding van een instructeur in Nederland (online of op locatie) is bedoeld voor professionals van gemiddeld niveau DevOps die voorspellende AI willen integreren in hun DevOps praktijken.
Aan het einde van deze training zijn de deelnemers in staat om:
- Implementeer voorspellende analysemodellen om uitdagingen in de DevOps-pijplijn te voorspellen en op te lossen.
- Gebruik AI-gestuurde tools voor verbeterde monitoring en operaties.
- Pas machine learning-technieken toe om workflows voor softwarelevering te verbeteren.
- Ontwerp AI-strategieën voor proactieve probleemoplossing en -optimalisatie.
- Navigeer door de ethische overwegingen van het gebruik van AI in DevOps.
Introduction to Predictive AI
21 HoursDeze live training onder leiding van een instructeur in Nederland (online of op locatie) is bedoeld voor IT-professionals op beginnersniveau die de basisprincipes van voorspellende AI willen begrijpen.
Aan het einde van deze training zijn de deelnemers in staat om:
- Begrijp de kernconcepten van voorspellende AI en de toepassingen ervan.
- Verzamel, schoon ze op en verwerk gegevens voor voorspellende analyse.
- Verken en visualiseer gegevens om inzichten te ontdekken.
- Bouw statistische basismodellen om voorspellingen te doen.
- Evalueer de prestaties van voorspellende modellen.
- Pas voorspellende AI-concepten toe op scenario's uit de echte wereld.
Data Vault: Building a Scalable Data Warehouse
28 HoursIn deze door een instructeur geleide, live training leren deelnemers hoe ze een Data Vault kunnen bouwen.
Aan het einde van deze training kunnen deelnemers:
- Begrijp de architectuur- en ontwerpconcepten achter Data Vault 2.0 en de interactie ervan met Big Data, NoSQL en AI.
- Gebruik datakluistechnieken om auditing, tracering en inspectie van historische gegevens in een datawarehouse mogelijk te maken.
- Ontwikkel een consistent en herhaalbaar ETL-proces (Extract, Transform, Load).
- Bouw en implementeer zeer schaalbare en herhaalbare magazijnen.
Spark Streaming with Python and Kafka
7 HoursDeze door een instructeur geleide, live training (op locatie of op afstand) is gericht op data-ingenieurs, datawetenschappers en programmeurs die Spark Streaming functies willen gebruiken bij het verwerken en analyseren van realtime gegevens.
Aan het einde van deze training kunnen deelnemers Spark Streaming gebruiken om live datastromen te verwerken voor gebruik in databases, bestandssystemen en live dashboards.
Confluent KSQL
7 HoursDeze instructeur-geleide, live training in Nederland (op locatie of op afstand) is gericht op ontwikkelaars die Apache Kafka streamverwerking willen implementeren zonder code te schrijven.
Aan het einde van deze training kunnen deelnemers:
- Installeer en configureer Confluent KSQL.
- Zet een streamverwerkingspijplijn op met alleen SQL-opdrachten (geen Java- of Python-codering).
- Voer datafiltering, transformaties, aggregaties, joins, windowing en sessionization volledig in SQL uit.
- Ontwerp en implementeer interactieve, continue queries voor het streamen van ETL en realtime analyses.
Apache Ignite for Developers
14 HoursDeze door een instructeur geleide, live training in Nederland (op locatie of op afstand) is gericht op ontwikkelaars die de principes achter persistente en pure in-memory opslag willen leren terwijl ze de stap zetten naar het maken van een voorbeeld van een in-memory computing-project.
Aan het einde van deze training kunnen deelnemers:
- Gebruik Ignite voor persistentie in het geheugen, op schijf en voor een puur gedistribueerde database in het geheugen. Bereik persistentie zonder gegevens terug te synchroniseren naar een relationele database. Gebruik Ignite om SQL en gedistribueerde joins uit te voeren. Verbeter de prestaties door gegevens dichter bij de CPU te plaatsen en RAM als opslag te gebruiken. Verspreid datasets over een cluster om horizontale schaalbaarheid te bereiken. Integreer Ignite met RDBMS-, NoSQL-, Hadoop- en machine learning-processors.
Unified Batch and Stream Processing with Apache Beam
14 HoursApache Apex: Processing Big Data-in-Motion
21 HoursApache Storm
28 HoursApache Storm is een gedistribueerde, real-time computing engine gebruikt om real-time business intelligence te vergemakkelijken. Dit gebeurt door toepassingen in staat te stellen onbeperkte gegevensstromen betrouwbaar te verwerken (bv. de stroomverwerking).
"Storm is voor real-time verwerking wat Hadoop is voor batch verwerking!"
In deze instructeur geleide live training zullen de deelnemers leren hoe te installeren en configureren Apache Storm, vervolgens een Apache Storm applicatie ontwikkelen en implementeren voor het verwerken van grote gegevens in real-time.
Enkele van de onderwerpen die in deze training zijn opgenomen, zijn:
- Apache Storm in de context van Hadoop
- Werken met onbeperkte gegevens
- voortdurende berekening
- Realtime analyse
- Distribueerde RPC en ETL verwerking
Vraag deze cursus nu!
Het publiek
- Software en ETL ontwikkelaars
- Mainframe professionals
- Data wetenschappers
- Big data analisten
- [ 1 ] Professionals
Format van de cursus
- Deel lezing, deel discussie, oefeningen en zware praktijken
Apache NiFi for Administrators
21 HoursIn deze door een instructeur geleide, live training in Nederland (op locatie of op afstand), leren deelnemers hoe ze Apache NiFi kunnen implementeren en beheren in een live labomgeving.
Aan het einde van deze training kunnen deelnemers:
- Installeer en configureer Apachi NiFi.
- Verzamel, transformeer en beheer gegevens uit ongelijksoortige, gedistribueerde gegevensbronnen, waaronder databases en big data-meren.
- Automatiseer gegevensstromen.
- Schakel streaminganalyse in.
- Pas verschillende benaderingen toe voor gegevensopname.
- Transformeer Big Data en naar zakelijke inzichten.
Apache NiFi for Developers
7 HoursIn deze door een instructeur geleide, live training leren deelnemers de basisprincipes van flow-gebaseerd programmeren terwijl ze een aantal demo-extensies, componenten en processors ontwikkelen met behulp van Apache NiFi.
Aan het einde van deze training kunnen deelnemers:
- Begrijp de architectuur- en datastroomconcepten van NiFi.
- Ontwikkel extensies met behulp van NiFi en API's van derden.
- Op maat ontwikkelen van hun eigen Apache Nifi-processor.
- Neem realtime gegevens op uit ongelijksoortige en ongebruikelijke bestandsformaten en gegevensbronnen en verwerk deze.
Apache Flink Fundamentals
28 HoursDeze door een instructeur geleide, live training (op locatie) introduceert de principes en benaderingen achter gedistribueerde stream- en batchgegevensverwerking, en begeleidt deelnemers bij het creëren van een realtime datastreamingapplicatie in Apache Flink.
Aan het einde van deze training kunnen deelnemers:
- Zet een omgeving op voor het ontwikkelen van data-analyseapplicaties. Begrijp hoe de grafiekverwerkingsbibliotheek van Apache Flink (Gelly) werkt. Pakket, voer uit en bewaak Flink-gebaseerde, fouttolerante datastreaming-applicaties. Beheer diverse werklasten. Voer geavanceerde analyses uit. Stel een Flink-cluster met meerdere knooppunten in. Meet en optimaliseer prestaties. Integreer Flink met verschillende Big Data systemen. Vergelijk de mogelijkheden van Flink met die van andere raamwerken voor big data-verwerking.
Python and Spark for Big Data (PySpark)
21 HoursIn deze door een instructeur geleide, live training leren deelnemers hoe ze Python en Spark samen kunnen gebruiken om big data te analyseren terwijl ze aan praktische oefeningen werken.
Aan het einde van deze training kunnen deelnemers:
- Leer hoe u Spark met Python kunt gebruiken om Big Data te analyseren.
- Werk aan oefeningen die praktijkgevallen nabootsen.
- Gebruik verschillende tools en technieken voor big data-analyse met PySpark.
Introduction to Graph Computing
28 HoursIn deze door een instructeur geleide, live training leren deelnemers over het technologieaanbod en de implementatiebenaderingen voor het verwerken van grafiekgegevens. Het doel is om objecten uit de echte wereld, hun kenmerken en relaties te identificeren, deze relaties vervolgens te modelleren en ze als gegevens te verwerken met behulp van een Graph Computing (ook bekend als Graph Analytics) aanpak. We beginnen met een breed overzicht en beperken ons tot specifieke tools terwijl we een reeks casestudies, praktische oefeningen en live implementaties doorlopen.
Aan het einde van deze training kunnen deelnemers:
- Begrijp hoe grafiekgegevens worden bewaard en doorlopen.
- Selecteer het beste raamwerk voor een bepaalde taak (van grafische databases tot raamwerken voor batchverwerking).
- Implementeer Hadoop, Spark, GraphX en Pregel om graph computing parallel uit te voeren op veel machines.
- Bekijk big data-problemen uit de echte wereld in termen van grafieken, processen en traversals.
Apache Spark MLlib
35 HoursMLlib is Spark's machine learning (ML) bibliotheek. Het doel is om praktische machine learning schaalbaar en eenvoudig te maken. Het bestaat uit algemene leeralgoritmen en hulpprogramma's, waaronder classificatie, regressie, clustering, collaboratieve filtering, vermindering van de dimensionaliteit, evenals optimalisatieprimitieven op een lager niveau en pijplijn-API's op een hoger niveau.
Het is verdeeld in twee pakketten:
spark.mllib bevat de originele API gebouwd bovenop RDD's.
spark.ml biedt een API op een hoger niveau gebouwd bovenop DataFrames voor het construeren van ML-pijpleidingen.
Publiek
Deze cursus is bedoeld voor ingenieurs en ontwikkelaars die een ingebouwde machinebibliotheek voor Apache Spark