Cursusaanbod
Machine Learning Inleiding
- Soorten machine learning – begeleid vs onbegeleid
- Van statistische leer naar machine learning
- Het data-miningproces: bedrijfsbegrip, gegevensvoorbereiding, modelleren, implementatie
- Het kiezen van de juiste algoritme voor de taak
- Overfitting en de bias-variantiecompromis
Python en overzicht van ML-bibliotheken
- Waarom programmeertalen gebruiken voor ML
- Kiezen tussen R en Python
- Python snelle cursus en Jupyter Notebooks
- Python bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testen en evalueren van ML-algoritmen
- Generalisatie, overfitting en modelvalidatie
- Evaluatiestrategieën: holdout, cross-validatie, bootstrapping
- Metriken voor regressie: ME, MSE, RMSE, MAPE
- Metriken voor classificatie: nauwkeurigheid, verwarringsmatrix, ongebalanceerde klassen
- Visualisatie van modelprestaties: winstcurve, ROC-curve, lift-curve
- Modelselectie en grid search voor afstemming
Gegevensvoorbereiding
- Importeren en opslaan van gegevens in Python
- Exploratieve analyse en samenvattende statistieken
- Omgaan met ontbrekende waarden en uitbijters
- Standaardisatie, normalisatie en transformatie
- Qualitatieve gegevensrecodering en gegevensmanipulatie met pandas
Classificatie-algoritmen
- Binaire vs multiclass classificatie
- Logistische regressie en discriminerende functies
- Naïve Bayes, k-nearest neighbors
- Beslissingsbomen: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines en kernels
- Ensemble learning technieken
Regressie en numerieke voorspelling
- Kwadratenmethode en variabeleselectie
- Regularisatiemethoden: L1, L2
- Polynomiale regressie en niet-lineaire modellen
- Regressiebomen en splines
Unsupervised Learning
- Clustertechnieken: k-means, k-medoids, hiërarchisch clustering, SOMs
- Dimensionaliteitreductie: PCA, factoranalyse, SVD
- Multidimensionale schaling
Tekstmijnbouw
- Tekstvoorbewerking en tokenisatie
- Bag-of-words, stemming en lemmatisering
- Sentimentanalyse en woordfrequentie
- Visualiseren van tekstgegevens met woordwolken
Aanbevelingssystemen
- Gebruikergebaseerde en itemgebaseerde samenwerkende filteren
- Ontwerpen en evalueren van aanbevelingsmotoren
Patroonmijnbouw voor associaties
- Veilige itemsets en Apriori-algoritme
- Market basket analyse en lift-verhouding
Afwijkingsdetectie
- Extreme waardeanalyse
- Afstandsgebaseerde en dichtheidsgebaseerde methoden
- Afwijkingsdetectie in hoog-dimensionale gegevens
Machine Learning Casusstudie
- Begrijpen van het bedrijfsprobleem
- Gegevensvoorbewerking en feature engineering
- Modelselectie en parameterafstemming
- Evaluatie en presentatie van bevindingen
- Implementatie
Samenvatting en volgende stappen
Vereisten
- Basisbegrip van statistiek en lineaire algebra
- Kennis van data-analyse of business intelligence concepten
- Enige ervaring met programmeren (vooral Python of R) is aanbevolen
- Interesse in het leren van toegepaste machine learning voor data-gestuurde projecten
Publiek
- Data-analyse en wetenschappers
- Statistici en onderzoekers
- Ontwikkelaars en IT-professionals die machine learning tools verkennen
- Iedereen betrokken bij data science of voorspellende analytische projecten
Leveringsopties
PRIVÉGROEPSTRAINING
Onze identiteit draait om het leveren van precies wat onze klanten nodig hebben.
- Pre-cursusgesprek met uw trainer
- Aanpassing van de leerervaring om uw doelen te bereiken -
- Op maat gemaakte overzichten
- Praktische, praktische oefeningen met gegevens / scenario's die herkenbaar zijn voor de cursisten
- Training gepland op een datum naar keuze
- Gegeven online, op locatie/klaslokaal of hybride door experts die ervaring uit de echte wereld delen
Private Group Prices RRP from €6840 online delivery, based on a group of 2 delegates, €2160 per additional delegate (excludes any certification / exam costs). We recommend a maximum group size of 12 for most learning events.
Neem contact met ons op voor een exacte offerte en om onze laatste promoties te horen
OPENBARE TRAINING
Kijk op onze public courses