Course Outline
Gegevensvoorverwerking Data Cleaning Gegevensintegratie en -transformatie Gegevensreductie Discretisatie en generatie van concepthiërarchie
Statistische gevolgtrekking Kansverdelingen, willekeurige variabelen, centrale limietstelling
BemonsteringBetrouwbaarheidsintervallenStatistische gevolgtrekkingHypothese testenMultivariate lineaire regressiespecificatieSubsetselectie
SchattingGeldigmakingVoorspellingClassificatiemethoden Logistieke regressieLineaire discriminantanalyseK-dichtstbijzijnde buren
Naïeve BayesVergelijking van classificatiemethodenNeural Networks Het aanpassen van neurale netwerkenProblemen met neurale netwerken trainenBeslisbomen RegressiebomenClassificatie bomen
Bomen versus lineaire modellenOpzakken, Random Forests, Oppakken stimulerenRandom Forests
StimulerenOndersteuning van vectormachines en flexibele disct-classificatie voor maximale margesOndersteuning van vectorclassificatorenOndersteuning van vectormachines
2 en meer klassen SVM'sRelatie met logistische regressieAnalyse van hoofdcomponentenClustering K-betekent clustering
K-medoïden clusterenHiërarchische clusteringOp dichtheid gebaseerde clusteringModelbeoordeling en selectiebias, variantie en modelcomplexiteitVoorspelfout in de steekproefDe Bayesiaanse benadering
KruisvalidatieBootstrap methoden