Course Outline

spark.mllib: gegevenstypen, algoritmen en hulpprogramma's

    Gegevenstypen Basisstatistieken, samenvattende statistieken, correlaties, gestratificeerde steekproeven, hypothesetests, streaming significantietests, willekeurige gegevensgeneratie
Lineaire classificatie- en regressiemodellen (SVM's, logistische regressie, lineaire regressie)
  • naïeve Bayes
  • Beslissingsbomen
  • ensembles van bomen (Random Forests en gradiënt-versterkte bomen)
  • isotone regressie
  • Collaboratieve filtering met afwisselende kleinste kwadraten (ALS)
  • Clustering van k-middelen
  • Gaussiaans mengsel
  • power iteratie clustering (PIC)
  • latente Dirichlet-toewijzing (LDA)
  • k-middelen in tweeën delen
  • streaming k-middelen
  • Dimensionaliteitsreductie singuliere waarde-ontleding (SVD)
  • hoofdcomponentenanalyse (PCA)
  • Functie-extractie en transformatie
  • Frequente patroonmining FP-groei
  • verenigingsregels
  • VoorvoegselSpan
  • Evaluatiestatistieken
  • PMML-model exporteren
  • Optimalisatie (ontwikkelaar) stochastische gradiëntafdaling
  • BFGS met beperkt geheugen (L-BFGS)
  • spark.ml: API's op hoog niveau voor ML-pijplijnen
  • Overzicht: schatters, transformatoren en pijplijnen Extraheren, transformeren en selecteren van kenmerken Classificatie en regressie Clustering Geavanceerde onderwerpen

    Requirements

    Kennis van een van de volgende zaken:

    • Java
    • Scala
    • Python
    • SparkR.
      35 Hours
     

    Getuigenissen (8)

    Related Courses

    Related Categories