Plan Szkolenia

spark.mllib: typy danych, algorytmy i narzędzia

    Typy danych Statystyka podstawowa, statystyki podsumowujące, korelacje, próbkowanie warstwowe, testowanie hipotez, testowanie istotności strumieniowej, testowanie losowego generowania danych
Klasyfikacja i modele liniowe regresji (SVM, regresja logistyczna, regresja liniowa)
  • naiwny Bayes
  • drzewa decyzyjne
  • zespoły drzew (Random Forest i drzewa wzmocnione gradientem)
  • regresja izotoniczna
  • Wspólne filtrowanie naprzemiennie metodą najmniejszych kwadratów (ALS)
  • Grupowanie k-średnich
  • Mieszanka Gaussa
  • klastrowanie iteracji mocy (PIC)
  • ukryta alokacja Dirichleta (LDA)
  • dwudzielne k-średnie
  • przesyłanie strumieniowe k-średnich
  • Redukcja wymiarów Rozkład wartości osobliwych (SVD)
  • analiza głównych składowych (PCA)
  • Ekstrakcja i transformacja cech
  • Częste eksplorowanie wzorców Wzrost FP
  • zasady stowarzyszenia
  • Rozpiętość przedrostka
  • Metryki oceny
  • Eksport modelu PMML
  • Optymalizacja (programista) stochastyczne opadanie gradientu
  • BFGS z ograniczoną pamięcią (L-BFGS)
  • spark.ml: interfejsy API wysokiego poziomu dla potoków ML
  • Przegląd: estymatory, transformatory i rurociągi Wyodrębnianie, przekształcanie i wybieranie cech Klasyfikacja i regresja Klastrowanie Tematy zaawansowane

    Wymagania

    Znajomość jednego z poniższych:

    • Java
    • Scala
    • Python
    • SparkR
     35 godzin

    Liczba uczestników


    Cena za uczestnika (netto)

    Opinie uczestników (1)

    Nadchodzące szkolenia