Plan Szkolenia

Statistics i probabilistyczne Programming w Julia

Podstawowe statystyki

  • Statistics
    • Podsumowanie Statistics z pakietem statystyk
  • Rozkłady i pakiet StatsBase
    • Jednowymiarowe i wielowymiarowe
    • Momenty
    • Funkcje prawdopodobieństwa
    • Próbkowanie i RNG
    • Histogramy
    • Szacowanie metodą największej wiarygodności
    • Rozkład iloczynowy, trucjalny i cenzurowany
    • Statystyka odporna
    • Korelacja i kowariancja

DataFrames

(Pakiet DataFrames)

  • Dane we/wy
  • Tworzenie ramek danych
  • Typy danych, w tym dane kategoryczne i brakujące dane
  • Sortowanie i łączenie
  • Przekształcanie i przestawianie danych

Testowanie hipotez

(Pakiet HypothesisTests)

  • Główny zarys testowania hipotez
  • Test Chi-kwadrat
  • Test z i test t
  • Test F
  • Test dokładny Fishera
  • ANOVA
  • Testy normalności
  • Test Kołmogorowa-Smirnowa
  • Test T Hotellinga

Analiza regresji i przeżycia

(Pakiety GLM i Survival)

  • Główny zarys regresji liniowej i rodziny wykładniczej
  • Regresja liniowa
  • Uogólnione modele liniowe
    • Regresja logistyczna
    • Regresja Poissona
    • Regresja gamma
    • Inne modele GLM
  • Analiza przeżycia
    • Zdarzenia
    • Kaplan-Meier
    • Nelson-Aalen
    • Proporcjonalne zagrożenie Coxa

Odległości

(Pakiet Odległości)

  • Co to jest odległość?
  • Euklidesowa
  • Cityblock
  • Cosinus
  • Korelacja
  • Mahalanobis
  • Hamming
  • MAD
  • RMS
  • Odchylenie średniokwadratowe

Statystyki wielowymiarowe

(pakiety MultivariateStats, Lasso i Loess)

  • Regresja grzbietowa
  • Regresja Lasso
  • Loess
  • Liniowa analiza dyskryminacyjna
  • Analiza głównych składowych (PCA)
    • Liniowa PCA
    • Kernel PCA
    • Probabilistyczna PCA
    • Niezależna CA
  • Regresja głównych składowych (PCR)
  • Analiza czynnikowa
  • Analiza korelacji kanonicznej
  • Skalowanie wielowymiarowe

Klasteryzacja

(Pakiet klastrowania)

  • K-średnich
  • K-medoidy
  • DBSCAN
  • Klastrowanie hierarchiczne
  • Algorytm klastrów Markowa
  • Klastrowanie rozmyte C-średnich

Bayesian Statistics & Probabilistic Programming

(pakiet Turinga)

  • Łańcuch Markowa Model Carlo
  • Hamiltonian Montel Carlo
  • Gaussowskie modele mieszane
  • Liniowa regresja Bayesa
  • Rodzina regresji wykładniczej Bayesa
  • Bayesian Neural Networks
  • Ukryte modele Markowa
  • Filtrowanie cząstek
  • Wnioskowanie wariacyjne

Wymagania

Ten kurs jest przeznaczony dla osób, które mają już doświadczenie w nauce o danych i statystyce.

 21 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie