Plan Szkolenia

Statystyka i programowanie probabilistyczne w Julia

Podstawowa statystyka

  • Statystyka
    • Statystyki podsumowujące z pakietu statistics
  • Rozkłady i pakiet StatsBase
    • Jednowymiarowe i wielowymiarowe
    • Momenty
    • Funkcje prawdopodobieństwa
    • Próbkowanie i RNG (Random Number Generator)
    • Histogramy
    • Estymacja największej wiarygodności
    • Produkt, obcięcie i cenzurowane rozkłady
    • Statystyka odporna
    • Korelacja i kowariancja

DataFrames

(Pakiet DataFrames)

  • Import i eksport danych
  • Tworzenie ramki danych
  • Typy danych, w tym kategoryczne i brakujące dane
  • Sortowanie i łączenie
  • Reshape i przekształcanie danych

Testy hipotezowe

(Pakiet HypothesisTests)

  • Zasady testów hipotezowych
  • Test Chi-kwadrat
  • Test z i t
  • Test F
  • Dokładny test Fishera
  • ANOVA (Analiza wariancji)
  • Testy normalności
  • Test Kolmogorova-Smirnova
  • Test Hotellinga T-kwadrat

Regresja i analiza przeżycia

(Pakiety GLM i Survival)

  • Zasady regresji liniowej i rodziny wykładniczej
  • Regresja liniowa
  • Modele liniowe uogólnione (GLM)
    • Regresja logistyczna
    • Regresja Poissona
    • Regresja gamma
    • Inne modele GLM
  • Analiza przeżycia
    • Zdarzenia
    • Kaplan-Meier
    • Nelson-Aalen
    • Model Cox'a proporcjonalnego zagrożenia

Odległości

(Pakiet Distances)

  • Co to jest odległość?
  • Euklidesowa
  • Cityblock (Manhattan)
  • Cosinusowa
  • Korelacyjna
  • Mahalanobisa
  • Hamminga
  • MAD (Średnia odchylenie medianowe)
  • RMS (Skuteczna wartość średnia)
  • Średnie kwadratowe odchylenia

Statystyka wielowymiarowa

(Pakiety MultivariateStats, Lasso i Loess)

  • Regresja grzbietowa (ridge regression)
  • Regresja lasso
  • Loess
  • Analiza dyskryminacyjna liniowa (LDA)
  • Analiza głównych składowych (PCA)
    • Liniowa PCA
    • Kernel PCA
    • Probabilistyczna PCA
    • Niezależna analiza składowych (ICA)
  • Regresja głównych składowych (PCR)
  • Analiza czynnikowa
  • Kanoniczna analiza korelacji
  • Skalowanie wielowymiarowe (MDS)

Klasterowanie

(Pakiet Clustering)

  • K-means
  • K-medoids
  • DBSCAN
  • Klasterowanie hierarchiczne
  • Algorytm klasterowania Markova (MCL)
  • Rozmyte klasterowanie C-means

Statystyka bayesowska i programowanie probabilistyczne

(Pakiet Turing)

  • Model łańcuchów Markova Monte Carlo (MCMC)
  • Hamiltonian MCMC
  • Modele mieszane gaussowskie (GMM)
  • Bayesowska regresja liniowa
  • Bayesowska regresja rodziny wykładniczej
  • Bayesowskie sieci neuronowe
  • Modele Markova ukryte (HMM)
  • Filtry cząsteczkowe
  • Wnioskowanie wariacyjne

Wymagania

Ten kurs jest przeznaczony dla osób, które mają już podstawową znajomość nauki o danych i statystyki.

 21 godzin

Liczba uczestników


Cena za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie