Plan Szkolenia

Statystyka Statistics prawdopodobieństwa Programming w Julia

Podstawowa statystyka

  • Statistics
    • Podsumowanie Statistics z pakietem statystycznym
  • Rozkłady & StatsBase package
    • Jednowymiarowe i wielowymiarowe
    • Momenty
    • Funkcje prawdopodobieństwa
    • Probabilistyczne próbkowanie i generatory liczb losowych
    • Histogramy
    • Metoda największej wiarygodności
    • Rozkład produktu, truncacji i cenzury
    • Statystyka odporna
    • Korelacja i kowariancja

Ramki danych

(Pakiet DataFrames)

  • Wejście/wyjście danych
  • Tworzenie ram danych
  • Typy danych, w tym kategoryczne i braki danych
  • Sortowanie i łączenie
  • Zmiana kształtu i przekształcanie danych

Testowanie hipotez

(Pakiet HypothesisTests)

  • Podstawowa koncepcja testowania hipotez
  • Test chi-kwadrat
  • Test z i t
  • Test F
  • Test Fishera
  • ANOVA
  • Testy normalności
  • Test Kolmogorowa-Smirnowa
  • Test Hotellinga

Regresja i analiza przeżycia

(Pakiety GLM & Survival)

  • Podstawowa koncepcja regresji liniowej i rodzin ekspozycyjnych
  • Regresja liniowa
  • Modele regresji liniowej generalnej
    • Regresja logistyczna
    • Regresja Poissona
    • Regresja Gamma
    • Inne modele GLM
  • Analiza przeżycia
    • Wydarzenia
    • Kaplan-Meier
    • Nelson-Aalen
    • Model Coxa

Odległości

(Pakiet Distances)

  • Co to jest odległość?
  • Euklidesowa
  • Cityblock
  • Cosine
  • Korelacja
  • Mahalanobisa
  • Hamminga
  • MAD
  • RMS
  • Średnie kwadratowe odchylenia

Statystyka wielowymiarowa

(Pakiety MultivariateStats, Lasso & Loess)

  • Regresja Ridge
  • Regresja Lasso
  • Loess
  • Analiza dyskryminacyjna liniowa
  • Analiza głównej składnika (PCA)
    • Liniowa PCA
    • Kernel PCA
    • Probabilistyczna PCA
    • Niezawisła CA
  • Regresja głównych składników (PCR)
  • Analiza czynnikowa
  • Analiza korelacji kanonicznej
  • Skalowanie wielowymiarowe

Klasteryzacja

(Pakiet Clustering)

  • K-means
  • K-medoidy
  • DBSCAN
  • Klasteryzacja hierarchiczna
  • Algorytm Markov Cluster
  • Klasteryzacja Fuzzy C-means

Bayesowski Statistics & prawdopodobieństwo Programming

(Pakiet Turing)

  • Markov Chain Model Carlo
  • Hamiltonian Monte Carlo
  • Modele mieszanki gausowskiej
  • Bayesowska regresja liniowa
  • Bayesowska regresja rodziny eksponencjalnej
  • Bayesowski Neural Networks
  • Ukryte modele Markowa
  • Filtrowanie cząstkowe
  • Inferencja wariacyjna

Wymagania

Ten kurs jest przeznaczony dla osób, które już mają doświadczenie w dziedzinie nauki o danych i statystyki.

 21 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie