Bądźmy w kontakcie

Plan Szkolenia

I. Wprowadzenie i przygotowanie

1. Przegląd

  • Ułatwienie pracy z R, R i dostępne GUI
  • Rstudio
  • Powiązane oprogramowanie i dokumentacja
  • R i statystyka
  • Interaktywne korzystanie z R
  • Sesja wprowadzająca
  • Uzyskiwanie pomocy dotyczącej funkcji i funkcjonalności
  • Polecenia R, wrażliwość na wielkość liter itp.
  • Przypominanie i korygowanie poprzednich poleceń
  • Wykonywanie poleceń z pliku lub przekierowanie wyników do pliku
  • Trwałość danych i usuwanie obiektów
  • Dobre praktyki programistyczne: Samodzielne skrypty, dobra czytelność, np. strukturyzowane skrypty, dokumentacja, markdown
  • Instalowanie pakietów; CRAN i Bioconductor

2. Wczytywanie danych

  • Pliki tekstowe (read.delim)
  • Pliki CSV

3. Proste operacje; liczby i wektory + tablice

  • Wektory i przypisanie
  • Arytmetyka wektorowa
  • Generowanie regularnych sekwencji
  • Wektory logiczne
  • Brakujące wartości
  • Wektory znakowe
  • Wektory indeksowe; wybieranie i modyfikowanie podzbiorów danych
    • Tablice
  • Indeksowanie tablic. Podsekcje tablic
  • Macierze indeksowe
  • Funkcja array() + proste operacje na tablicach, np. mnożenie, transpozycja
  • Inne typy obiektów

4. Listy i ramki danych

  • Listy
  • Tworzenie i modyfikowanie list
    • Łączenie list
  • Ramki danych
    • Tworzenie ramek danych
    • Praca z ramkami danych
    • Dołączanie dowolnych list
    • Zarządzanie ścieżką wyszukiwania

5. Manipulacja danymi

  • Wybór, podział obserwacji i zmiennych
  • Filtrowanie, grupowanie
  • Rekodowanie, transformacje
  • Agregacja, łączenie zbiorów danych
  • Tworzenie macierzy podzielonych, cbind() i rbind()
  • Funkcja łączenia (), z tablicami
  • Manipulacja znakami, pakiet stringr
  • Krótkie wprowadzenie do grep i regexpr

6. Więcej o wczytywaniu danych

  • Pliki XLS, XLSX
  • Pakiety readr i readxl
  • Dane w formatach SPSS, SAS, Stata,… i innych
  • Eksportowanie danych do formatów txt, csv i innych

6. Grupowanie, pętle i wykonanie warunkowe

  • Wyrażenia grupowe
  • Instrukcje sterujące
  • Wykonanie warunkowe: instrukcje if
  • Powtarzanie wykonania: pętle for, repeat i while
  • Wprowadzenie do apply, lapply, sapply, tapply

7. Funkcje

  • Tworzenie funkcji
  • Argumenty opcjonalne i wartości domyślne
  • Zmienna liczba argumentów
  • Zakres i jego konsekwencje

8. Prosta grafika w R

  • Tworzenie wykresu
  • Wykresy gęstości
  • Wykresy punktowe
  • Wykresy słupkowe
  • Wykresy liniowe
  • Wykresy kołowe
  • Wykresy pudełkowe
  • Wykresy rozrzutu
  • Łączenie wykresów

II. Analiza statystyczna w R

1. Rozkłady prawdopodobieństwa

  • R jako zbiór tabel statystycznych
  • Badanie rozkładu zbioru danych

2. Testowanie hipotez

  • Testy dotyczące średniej populacji
  • Test ilorazu wiarygodności
  • Testy jednej i dwóch próbek
  • Test zgodności chi-kwadrat
  • Statystyka jednej próby Kołmogorowa-Smirnowa
  • Test Wilcoxona dla par
  • Test dwóch próbek
  • Test sumy rang Wilcoxona
  • Test Manna-Whitneya
  • Test Kołmogorowa-Smirnowa

3. Wielokrotne testowanie hipotez

  • Błąd typu I i FDR
  • Krzywe ROC i AUC
  • Procedury wielokrotnego testowania (BH, Bonferroni itp.)

4. Modele regresji liniowej

  • Funkcje ogólne do ekstrakcji informacji o modelu
  • Aktualizacja dopasowanych modeli
  • Modele liniowe uogólnione
    • Rodziny
    • Funkcja glm()
  • Klasyfikacja
    • Regresja logistyczna
    • Analiza dyskryminacyjna liniowa
  • Uczenie nienadzorowane
    • Analiza głównych składowych
    • Metody grupowania (k-średnie, grupowanie hierarchiczne, k-medoidy)

5. Analiza przeżycia (pakiet survival)

  • Obiekty przeżycia w R
  • Estymator Kaplana-Meiera, test log-rank, regresja parametryczna
  • Pasy ufności
  • Analiza danych cenzurowanych (cenzurowanych przedziałowo)
  • Modele Cox PH, stałe kowarianty
  • Modele Cox PH, kowarianty zależne od czasu
  • Symulacja: Porównanie modeli (Porównywanie modeli regresji)

6. Analiza wariancji

  • Jednoczynnikowa ANOVA
  • Dwuczynnikowa klasyfikacja ANOVA
  • MANOVA

III. Przykłady problemów w bioinformatyce

  • Krótkie wprowadzenie do pakietu limma
  • Przepływ pracy analizy danych mikromacierzowych
  • Pobieranie danych z GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Przetwarzanie danych (kontrola jakości, normalizacja, ekspresja różnicowa)
  • Wykres wulkaniczny
  • Przykłady grupowania + mapy cieplne
 28 godzin

Liczba uczestników


Cena za uczestnika (netto)

Opinie uczestników (2)

Propozycje terminów

Powiązane Kategorie