Plan Szkolenia

Dzień 1

Wprowadzenie i podstawy

  • Uprzyjemnienie pracy z R, R i dostępne interfejsy graficzne
  • Rstudio
  • Powiązane oprogramowanie i dokumentacja
  • R i statystyka
  • Interaktywne korzystanie z R
  • Sesja wprowadzająca
  • Uzyskiwanie pomocy dotyczącej funkcji i funkcjonalności
  • Polecenia R, wrażliwość na wielkość liter itp.
  • Przypominanie i korygowanie poprzednich poleceń
  • Wykonywanie poleceń z pliku lub przekierowanie wyjścia do pliku
  • Trwałość danych i usuwanie obiektów

Proste operacje; liczby i wektory

  • Wektory i przypisanie
  • Arytmetyka wektorowa
  • Generowanie regularnych sekwencji
  • Wektory logiczne
  • Brakujące wartości
  • Wektory znakowe
  • Wektory indeksowe; wybór i modyfikacja podzbiorów danych
  • Inne typy obiektów

Obiekty, ich typy i atrybuty

  • Wewnętrzne atrybuty: typ i długość
  • Zmiana długości obiektu
  • Pobieranie i ustawianie atrybutów
  • Klasa obiektu

Czynniki uporządkowane i nieuporządkowane

  • Konkretny przykład
  • Funkcja tapply() i nieregularne tablice
  • Czynniki uporządkowane

Tablice i macierze

  • Tablice
  • Indeksowanie tablic. Podsekcje tablic
  • Macierze indeksowe
  • Funkcja array()
    • Mieszana arytmetyka wektorowa i tablicowa. Zasada recyklingu
  • Iloczyn zewnętrzny dwóch tablic
  • Uogólniona transpozycja tablicy
  • Funkcjonalności macierzowe
    • Mnożenie macierzy
    • Równania liniowe i odwracanie
    • Wartości własne i wektory własne
    • Rozkład wartości osobliwych i wyznaczniki
    • Dopasowanie metodą najmniejszych kwadratów i rozkład QR
  • Tworzenie macierzy podzielonych, cbind() i rbind()
  • Funkcja konkatenacji, (), z tablicami
  • Tablice częstości z czynników

Dzień 2

Listy i ramki danych

  • Listy
  • Tworzenie i modyfikowanie list
    • Łączenie list
  • Ramki danych
    • Tworzenie ramek danych
    • attach() i detach()
    • Praca z ramkami danych
    • Dołączanie dowolnych list
    • Zarządzanie ścieżką wyszukiwania

Manipulacja danymi

  • Wybór, podzbiory obserwacji i zmiennych          
  • Filtrowanie, grupowanie
  • Przekodowywanie, transformacje
  • Agregacja, łączenie zbiorów danych
  • Manipulacja znakami, pakiet stringr

Wczytywanie danych

  • Pliki txt
  • Pliki CSV
  • Pliki XLS, XLSX
  • Dane w formatach SPSS, SAS, Stata,… i innych
  • Eksport danych do formatów txt, csv i innych
  • Dostęp do danych z baz danych za pomocą języka SQL

Rozkłady prawdopodobieństwa

  • R jako zestaw tabel statystycznych
  • Badanie rozkładu zbioru danych
  • Testy jedno- i dwupróbkowe

Grupowanie, pętle i wykonywanie warunkowe

  • Grupowane wyrażenia
  • Instrukcje sterujące
    • Wykonywanie warunkowe: instrukcje if
    • Powtarzanie: pętle for, repeat i while

Dzień 3

Pisanie własnych funkcji

  • Proste przykłady
  • Definiowanie nowych operatorów binarnych
  • Nazwane argumenty i wartości domyślne
  • Argument '...'
  • Przypisania wewnątrz funkcji
  • Bardziej zaawansowane przykłady
    • Czynniki efektywności w projektach blokowych
    • Usuwanie wszystkich nazw w drukowanej tablicy
    • Rekurencyjna całka numeryczna
  • Zakres
  • Dostosowywanie środowiska
  • Klasy, funkcje generyczne i programowanie obiektowe

Analiza statystyczna w R

  • Modele regresji liniowej
  • Funkcje generyczne do ekstrakcji informacji o modelu
  • Aktualizacja dopasowanych modeli
  • Modele liniowe uogólnione
    • Rodziny
    • Funkcja glm()
  • Klasyfikacja
    • Regresja logistyczna
    • Analiza dyskryminacyjna liniowa
  • Uczenie nienadzorowane
    • Analiza składowych głównych
    • Metody grupowania (k-średnie, grupowanie hierarchiczne, k-medoidy)
  • Analiza przeżycia
    • Obiekty przeżycia w R
    • Estymator Kaplana-Meiera
    • Pasmo ufności
    • Modele Coxa PH, stałe kowarianty
    • Modele Coxa PH, kowarianty zależne od czasu

Procedury graficzne

  • Polecenia rysowania wysokiego poziomu
    • Funkcja plot()
    • Wyświetlanie danych wielowymiarowych
    • Wyświetlanie grafiki
    • Argumenty do funkcji rysowania wysokiego poziomu
  • Podstawowe wykresy wizualizacyjne
  • Relacje wielowymiarowe z pakietami lattice i ggplot
  • Używanie parametrów graficznych
  • Lista parametrów graficznych

Automatyzowane i interaktywne raportowanie

  • Łączenie wyników z R z tekstem

Tworzenie dokumentów html, pdf

 21 godzin

Liczba uczestników


Cena za uczestnika

Opinie uczestników (7)

Propozycje terminów

Powiązane Kategorie