Plan Szkolenia

Dzień Pierwszy: Podstawy Języka

  • Wprowadzenie do kursu
  • O Data Science
    • Definicja Data Science
    • Proces wykonywania Data Science
  • Zapoznanie z R Language
  • Zmienne i typy
  • Struktury sterujące (pętle / warunki)
  • Skalary, wektory i macierze R
    • Definiowanie wektorów R
    • Macierze
  • Manipulacja łańcuchami znaków i tekstem
    • Typ danych znakowych
    • Wejście/wyjście plików
  • Listy
  • Funkcje
    • Wprowadzenie do funkcji
    • Domknięcia
    • Funkcje lapply/sapply
  • Ramki danych
  • Laboratoria dla wszystkich sekcji

Dzień Drugi: Średniozaawansowany R Programming

  • Ramki danych i wejście/wyjście plików
  • Odczytywanie danych z plików
  • Przygotowanie danych
  • Wbudowane zestawy danych
  • Wizualizacja
    • Pakiet graficzny
    • Funkcje plot() / wykres słupkowy() / hist() / wykres punktowy() / wykres rozrzutu
    • Mapa ciepła
    • Pakiet ggplot2 (qplot(), ggplot())
  • Eksploracja z Dplyr
  • Laboratoria dla wszystkich sekcji

Dzień Trzeci: Zaawansowany Programming z R

  • Modelowanie statystyczne z R
    • Funkcje statystyczne
    • Radzenie sobie z NA
    • Rozkłady (dwumianny, Poisson, normalny)
  • Regressja
    • Wprowadzenie do regresji liniowej
  • Rekomendacje
  • Przetwarzanie tekstu (pakiet tm / chmury Word)
  • Klasteryzacja
    • Wprowadzenie do klasteryzacji
    • Metoda k-średnich
  • Klasyfikacja
    • Wprowadzenie do klasyfikacji
    • Naive Bayes
    • Drzewa decyzyjne
    • Trenowanie z użyciem pakietu caret
    • Ocenianie algorytmów
  • R i Big Data
    • Łączenie R z bazami danych
    • Ekosystem Big Data
  • Laboratoria dla wszystkich sekcji

Wymagania

  • Wskazane jest posiadanie podstawowych umiejętności programowania

Konfiguracja

 21 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (7)

Propozycje terminów

Powiązane Kategorie