Plan Szkolenia

Dzień Pierwszy: Podstawy Języka




  • Wprowadzenie do kursu


  • O Analizie Danych


    • Definicja analizy danych


    • Proces prowadzenia analizy danych.




  • Wprowadzenie do języka R


  • Zmienne i typy danych


  • Struktury sterowania (pętle / warunki)


  • Skalary, wektory i macierze w R


    • Definiowanie wektorów w R


    • Macierze




  • Manipulacja ciągami i tekstem


    • Typ danych znakowych (character)


    • Wejście-wyjście z plików (File IO)




  • Listy


  • Funkcje


    • Wprowadzenie do funkcji


    • Zamknięcia (closures)


    • Funkcje lapply/sapply




  • DataFrames


  • Ćwiczenia do wszystkich sekcji



Dzień Drugi: Pośrednie Programowanie w R




  • DataFrames i Wejście-Wyjście z plików (File I/O)


  • Odczytywanie danych z plików


  • Przygotowanie danych


  • Wbudowane zestawy danych (datasets)


  • Wizualizacja


    • Pakiet graficzny (Graphics Package)


    • Funkcje plot() / barplot() / hist() / boxplot() / wykres punktowy (scatter plot)


    • Mapa ciepła (Heat Map)


    • Pakiet ggplot2 (qplot(), ggplot())




  • Eksploracja z użyciem dplyr


  • Ćwiczenia do wszystkich sekcji



Dzień Trzeci: Zaawansowane Programowanie w R




  • Modelowanie statystyczne za pomocą R


    • Funkcje statystyczne


    • Obsługa wartości brakujących (NA)


    • Rozkłady (binomialny, Poissona, normalny)




  • Regresja


    • Wprowadzenie do regresji liniowej




  • Rekomendacje


  • Przetwarzanie tekstu (pakiet tm / Wordclouds)


  • Klasteryzacja


    • Wprowadzenie do klasteryzacji


    • Algorytm KMeans




  • Klasyfikacja


    • Wprowadzenie do klasyfikacji


    • Algorytm Naive Bayes


    • Drzewa decyzyjne (Decision Trees)


    • Trening z użyciem pakietu caret


    • Ocena algorytmów




  • R i duże dane (Big Data)


    • Łączenie R z bazami danych


    • Ekosystem dużych danych (Big Data Ecosystem)




  • Ćwiczenia do wszystkich sekcji

Wymagania

  • Preferowane podstawy programowania



Konfiguracja




  • Nowoczesny laptop


  • Najnowsze R Studio i środowisko R zainstalowane

 21 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (7)

Propozycje terminów

Powiązane Kategorie