Plan Szkolenia

Wstęp

    Data Science Proces Role i obowiązki analityka danych

Przygotowanie środowiska programistycznego

    Biblioteki, frameworki, języki i narzędzia Rozwój lokalny Wspólny rozwój oparty na sieci Web

Zbieranie danych

    Różne typy danych Lokalne bazy danych Złącza baz danych Popularne formaty: xlxs, XML, Json, csv, ...
Niestrukturalne kliknięcia, cenzorzy, smartfony
  • Pszczoła
  • Internet of Things (IoT)
  • Dokumenty, zdjęcia, filmy, dźwięki
  • Studium przypadku: Ciągłe gromadzenie dużych ilości nieustrukturyzowanych danych
  • Przechowywanie danychRelacyjne bazy danych Nierelacyjne bazy danych Hadoop: Rozproszony system plików (HDFS) Spark: Odporny rozproszony zestaw danych (RDD) Przechowywanie w chmurze
  • Przygotowywanie danych
  • Pozyskiwanie, selekcja, oczyszczanie i transformacja Zapewnienie jakości danych – poprawność, sensowność i bezpieczeństwo Raporty o wyjątkach

      Languages wykorzystywane do przygotowania, przetwarzania i analizy

    Język R Wprowadzenie do R Manipulacja danymi, obliczenia i wyświetlanie graficzne

      Python Wprowadzenie do Python

    Manipulowanie, przetwarzanie, czyszczenie i przetwarzanie danych

      Analityka danych
    Analiza eksploracyjna Podstawowe statystyki Szkice wizualizacji Zrozumienie danych
  • Przyczynowość
  • Cechy i przekształcenia
  • Machine Learning Nadzorowane vs nienadzorowane

      Kiedy używać jakiego modelu
    Natural Language Processing (NLP)
  • Data Visualization
  • Najlepsze praktyki Wybór odpowiedniego wykresu dla właściwych danych Palety kolorów Przeniesienie na wyższy poziom Pulpity nawigacyjne Interaktywne wizualizacje
  • Opowiadanie historii za pomocą danych
  • Podsumowanie i wnioski
  • Wymagania

    • Ogólne zrozumienie koncepcji baz danych
    • Podstawowe zrozumienie statystyki
     35 godzin

    Liczba uczestników


    cena netto za uczestnika

    Opinie uczestników (1)

    Propozycje terminów

    Powiązane Kategorie