Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Plan Szkolenia
Wprowadzenie
- Proces Nauki o Danych
- Role i obowiązki Data Scientist'a
Przygotowanie środowiska programistycznego
- Biblioteki, frameworki, języki i narzędzia
- Lokalne programowanie
- Współpracujące programowanie w sieci
Zbieranie danych
-
Różne typy danych
-
Strukturalizowane
- Lokalne bazy danych
- Połączenia z bazami danych
- Powszechne formaty: xlxs, XML, Json, csv, ...
-
Niestrukturalizowane
- Kliknięcia, czujniki, smartfony
- API
- Internet rzeczy (IoT)
- Dokumenty, zdjęcia, filmy, dźwięki
-
Strukturalizowane
- Przypadek studium: Zbieranie dużych ilości niestrukturalizowanych danych w sposób ciągły
Przechowywanie danych
- Relacyjne bazy danych
- Niereleacyjne bazy danych
- Hadoop: Rozproszony System Plików (HDFS)
- Spark: Rozproszone Zbiory Danych o Wysokiej Wydajności (RDD)
- Przechowywanie w chmurze
Przygotowanie danych
- Wprowadzanie, wybieranie, czyszczona i transformacja danych
- Zapewnianie jakości danych - poprawność, zrozumiałość i bezpieczeństwo
- Raporty wyjątków
Języki używane do przygotowywania, przetwarzania i analizowania danych
-
Język R
- Wprowadzenie do języka R
- Manipulacja danymi, obliczenia i graficzne prezentacje
-
Python
- Wprowadzenie do Pythona
- Manipulacja, przetwarzanie, czyszczenie i analiza danych
Analiza danych
-
Analiza eksploracyjna
- Podstawowa statystyka
- Pierwsze wizualizacje
- Zrozumienie danych
- Przyczynowość
- Charakterystyki i transformacje
-
Uczenie maszynowe
- Nadzorowane vs niezakłócone
- Kiedy używać jakiego modelu
- Przetwarzanie języka naturalnego (NLP)
Wizualizacja danych
- Najlepsze praktyki
- Wybieranie odpowiedniego wykresu dla odpowiednich danych
- Palety kolorów
-
Podnoszenie poziomu
- Panelki kontrolne
- Interaktywne wizualizacje
- Opowiadanie historii za pomocą danych
Podsumowanie i wnioski
Wymagania
- Ogólne pojęcie koncepcji baz danych
- Podstawowe zrozumienie statystyki
35 godzin
Opinie uczestników (1)
Real world knowledge from someone in the industry