Plan Szkolenia
Wprowadzenie
Instalowanie i Konfigurowanie Dataiku Data Science Studio (DSS)
- Wymagania systemowe dla Dataiku DSS
- Konfiguracja integracji z Apache Hadoop i Apache Spark
- Konfigurowanie Dataiku DSS z wykorzystaniem proxy webowych
- Migracja z innych platform do Dataiku DSS
Przegląd Funkcji i Architektury Dataiku DSS
- Podstawowe obiekty i grafy w Dataiku DSS
- Czym jest przepis (recipe) w Dataiku DSS?
- Typy zbiorów danych obsługiwane przez Dataiku DSS
Tworzenie Projektu w Dataiku DSS
Definiowanie Zbiorów Danych do Łączenia z Zasobami Danych w Dataiku DSS
- Praca z łącznikami DSS i formatami plików
- Standardowe formaty DSS a formaty specyficzne dla Hadoop
- Przesyłanie plików dla projektu Dataiku DSS
Przegląd Systemu Plików Serwera w Dataiku DSS
Tworzenie i Używanie Zarządzanych Folderów
- Przepis Dataiku DSS do scalania folderów
- Foldery lokalne a nie-lokalne
Tworzenie Zbioru Danych z Zawartości Zarządzanych Folderów
- Czyszczenie danych za pomocą przepisu kodu DSS
Praca ze Zbiorami Danych Metrics i Internal Stats
Implementacja Przepisu Pobierania DSS dla Zbioru Danych HTTP
Przenoszenie Zbiorów Danych SQL i HDFS za Pomocą DSS
Porządkowanie Zbiorów Danych w Dataiku DSS
- Porządkowanie przy zapisie a porządkowanie przy odczycie
Eksplorowanie i Przygotowywanie Wizualizacji Danych dla Projektu Dataiku DSS
Przegląd Schematów, Typów Przechowywania i Znaczeń w Dataiku
Wykonywanie Skryptów Czyszczenia, Normalizacji i Wzbogacania Danych w Dataiku DSS
Praca z Interfejsem Wykresów i Typami Agregacji Wizualnych w Dataiku DSS
Wykorzystanie Interaktywnych Statystyk w DSS
- Analiza jednoczynnikowa a analiza dwuczynnikowa
- Wykorzystanie narzędzia Analizy Głównych Składowych (PCA) w DSS
Przegląd Uczenia Maszynowego w Dataiku DSS
- Uczenie nadzorowane a uczenie nienadzorowane
- Referencje dotyczące algorytmów ML i obsługi funkcji w DSS
- Głębokie uczenie z wykorzystaniem Dataiku DSS
Przegląd Przepływu Pochodzącego z Zbiorów Danych i Przepisów DSS
Przekształcanie Istniejących Zbiorów Danych w DSS za Pomocą Wizualnych Przepisów
Wykorzystanie Przepisów DSS na Podstawie Kodu Użytkownika
Optymalizacja Eksploracji Kodu i Eksperymentowania za Pomocą Notatników Kodu DSS
Tworzenie Zaawansowanych Wizualizacji DSS i Niestandardowych Funkcji Frontendu za Pomocą Webapps
Praca z Funkcją Raportów Kodu w Dataiku DSS
Udostępnianie Elementów Projektu Danych i Zapoznanie się z Pulpitem Nawigacyjnym DSS
Projektowanie i Pakowanie Projektu Dataiku DSS jako Aplikacji Wielokrotnego Użytku
Przegląd Zaawansowanych Metod w Dataiku DSS
- Implementowanie optymalnego partycjonowania zbiorów danych za pomocą DSS
- Wykonywanie określonych części przetwarzania DSS poprzez obliczenia w kontenerach Kubernetes
Przegląd Współpracy i Kontroli Wersji w Dataiku DSS
Implementowanie Scenariuszy Automatyzacji, Metryk i Kontroli do Testowania Projektu DSS
Wdrażanie i Aktualizacja Projektu za Pomocą Węzła Automatyzacji i Pakietów DSS
Praca z API w Czasie Rzeczywistym w Dataiku DSS
- Dodatkowe API i Rest API w DSS
Analiza i Prognozowanie Szeregów Czasowych w Dataiku DSS
Zabezpieczanie Projektu w Dataiku DSS
- Zarządzanie Uprawnieniami Projektu i Autoryzacjami Pulpitu Nawigacyjnego
- Implementowanie Zaawansowanych Opcji Bezpieczeństwa
Integracja Dataiku DSS z Chmurą
Rozwiązywanie Problemów
Podsumowanie i Zakończenie
Wymagania
- Doświadczenie w programowaniu w językach Python, SQL i R
- Podstawowa wiedza na temat przetwarzania danych z wykorzystaniem Apache Hadoop i Spark
- Zrozumienie koncepcji uczenia maszynowego i modeli danych
- Podstawy analiz statystycznych i koncepcji związanych z nauką o danych
- Doświadczenie w wizualizacji i komunikacji danych
Grupa docelowa
- Inżynierowie
- Naukowcy zajmujący się danymi
- Analitycy danych