Plan Szkolenia

Wprowadzenie do platformy Stratio

  • Przegląd architektury Stratio i modułów podstawowych
  • Rola Rocket i Intelligence w cyklu życia danych
  • Logowanie się i nawigowanie po interfejsie użytkownika Stratio

Praca z modułem Rocket

  • Wprowadzanie danych i tworzenie kanałów przetwarzania
  • Łączenie źródeł danych i konfigurowanie transformacji
  • Używanie PySpark do zadań przygotowawczych w Rocket

Podstawy PySpark dla użytkowników Stratio

  • Struktury danych i operacje PySpark
  • Konstrukcje pętli: użycie for, while, if/else
  • Pisanie własnych funkcji z def i ich stosowanie

Zaawansowane użycie Rocket z PySpark

  • Przetwarzanie strumieniowe i transformacje
  • Użycie pętli i funkcji w scenariuszach batch i real-time
  • Dobre praktyki w zakresie wydajności w kanałach PySpark

Badawanie modułu Intelligence

  • Przegląd funkcji modelowania i analizy danych
  • Selekcja, transformacja i eksploracja cech
  • Rola PySpark w niestandardowej analizie i wglądach

Budowanie zaawansowanych przepływów analitycznych

  • Tworzenie funkcji zdefiniowanych przez użytkownika (UDFs) w Intelligence
  • Zastosowanie warunków i pętli dla logiki danych
  • Przypadki użycia: segmentacja, agregacja i przewidywanie

Wdrażanie i Collaboration

  • Zapisywanie, eksportowanie i ponowne użycie przepływów pracy
  • Współpraca z innymi członkami zespołu w Stratio
  • Przeglądanie wyników i integrowanie z narzędziami w kolejnych etapach

Podsumowanie i następne kroki

Wymagania

  • Doświadczenie w programowaniu Python
  • Zrozumienie koncepcji analizy danych lub przetwarzania big data
  • Podstawowa wiedza na temat Apache Spark i obliczeń rozproszonych

Grupa docelowa

  • Inżynierowie danych pracujący na platformach opartych na Stratio
  • Analitycy lub deweloperzy używający modułów Rocket i Intelligence
  • Zespoły techniczne przechodzące na przepływy pracy PySpark w Stratio
 14 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie