Plan Szkolenia

Wprowadzenie do ekosystemów Big Data

  • Przegląd technologii i architektur dużych danych
  • Przetwarzanie partyjne vs. przetwarzanie w czasie rzeczywistym
  • Strategie magazynowania danych dla skalowalności

Zaawansowane przetwarzanie danych z użyciem Apache Spark

  • Optymalizacja zadań Spark dla wydajności
  • Zaawansowane transformacje i akcje
  • Praca z przepływami danych strukturalnych

Machine Learning w dużych skalach

  • Techniki rozproszonego trenowania modeli
  • Optymalizacja hiperparametrów na dużych zbiorach danych
  • Wdrażanie modeli w środowiskach dużych danych

Deep Learning dla Big Data

  • Integracja TensorFlow i PyTorch z Spark
  • Rozproszone pipeline'y trenowania uczenia głębokiego
  • Przypadki użycia w analizie obrazów, tekstów i szeregów czasowych

Analiza w czasie rzeczywistym i strumieniowanie danych

  • Apache Kafka do wczytywania strumieniowych danych
  • Ramy przetwarzania strumieniowego
  • Monitorowanie i alertowanie w systemach czasu rzeczywistego

Data Governance, bezpieczeństwo i etyka

  • Wymagania dotyczące prywatności danych i zgodności
  • Access kontrola i szyfrowanie w systemach dużych danych
  • Rozważania etyczne w analizie na dużą skalę

Integracja Big Data z Business Intelligence

  • Wizualizacja danych i tworzenie panelów sterowniczych dla dużych danych
  • Połączenie pipeline'ów dużych danych z narzędziami BI
  • Uzyskiwanie wyników biznesowych dzięki zaawansowanej analizie

Podsumowanie i kolejne kroki

Wymagania

  • Silne zrozumienie koncepcji analizy danych i modelowania statystycznego
  • Doświadczenie w narzędziach do przetwarzania danych i językach programowania, takich jak Python, R lub Scala
  • Znałość frameworków obliczeń rozproszonych, takich jak Hadoop lub Spark

Grupa docelowa

  • Naukowcy danych dążący do opanowania przetwarzania dużych zbiorów danych i analizy predykcyjnej
  • Starszy analitycy poszukujący sposobów projektowania i wdrażania zaawansowanych przepływów analitycznych
  • Specjaliści z zakresu badań i rozwoju skupieni na innowacyjnych rozwiązaniach opartych na danych
 42 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie