Bądźmy w kontakcie

Plan Szkolenia

Wprowadzenie do ekosystemów Big Data

  • Przegląd technologii i architektur big data
  • Przetwarzanie wsadowe a przetwarzanie w czasie rzeczywistym
  • Strategie przechowywania danych pod kątem skalowalności

Zaawansowane przetwarzanie danych z Apache Spark

  • Optymalizacja zadań Spark pod kątem wydajności
  • Zaawansowane transformacje i akcje
  • Praca ze strumieniowaniem strukturalnym

Uczenie maszynowe na dużą skalę

  • Techniki szkolenia modeli w środowisku rozproszonym
  • Dostrajanie hiperparametrów na dużych zbiorach danych
  • Wdrażanie modeli w środowiskach big data

Głębokie uczenie dla Big Data

  • Integracja TensorFlow i PyTorch ze Sparkiem
  • Rozproszone potoki szkoleniowe dla głębokiego uczenia
  • Przykłady zastosowań w analizie obrazów, tekstu i szeregów czasowych

Analiza w czasie rzeczywistym i przetwarzanie strumieniowe

  • Apache Kafka do pozyskiwania danych strumieniowych
  • Frameworki do przetwarzania strumieniowego
  • Monitorowanie i alerty w systemach czasu rzeczywistego

Zarządzanie danymi, bezpieczeństwo i etyka

  • Wymagania dotyczące prywatności i zgodności danych
  • Kontrola dostępu i szyfrowanie w systemach big data
  • Rozważania etyczne w analizie na dużą skalę

Integracja Big Data z Business Intelligence

  • Wizualizacja danych i tworzenie pulpitów nawigacyjnych dla big data
  • Łączenie potoków big data z narzędziami BI
  • Napędzanie wyników biznesowych za pomocą zaawansowanej analizy

Podsumowanie i kolejne kroki

Wymagania

  • Solidne zrozumienie pojęć analizy danych i modelowania statystycznego
  • Doświadczenie w korzystaniu z narzędzi do przetwarzania danych i języków programowania takich jak Python, R lub Scala
  • Znajomość rozproszonych frameworków obliczeniowych, takich jak Hadoop czy Spark

Grupa docelowa

  • Analitycy danych dążący do opanowania przetwarzania danych na dużą skalę i analizy predykcyjnej
  • Starszy personel analityczny, który chce projektować i wdrażać zaawansowane przepływy pracy analityczne
  • Specjaliści ds. badań i rozwoju skupiający się na innowacyjnych rozwiązaniach opartych na danych
 42 godzin

Liczba uczestników


Cena za uczestnika (netto)

Opinie uczestników (2)

Propozycje terminów

Powiązane Kategorie