Plan Szkolenia

Wprowadzenie

  • Przegląd Databricks i Apache Spark
  • Zrozumienie architektury Databricks

Rozpoczynanie pracy

  • Konfigurowanie środowiska
  • Konfigurowanie i ustawianie Databricks
  • Nawigacja w interfejsie użytkownika Databricks
  • Tworzenie obszaru roboczego Databricks

Praca z danymi w Databricks

  • Połączenie się ze źródłem danych Apache Spark
  • Zrozumienie podstawowych kolumn i typów danych
  • Zarządzanie systemem plików w Notatnikach

Zarządzanie zadaniami i klastrami

  • Tworzenie i konfigurowanie klastrów
  • Tworzenie zadań za pomocą Notatnika
  • Uruchamianie zadań
  • Wyświetlanie zadań i szczegółów zadań

Korzystanie z Delta Lake w Databricks

  • Ładowanie danych do Delta Lake
  • Zarządzanie danymi w Delta Lake

Zabezpieczanie Databricks

  • Zarządzanie zabezpieczeniami Databricks
  • Zarządzanie kopią zapasową i odzyskiwaniem danych

Rozwiązywanie problemów

Podsumowanie i kolejne kroki

Wymagania

  • Podstawowe zrozumienie analizy danych
  • Znajomość Apache Spark

Grupa docelowa

  • Inżynierowie danych
  • Naukowcy danych
  • Programiści
 14 godzin

Liczba uczestników


cena netto za uczestnika

Propozycje terminów

Powiązane Kategorie