Plan Szkolenia

Wprowadzenie

  • Przegląd Databricks i Apache Spark
  • Zrozumienie architektury Databricks

Rozpoczęcie pracy

  • Konfiguracja środowiska
  • Składurowanie i konfigurowanie Databricks
  • Nawigacja w interfejsie użytkownika Databricks
  • Tworzenie obszaru roboczego Databricks

Praca z danymi w Databricks

  • Łączenie się ze źródłem danych Apache Spark
  • Zrozumienie podstawowych kolumn i typów danych
  • Zarządzanie systemem plików w Notesach

Zarządzanie zadaniami i klastrami

  • Tworzenie i konfigurowanie klastrów
  • Tworzenie zadań przy użyciu Notesu
  • Uruchamianie zadań
  • Przeglądanie zadań i ich szczegółów

Używanie Delta Lake w Databricks

  • Ładowanie danych do Delta Lake
  • Zarządzanie danymi w Delta Lake

Zabezpieczanie Databricks

  • Zarządzanie bezpieczeństwem w Databricks
  • Zarządzanie kopiami zapasowymi i odzyskiwaniem

Rozwiązywanie problemów

Podsumowanie i kolejne kroki

Wymagania

  • Podstawowa znajomość analityki danych
  • Znajomość Apache Spark

Grupa docelowa

  • Inżynierowie danych
  • Naukowcy zajmujący się danymi
  • Deweloperzy
 14 godzin

Liczba uczestników


Cena za uczestnika (netto)

Propozycje terminów

Powiązane Kategorie