Plan Szkolenia

Wprowadzenie

  • Wprowadzenie do chmury obliczeniowej i rozwiązań Big Data
  • Przegląd funkcji i architektury Apache Hadoop

Konfiguracja Hadoop

  • Planowanie klastra Hadoop (lokalnie, w chmurze itp.)
  • Wybór systemu operacyjnego i dystrybucji Hadoop
  • Provisioning zasobów (sprzęt, sieć itp.)
  • Pobieranie i instalacja oprogramowania
  • Dostosowanie rozmiaru klastra pod kątem elastyczności

Praca z HDFS

  • Zrozumienie Hadoop Distributed File System (HDFS)
  • Przegląd referencji poleceń HDFS
  • Dostęp do HDFS
  • Wykonywanie podstawowych operacji na plikach w HDFS
  • Użycie S3 jako uzupełnienia HDFS

Przegląd MapReduce

  • Zrozumienie przepływu danych w frameworku MapReduce
  • Map, Shuffle, Sort i Reduce
  • Demo: Obliczanie najwyższych wynagrodzeń

Praca z YARN

  • Zrozumienie zarządzania zasobami w Hadoop
  • Praca z ResourceManager, NodeManager, Application Master
  • Planowanie zadań w YARN
  • Planowanie dla dużych liczby węzłów i klastrów
  • Demo: Planowanie zadań

Integracja Hadoop ze Spark

  • Konfiguracja magazynu dla Spark (HDFS, Amazon, S3, NoSQL itp.)
  • Zrozumienie Resilient Distributed Datasets (RDDs)
  • Tworzenie RDD
  • Implementacja transformacji RDD
  • Demo: Implementacja programu wyszukiwania tekstu w tytułach filmów

Zarządzanie klastrem Hadoop

  • Monitorowanie Hadoop
  • Zabezpieczanie klastra Hadoop
  • Dodawanie i usuwanie węzłów
  • Przeprowadzanie testów wydajnościowych
  • Dostrajanie klastra Hadoop w celu optymalizacji wydajności
  • Tworzenie kopii zapasowych, odzyskiwanie i planowanie ciągłości działania
  • Zapewnianie wysokiej dostępności (HA)

Aktualizacja i migracja klastra Hadoop

  • Ocena wymagań dotyczących obciążenia
  • Aktualizacja Hadoop
  • Przenoszenie z lokalnego środowiska do chmury i odwrotnie
  • Odzyskiwanie po awariach

Rozwiązywanie problemów

Podsumowanie i zakończenie

Wymagania

  • Doświadczenie w administracji systemami
  • Doświadczenie z linią poleceń Linux
  • Zrozumienie koncepcji big data

Odbiorcy

  • Administratorzy systemów
  • Administratorzy baz danych
 35 godzin

Liczba uczestników


Cena za uczestnika (netto)

Opinie uczestników (2)

Propozycje terminów

Powiązane Kategorie