Plan Szkolenia

Wprowadzenie

  • Wprowadzenie do obliczeń w chmurze i rozwiązań dotyczących dużych danych (big data)
  • Przegląd funkcji i architektury Apache Hadoop

Instalacja Hadoop

  • Planowanie klastra Hadoop (lokalnie, w chmurze itp.)
  • Wybór systemu operacyjnego i dystrybucji Hadoop
  • Alokacja zasobów (sprzęt, sieć itp.)
  • Pobieranie i instalowanie oprogramowania
  • Skalowanie klastra w celu zapewnienia elastyczności

Praca z HDFS

  • Zrozumienie Hadoop Distributed File System (HDFS)
  • Przegląd referencji poleceń HDFS
  • Dostęp do HDFS
  • Wykonywanie podstawowych operacji na plikach w HDFS
  • Korzystanie z S3 jako uzupełnienia HDFS

Przegląd MapReduce

  • Zrozumienie przepływu danych w frameworku MapReduce
  • Mapowanie, mieszanie, sortowanie i redukcja
  • Demo: Obliczanie najwyższych wynagrodzeń

Praca z YARN

  • Zrozumienie zarządzania zasobami w Hadoop
  • Praca z ResourceManager, NodeManager i Application Master
  • Harmonogramowanie zadań pod YARN
  • Harmonogramowanie dla dużej liczby węzłów i klastrów
  • Demo: Harmonogramowanie zadań

Integracja Hadoop z Spark

  • Konfigurowanie magazynu dla Spark (HDFS, Amazon S3, NoSQL itp.)
  • Zrozumienie Resilient Distributed Datasets (RDDs)
  • Tworzenie RDD
  • Implementowanie transformacji RDD
  • Demo: Implementacja programu wyszukiwania tekstowego dla tytułów filmów

Zarządzanie klastrem Hadoop

  • Monitorowanie Hadoop
  • Bezpieczeństwo klastra Hadoop
  • Dodawanie i usuwanie węzłów
  • Uruchamianie testu wydajnościowego
  • Optymalizacja wydajności klastra Hadoop
  • Kopie zapasowe, odzyskiwanie i planowanie ciągłości biznesowej
  • Zapewnienie wysokiej dostępności (HA)

Aktualizacja i migracja klastra Hadoop

  • Ocena wymagań obciążenia
  • Aktualizacja Hadoop
  • Przenoszenie z lokalnego na chmurowe i vice-versa
  • Odzyskiwanie po awariach

Rozwiązywanie problemów

Podsumowanie i wnioski

Wymagania

  • Dosświadczenie w administracji systemów
  • Dosperience z linią poleceń Linux
  • Zrozumienie pojęć dotyczących dużych danych (big data)

Grupa docelowa

  • Administratorzy systemów
  • Bazy danych (DBA)
 35 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie