Administrator Training for Apache Hadoop - Plan Szkolenia

Kod kursu

apacheh

Czas trwania

35 godzin (zwykle 5 dni wliczając przerwy)

Wymagania

  • podstawowe umiejętności administracji systemem Linux

  • podstawowe umiejętności programistyczne

Opis

Głównym celem szkolenia jest zdobycie wiedzy z administracji systemem Apache Hadoop w środowiskach MapReduce oraz YARN na poziomie zaawansowanym. Tematyka szkolenia dotyczy w głównej mierze architektury systemu Hadoop, a w szczególności systemu plików HDFS oraz modeli programistycznych MapReduce i YARN oraz zagadnień związanych z planowaniem, instalacją, konfiguracją, administracją, zarządzaniem i monitorowaniem klastra systemu Hadoop. Pozostałe zagadnienia związane z tematyką BigData takie jak HBase, Cassandra, Impala, Pig, Hiver oraz Sqoop są również omówione, choć pobieżnie. Kurs przeznaczony jest w głównej mierze do specjalistów z branży IT, którzy chcą przygotować się i zdać egzamin CCAH (Cloudera Certified administrator for Apache Hadoop).

Plan Szkolenia

1: HDFS (17%)

  • Funkcje poszczególnych daemonów systemu Apache Hadoop

  • Przechowywanie i przetwarzanie danych w sytemie Hadoop

  • W jakich okolicznościach powinniśmy wybrać system Hadoop

  • Architektura i zasada działania HDFS

  • Federacje HDFS

  • HDFS High Availability

  • Bezpieczeństwo HDFS (Kerberos)

  • Studiowanie przypadków

  • Proces odczytu i zapisu plików w HDFS

  • Interfejsk tekstowy HDFS

2: YARN i MapReduce w wersji 2 (MRv2) (17%):

  • Konfiguracja YARN

  • Wdrażanie YARN

  • Architektura i zasada działania YARN

  • Alokacja zasobów w YARN

  • Przebieg wykonania zadań w YARN

  • Migracja z MRv1 do YARN

3: Planowanie Klastra Systemu Hadoop (16%)

  • Analiza wymagań i wybór sprzętu

  • Analiza wymagań i wybór systemu operacyjnego

  • Dobór parametrów jądra i konfiguracji pamięci masowej

  • Dobór konfiguracji sprzętowej do wymagań

  • Dobór podzespołów klastra i narzędzi pomocniczych

  • Skalowalność systemu: obciążenie procesora, pamięci operacyjnej, pamięci masowej (IO) oraz pojemności systemu

  • Skalowalność na poziomie pamięci masowej: JBOD vs RAID, dyski sieciowe i wpływ wirtualizacji na wydajność systemu

  • Topologie sieciowe: obiążenie sieci w systemie Hadoop (HDFS i MapReduce) i optymalizacja połączeń

4: Instalacja i Administracja Klastrem Systemu Hadoop (25%)

  • Wpływ awari na działanie klastra

  • Monitorowanie logów

  • Podstawowe metryki wykorzystywane przez klaster systemu Hadoop

  • Narzędzia do monitorowania klastra systemu Hadoop

  • Narzędzia pomocnicze: Impala, Flume, Oozie, Hue, Cloudera Manager, Sqoop, Hive, Pig i inne

  • Narzędzia do administracji klastrem systemu Hadoop

5: Zarządzanie Zasobami (10%)

  • Architektura i funkcje kolejek

  • Alokacja zasobów przez kolejki FIFO

  • Alokacja zasobów przez kolejki sprawiedliwe

  • Alokacja zasobów przez kolejki pojemnościowe

6: Monitorowanie i Logowanie (15%)

  • Monitorowanie metryk

  • Zarządzanie NameNodem i JobTrackerem z poziomu Web GUI

  • Jak monitorować daemony systemu Hadoop

  • Monitorowanie zużycia CPU na kluczowych serwerach w klastrze

  • Monitorowanie zużycia pamięci RAM i swap

  • Zarządzanie i przeglądanie logów

  • Interpretacja logów

Opinie uczestników

★★★★★
★★★★★

Powiązane Kategorie

Kursy w promocyjnej cenie

Newsletter z promocjami

Zapisz się na nasz newsletter i otrzymuj informacje o aktualnych zniżkach na kursy otwarte.
Szanujemy Twoją prywatność, dlatego Twój e-mail będzie wykorzystywany jedynie w celu wysyłki naszego newslettera, nie będzie udostępniony ani sprzedany osobom trzecim.
W dowolnej chwili możesz zmienić swoje preferencje co do otrzymywanego newslettera bądź całkowicie się z niego wypisać.

Zaufali nam

is growing fast!

We are looking to expand our presence in Poland!

As a Business Development Manager you will:

  • expand business in Poland
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!