apacheh
35 godzin (zwykle 5 dni wliczając przerwy)
podstawowe umiejętności administracji systemem Linux
Głównym celem szkolenia jest zdobycie wiedzy z administracji systemem Apache Hadoop w środowiskach MapReduce oraz YARN na poziomie zaawansowanym. Tematyka szkolenia dotyczy w głównej mierze architektury systemu Hadoop, a w szczególności systemu plików HDFS oraz modeli programistycznych MapReduce i YARN oraz zagadnień związanych z planowaniem, instalacją, konfiguracją, administracją, zarządzaniem i monitorowaniem klastra systemu Hadoop. Pozostałe zagadnienia związane z tematyką BigData takie jak HBase, Cassandra, Impala, Pig, Hiver oraz Sqoop są również omówione, choć pobieżnie. Kurs przeznaczony jest w głównej mierze do specjalistów z branży IT, którzy chcą przygotować się i zdać egzamin CCAH (Cloudera Certified administrator for Apache Hadoop).
Funkcje poszczególnych daemonów systemu Apache Hadoop
Przechowywanie i przetwarzanie danych w sytemie Hadoop
W jakich okolicznościach powinniśmy wybrać system Hadoop
Architektura i zasada działania HDFS
Federacje HDFS
HDFS High Availability
Bezpieczeństwo HDFS (Kerberos)
Studiowanie przypadków
Proces odczytu i zapisu plików w HDFS
Konfiguracja YARN
Wdrażanie YARN
Architektura i zasada działania YARN
Alokacja zasobów w YARN
Przebieg wykonania zadań w YARN
Analiza wymagań i wybór sprzętu
Analiza wymagań i wybór systemu operacyjnego
Dobór parametrów jądra i konfiguracji pamięci masowej
Dobór konfiguracji sprzętowej do wymagań
Dobór podzespołów klastra i narzędzi pomocniczych
Skalowalność systemu: obciążenie procesora, pamięci operacyjnej, pamięci masowej (IO) oraz pojemności systemu
Skalowalność na poziomie pamięci masowej: JBOD vs RAID, dyski sieciowe i wpływ wirtualizacji na wydajność systemu
Wpływ awari na działanie klastra
Monitorowanie logów
Podstawowe metryki wykorzystywane przez klaster systemu Hadoop
Narzędzia do monitorowania klastra systemu Hadoop
Narzędzia pomocnicze: Impala, Flume, Oozie, Hue, Cloudera Manager, Sqoop, Hive, Pig i inne
Architektura i funkcje kolejek
Alokacja zasobów przez kolejki FIFO
Alokacja zasobów przez kolejki sprawiedliwe
Monitorowanie metryk
Zarządzanie NameNodem i JobTrackerem z poziomu Web GUI
Jak monitorować daemony systemu Hadoop
Monitorowanie zużycia CPU na kluczowych serwerach w klastrze
Monitorowanie zużycia pamięci RAM i swap
Zarządzanie i przeglądanie logów
We are looking to expand our presence in Poland!
If you are interested in running a high-tech, high-quality training and consulting business.
Apply now!




.jpg)


.png)




.jpg)



.jpg)







.gif)



.jpg)


.jpg)















