Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Plan Szkolenia
Big Data Przegląd:
- Czym jest Big Data
- Dlaczego Big Data zyskuje na popularności
- Studia przypadków Big Data
- Charakterystyka Big Data
- Rozwiązania do pracy nad Big Data.
Hadoop i jego składniki:
- Czym jest Hadoop i jakie są jego komponenty.
- Architektura i charakterystyka danych, które może obsługiwać / przetwarzać Hadoop.
- Krótka historia Hadoop, firmy z niego korzystające i dlaczego zaczęły go używać.
- Hadoop Struktura i jej komponenty - wyjaśnione szczegółowo.
- Co to jest HDFS i odczyty - zapisy do Hadoop rozproszonego systemu plików.
- Jak skonfigurować klaster Hadoop w różnych trybach - samodzielny / pseudo / wielowęzłowy.
(Obejmuje to konfigurację klastra Hadoop w VirtualBox / KVM / VMware, konfiguracje sieci, które należy dokładnie sprawdzić, uruchamianie Hadoop Daemonów i testowanie klastra).
- Czym jest i jak działa framework Map Reduce.
- Uruchamianie zadań Map Reduce na klastrze Hadoop.
- Zrozumienie replikacji, mirroringu i świadomości Rack w kontekście klastrów Hadoop.
Planowanie klastra Hadoop:
- Jak zaplanować klaster hadoop.
- Zrozumienie sprzętu i oprogramowania w celu zaplanowania klastra hadoop.
- Zrozumienie obciążeń i planowanie klastra w celu uniknięcia awarii i optymalnego działania.
Co to jest MapR i dlaczego MapR:
- Przegląd MapR i jego architektury.
- Zrozumienie i działanie systemu kontroli MapR, woluminów MapR, migawek i serwerów lustrzanych.
- Planowanie klastra w kontekście MapR.
- Porównanie MapR z innymi dystrybucjami i Apache Hadoop.
- Instalacja MapR i wdrożenie klastra.
Konfiguracja i administracja klastrem:
- Zarządzanie usługami, węzłami, migawkami, woluminami lustrzanymi i zdalnymi klastrami.
- Zrozumienie i zarządzanie węzłami.
- Zrozumienie komponentów Hadoop, instalacja komponentów Hadoop wraz z usługami MapR.
- Dane Access w klastrze, w tym przez NFS Zarządzanie usługami i węzłami.
- Zarządzanie danymi za pomocą wolumenów, zarządzanie użytkownikami i grupami, zarządzanie i przypisywanie ról do węzłów, uruchamianie i wycofywanie węzłów, administracja klastrem i monitorowanie wydajności, konfigurowanie / analizowanie i monitorowanie metryk w celu monitorowania wydajności, konfigurowanie i administrowanie bezpieczeństwem MapR.
- Zrozumienie i praca z M7- Native storage dla tabel MapR.
- Konfiguracja i dostrajanie klastra w celu uzyskania optymalnej wydajności.
Aktualizacja klastra i integracja z innymi konfiguracjami:
- Aktualizacja wersji oprogramowania MapR i rodzaje aktualizacji.
- Konfiguracja klastra Mapr w celu uzyskania dostępu do klastra HDFS.
- Konfiguracja klastra MapR na Amazon Elastic Mapreduce.
Wszystkie powyższe tematy obejmują demonstracje i sesje ćwiczeniowe, aby uczestnicy mogli zapoznać się z technologią.
Wymagania
- Podstawowa znajomość Linux FS
- Podstawowa Java
- Znajomość Apache Hadoop (zalecane)
28 godzin
Opinie uczestników (1)
Praktyczne sprawy zostały dobrze wykonane, a także teoria została dobrze przedstawiona przez Ajaya.
Dominik Mazur - Capgemini Polska Sp. z o.o.
Szkolenie - Hadoop Administration on MapR
Przetłumaczone przez sztuczną inteligencję