Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Plan Szkolenia
Przegląd Big Data:
- Czym jest Big Data
- Dlaczego Big Data zyskuje na popularności
- Studia przypadków Big Data
- Charakterystyka Big Data
- Rozwiązania do pracy z Big Data.
Hadoop i jego komponenty:
- Czym jest Hadoop i jakie są jego komponenty.
- Architektura Hadoop i charakterystyka danych, które może obsługiwać/przetwarzać.
- Krótki przegląd historii Hadoop, firmy korzystające z niego i powody, dla których zaczęły go używać.
- Struktura Hadoop i jej komponenty - szczegółowe omówienie.
- Czym jest HDFS i operacje odczytu-zapisu w Hadoop Distributed File System.
- Jak skonfigurować klaster Hadoop w różnych trybach - samodzielny/pseudo/wielowęzłowy klaster.
(Obejmuje to konfigurację klastra Hadoop w VirtualBox/KVM/VMware, konfigurację sieci, która wymaga starannego przeanalizowania, uruchamianie demonów Hadoop i testowanie klastra).
- Czym jest framework MapReduce i jak działa.
- Uruchamianie zadań MapReduce na klastrze Hadoop.
- Zrozumienie replikacji, mirroringu i świadomości racków w kontekście klastrów Hadoop.
Planowanie klastra Hadoop:
- Jak zaplanować swój klaster Hadoop.
- Zrozumienie sprzętu i oprogramowania do planowania klastra Hadoop.
- Zrozumienie obciążeń i planowanie klastra, aby uniknąć awarii i osiągnąć optymalną wydajność.
Czym jest MapR i dlaczego MapR:
- Przegląd MapR i jego architektury.
- Zrozumienie i działanie MapR Control System, MapR Volumes, snapshotów i mirrorów.
- Planowanie klastra w kontekście MapR.
- Porównanie MapR z innymi dystrybucjami i Apache Hadoop.
- Instalacja MapR i wdrażanie klastra.
Konfiguracja i administracja klastrem:
- Zarządzanie usługami, węzłami, snapshotami, mirrorami woluminów i zdalnymi klastrami.
- Zrozumienie i zarządzanie węzłami.
- Zrozumienie komponentów Hadoop, instalacja komponentów Hadoop wraz z usługami MapR.
- Dostęp do danych w klastrze, w tym przez NFS. Zarządzanie usługami i węzłami.
- Zarządzanie danymi za pomocą woluminów, zarządzanie użytkownikami i grupami, zarządzanie i przypisywanie ról węzłom, komisjonowanie i dekomisjonowanie węzłów, administracja klastrem i monitorowanie wydajności, konfiguracja/analiza i monitorowanie metryk w celu monitorowania wydajności, konfiguracja i administracja zabezpieczeniami MapR.
- Zrozumienie i praca z M7 - natywnym magazynem dla tabel MapR.
- Konfiguracja i optymalizacja klastra dla optymalnej wydajności.
Aktualizacja klastra i integracja z innymi konfiguracjami:
- Aktualizacja wersji oprogramowania MapR i rodzaje aktualizacji.
- Konfiguracja klastra MapR do dostępu do klastra HDFS.
- Konfiguracja klastra MapR na Amazon Elastic Mapreduce.
Wszystkie powyższe tematy obejmują demonstracje i sesje praktyczne, aby uczestnicy mogli zdobyć praktyczne doświadczenie z technologią.
Wymagania
- Podstawowa wiedza na temat systemu plików Linux
- Podstawy Javy
- Znajomość Apache Hadoop (zalecane)
28 godzin
Opinie uczestników (1)
praktyczne aspekty działania, a także teoria były dobrze przedstawione przez Ajeya
Dominik Mazur - Capgemini Polska Sp. z o.o.
Szkolenie - Hadoop Administration on MapR
Przetłumaczone przez sztuczną inteligencję