Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Plan Szkolenia
Przegląd: Big Data
- Co to jest Big Data
- Dlaczego Big Data zyskuje na popularności
- Studia przypadku Big Data
- Cechy Big Data
- Rozwiązania do pracy z Big Data.
Hadoop i jego komponenty:
- Co to jest Hadoop i jakie są jego komponenty.
- Architektura Hadoop i cechy danych, które może obsługiwać/Przetwarzać.
- Krótki przegląd historii Hadoop, firm używających go i dlaczego zaczęły go stosować.
- Szczegółowe omówienie ramki Hadoop i jego komponentów.
- Co to jest HDFS i czytanie – zapisywanie do rozproszonego systemu plików Hadoop.
- Jak skonfigurować klastr Hadoop w różnych trybach – Stand-alone/Pseudo/Multi Node cluster.
(To obejmuje skonfigurowanie klastru Hadoop w VirtualBox/KVM/VMware, konfiguracje sieciowe, które należy dokładnie sprawdzić, uruchamianie demonów Hadoop i testowanie klastru).
- Co to jest ramka Map Reduce i jak działa.
- Uruchamianie zadań Map Reduce na klastrze Hadoop.
- Zrozumienie replikacji, lustrzania i świadomości szuflady w kontekście klastrów Hadoop.
Planowanie klastru Hadoop:
- Jak zaplanować klastr Hadoop.
- Zrozumienie sprzętu-oprogramowania do zaplanowania klastru Hadoop.
- Zrozumienie obciążeń i planowanie klastru w celu uniknięcia awarii i optymalnego działania.
Co to jest MapR i dlaczego MapR:
- Przegląd MapR i jego architektury.
- Zrozumienie i działanie MapR Control System, MapR Volumes, snapshotów i luster.
- Planowanie klastru w kontekście MapR.
- Porównanie MapR z innymi dystrybucjami i Apache Hadoop.
- Instalacja MapR i wdrażanie klastru.
Konfiguracja i administracja klastru:
- Zarządzanie usługami, węzłami, snapshotami, lustrzanymi woluminami i zdalnymi klastrami.
- Zrozumienie i zarządzanie węzłami.
- Zrozumienie komponentów Hadoop, instalowanie komponentów Hadoop wraz z usługami MapR.
- Accessowanie danych w klastrze, w tym za pomocą NFS Zarządzanie usługami i węzłami.
- Zarządzanie danymi za pomocą woluminów, zarządzanie użytkownikami i grupami, zarządzanie i przypisywanie ról do węzłów, komisjonowanie/dekomisjonowanie węzłów, administracja klastrami i monitorowanie wydajności, konfigurowanie/analizowanie i monitorowanie metryk w celu monitorowania wydajności, konfigurowanie i administrowanie bezpieczeństwem MapR.
- Zrozumienie i praca z M7 – natywnym magazynowaniem dla tabel MapR.
- Konfiguracja i dostrajanie klastru dla optymalnej wydajności.
Aktualizacja klastru i integracja z innymi ustawieniami:
- Aktualizowanie wersji oprogramowania MapR i typy aktualizacji.
- Konfigurowanie klastru MapR do dostępu do klastru HDFS.
- Uruchamianie klastru MapR na Amazon Elastic Mapreduce.
Wszystkie powyższe tematy obejmują demonstracje i sesje praktyczne dla uczących się, aby mieli doświadczenie z technologią.
Wymagania
- Podstawowa wiedza o Linux FS
- Podstawowe Java
- Wiedza o Apache Hadoop (polecane)
28 godzin
Opinie uczestników (1)
praktyczne aspekty działania, a także teoria były dobrze przedstawione przez Ajeya
Dominik Mazur - Capgemini Polska Sp. z o.o.
Szkolenie - Hadoop Administration on MapR
Przetłumaczone przez sztuczną inteligencję