Plan Szkolenia

Przegląd Big Data:

  • Czym jest Big Data
  • Dlaczego Big Data zyskuje na popularności
  • Studia przypadków Big Data
  • Charakterystyka Big Data
  • Rozwiązania do pracy z Big Data.

Hadoop i jego komponenty:

  • Czym jest Hadoop i jakie są jego komponenty.
  • Architektura Hadoop i charakterystyka danych, które może obsługiwać/przetwarzać.
  • Krótki przegląd historii Hadoop, firmy korzystające z niego i powody, dla których zaczęły go używać.
  • Struktura Hadoop i jej komponenty - szczegółowe omówienie.
  • Czym jest HDFS i operacje odczytu-zapisu w Hadoop Distributed File System.
  • Jak skonfigurować klaster Hadoop w różnych trybach - samodzielny/pseudo/wielowęzłowy klaster.

(Obejmuje to konfigurację klastra Hadoop w VirtualBox/KVM/VMware, konfigurację sieci, która wymaga starannego przeanalizowania, uruchamianie demonów Hadoop i testowanie klastra).

  • Czym jest framework MapReduce i jak działa.
  • Uruchamianie zadań MapReduce na klastrze Hadoop.
  • Zrozumienie replikacji, mirroringu i świadomości racków w kontekście klastrów Hadoop.

Planowanie klastra Hadoop:

  • Jak zaplanować swój klaster Hadoop.
  • Zrozumienie sprzętu i oprogramowania do planowania klastra Hadoop.
  • Zrozumienie obciążeń i planowanie klastra, aby uniknąć awarii i osiągnąć optymalną wydajność.

Czym jest MapR i dlaczego MapR:

  • Przegląd MapR i jego architektury.
  • Zrozumienie i działanie MapR Control System, MapR Volumes, snapshotów i mirrorów.
  • Planowanie klastra w kontekście MapR.
  • Porównanie MapR z innymi dystrybucjami i Apache Hadoop.
  • Instalacja MapR i wdrażanie klastra.

Konfiguracja i administracja klastrem:

  • Zarządzanie usługami, węzłami, snapshotami, mirrorami woluminów i zdalnymi klastrami.
  • Zrozumienie i zarządzanie węzłami.
  • Zrozumienie komponentów Hadoop, instalacja komponentów Hadoop wraz z usługami MapR.
  • Dostęp do danych w klastrze, w tym przez NFS. Zarządzanie usługami i węzłami.
  • Zarządzanie danymi za pomocą woluminów, zarządzanie użytkownikami i grupami, zarządzanie i przypisywanie ról węzłom, komisjonowanie i dekomisjonowanie węzłów, administracja klastrem i monitorowanie wydajności, konfiguracja/analiza i monitorowanie metryk w celu monitorowania wydajności, konfiguracja i administracja zabezpieczeniami MapR.
  • Zrozumienie i praca z M7 - natywnym magazynem dla tabel MapR.
  • Konfiguracja i optymalizacja klastra dla optymalnej wydajności.

Aktualizacja klastra i integracja z innymi konfiguracjami:

  • Aktualizacja wersji oprogramowania MapR i rodzaje aktualizacji.
  • Konfiguracja klastra MapR do dostępu do klastra HDFS.
  • Konfiguracja klastra MapR na Amazon Elastic Mapreduce.

Wszystkie powyższe tematy obejmują demonstracje i sesje praktyczne, aby uczestnicy mogli zdobyć praktyczne doświadczenie z technologią.

Wymagania

  • Podstawowa wiedza na temat systemu plików Linux
  • Podstawy Javy
  • Znajomość Apache Hadoop (zalecane)
 28 godzin

Liczba uczestników


Cena za uczestnika (netto)

Opinie uczestników (1)

Propozycje terminów

Powiązane Kategorie