Plan Szkolenia

Big Data Przegląd:

  • Czym jest Big Data
  • Dlaczego Big Data zyskuje na popularności
  • Studia przypadków Big Data
  • Charakterystyka Big Data
  • Rozwiązania do pracy nad Big Data.

Hadoop i jego składniki:

  • Czym jest Hadoop i jakie są jego komponenty.
  • Architektura i charakterystyka danych, które może obsługiwać / przetwarzać Hadoop.
  • Krótka historia Hadoop, firmy z niego korzystające i dlaczego zaczęły go używać.
  • Hadoop Struktura i jej komponenty - wyjaśnione szczegółowo.
  • Co to jest HDFS i odczyty - zapisy do Hadoop rozproszonego systemu plików.
  • Jak skonfigurować klaster Hadoop w różnych trybach - samodzielny / pseudo / wielowęzłowy.

(Obejmuje to konfigurację klastra Hadoop w VirtualBox / KVM / VMware, konfiguracje sieci, które należy dokładnie sprawdzić, uruchamianie Hadoop Daemonów i testowanie klastra).

  • Czym jest i jak działa framework Map Reduce.
  • Uruchamianie zadań Map Reduce na klastrze Hadoop.
  • Zrozumienie replikacji, mirroringu i świadomości Rack w kontekście klastrów Hadoop.

Planowanie klastra Hadoop:

  • Jak zaplanować klaster hadoop.
  • Zrozumienie sprzętu i oprogramowania w celu zaplanowania klastra hadoop.
  • Zrozumienie obciążeń i planowanie klastra w celu uniknięcia awarii i optymalnego działania.

Co to jest MapR i dlaczego MapR:

  • Przegląd MapR i jego architektury.
  • Zrozumienie i działanie systemu kontroli MapR, woluminów MapR, migawek i serwerów lustrzanych.
  • Planowanie klastra w kontekście MapR.
  • Porównanie MapR z innymi dystrybucjami i Apache Hadoop.
  • Instalacja MapR i wdrożenie klastra.

Konfiguracja i administracja klastrem:

  • Zarządzanie usługami, węzłami, migawkami, woluminami lustrzanymi i zdalnymi klastrami.
  • Zrozumienie i zarządzanie węzłami.
  • Zrozumienie komponentów Hadoop, instalacja komponentów Hadoop wraz z usługami MapR.
  • Dane Access w klastrze, w tym przez NFS Zarządzanie usługami i węzłami.
  • Zarządzanie danymi za pomocą wolumenów, zarządzanie użytkownikami i grupami, zarządzanie i przypisywanie ról do węzłów, uruchamianie i wycofywanie węzłów, administracja klastrem i monitorowanie wydajności, konfigurowanie / analizowanie i monitorowanie metryk w celu monitorowania wydajności, konfigurowanie i administrowanie bezpieczeństwem MapR.
  • Zrozumienie i praca z M7- Native storage dla tabel MapR.
  • Konfiguracja i dostrajanie klastra w celu uzyskania optymalnej wydajności.

Aktualizacja klastra i integracja z innymi konfiguracjami:

  • Aktualizacja wersji oprogramowania MapR i rodzaje aktualizacji.
  • Konfiguracja klastra Mapr w celu uzyskania dostępu do klastra HDFS.
  • Konfiguracja klastra MapR na Amazon Elastic Mapreduce.

Wszystkie powyższe tematy obejmują demonstracje i sesje ćwiczeniowe, aby uczestnicy mogli zapoznać się z technologią.

Wymagania

  • Podstawowa znajomość Linux FS
  • Podstawowa Java
  • Znajomość Apache Hadoop (zalecane)
 28 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (1)

Propozycje terminów

Powiązane Kategorie