Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Plan Szkolenia
Wprowadzenie
- Wprowadzenie do chmury obliczeniowej i rozwiązań Big Data
- Przegląd funkcji i architektury Apache Hadoop
Konfiguracja Hadoop
- Planowanie klastra Hadoop (lokalnie, w chmurze itp.)
- Wybór systemu operacyjnego i dystrybucji Hadoop
- Provisioning zasobów (sprzęt, sieć itp.)
- Pobieranie i instalacja oprogramowania
- Dostosowanie rozmiaru klastra pod kątem elastyczności
Praca z HDFS
- Zrozumienie Hadoop Distributed File System (HDFS)
- Przegląd referencji poleceń HDFS
- Dostęp do HDFS
- Wykonywanie podstawowych operacji na plikach w HDFS
- Użycie S3 jako uzupełnienia HDFS
Przegląd MapReduce
- Zrozumienie przepływu danych w frameworku MapReduce
- Map, Shuffle, Sort i Reduce
- Demo: Obliczanie najwyższych wynagrodzeń
Praca z YARN
- Zrozumienie zarządzania zasobami w Hadoop
- Praca z ResourceManager, NodeManager, Application Master
- Planowanie zadań w YARN
- Planowanie dla dużych liczby węzłów i klastrów
- Demo: Planowanie zadań
Integracja Hadoop ze Spark
- Konfiguracja magazynu dla Spark (HDFS, Amazon, S3, NoSQL itp.)
- Zrozumienie Resilient Distributed Datasets (RDDs)
- Tworzenie RDD
- Implementacja transformacji RDD
- Demo: Implementacja programu wyszukiwania tekstu w tytułach filmów
Zarządzanie klastrem Hadoop
- Monitorowanie Hadoop
- Zabezpieczanie klastra Hadoop
- Dodawanie i usuwanie węzłów
- Przeprowadzanie testów wydajnościowych
- Dostrajanie klastra Hadoop w celu optymalizacji wydajności
- Tworzenie kopii zapasowych, odzyskiwanie i planowanie ciągłości działania
- Zapewnianie wysokiej dostępności (HA)
Aktualizacja i migracja klastra Hadoop
- Ocena wymagań dotyczących obciążenia
- Aktualizacja Hadoop
- Przenoszenie z lokalnego środowiska do chmury i odwrotnie
- Odzyskiwanie po awariach
Rozwiązywanie problemów
Podsumowanie i zakończenie
Wymagania
- Doświadczenie w administracji systemami
- Doświadczenie z linią poleceń Linux
- Zrozumienie koncepcji big data
Odbiorcy
- Administratorzy systemów
- Administratorzy baz danych
35 godzin
Opinie uczestników (2)
ankieta przed szkoleniem i zastosowanie jej wynikow.
Krzysztof - Alfa Laval
Szkolenie - Python and Spark for Big Data (PySpark)
Zaangażowanie i chęć wyjaśnienia tematów pobocznych.