Plan Szkolenia
Wprowadzenie
- Wprowadzenie do obliczeń w chmurze i rozwiązań dotyczących dużych danych (big data)
- Przegląd funkcji i architektury Apache Hadoop
Instalacja Hadoop
- Planowanie klastra Hadoop (lokalnie, w chmurze itp.)
- Wybór systemu operacyjnego i dystrybucji Hadoop
- Alokacja zasobów (sprzęt, sieć itp.)
- Pobieranie i instalowanie oprogramowania
- Skalowanie klastra w celu zapewnienia elastyczności
Praca z HDFS
- Zrozumienie Hadoop Distributed File System (HDFS)
- Przegląd referencji poleceń HDFS
- Dostęp do HDFS
- Wykonywanie podstawowych operacji na plikach w HDFS
- Korzystanie z S3 jako uzupełnienia HDFS
Przegląd MapReduce
- Zrozumienie przepływu danych w frameworku MapReduce
- Mapowanie, mieszanie, sortowanie i redukcja
- Demo: Obliczanie najwyższych wynagrodzeń
Praca z YARN
- Zrozumienie zarządzania zasobami w Hadoop
- Praca z ResourceManager, NodeManager i Application Master
- Harmonogramowanie zadań pod YARN
- Harmonogramowanie dla dużej liczby węzłów i klastrów
- Demo: Harmonogramowanie zadań
Integracja Hadoop z Spark
- Konfigurowanie magazynu dla Spark (HDFS, Amazon S3, NoSQL itp.)
- Zrozumienie Resilient Distributed Datasets (RDDs)
- Tworzenie RDD
- Implementowanie transformacji RDD
- Demo: Implementacja programu wyszukiwania tekstowego dla tytułów filmów
Zarządzanie klastrem Hadoop
- Monitorowanie Hadoop
- Bezpieczeństwo klastra Hadoop
- Dodawanie i usuwanie węzłów
- Uruchamianie testu wydajnościowego
- Optymalizacja wydajności klastra Hadoop
- Kopie zapasowe, odzyskiwanie i planowanie ciągłości biznesowej
- Zapewnienie wysokiej dostępności (HA)
Aktualizacja i migracja klastra Hadoop
- Ocena wymagań obciążenia
- Aktualizacja Hadoop
- Przenoszenie z lokalnego na chmurowe i vice-versa
- Odzyskiwanie po awariach
Rozwiązywanie problemów
Podsumowanie i wnioski
Wymagania
- Dosświadczenie w administracji systemów
- Dosperience z linią poleceń Linux
- Zrozumienie pojęć dotyczących dużych danych (big data)
Grupa docelowa
- Administratorzy systemów
- Bazy danych (DBA)
Opinie uczestników (5)
Doświadczenie praktyczne trenera, nie koloryzowanie omawianego rozwiązania ale też nie wprowadzanie negatywnego nacechowania. Mam poczucie, że trener przygotowuje mnie do realnego i praktycznego wykorzystania narzędzia - tych cennych szczegółów nie ma zazwyczaj w książkach.
Krzysztof Miodek - Krajowy Rejestr Dlugow Biuro Informacji Gospodarczej S.A.
Szkolenie - Apache Spark Fundamentals
Przykłady w czasie rzeczywistym
Ahmet Bolat - Accenture Industrial SS
Szkolenie - Python, Spark, and Hadoop for Big Data
Przetłumaczone przez sztuczną inteligencję
bardzo interaktywny...
Richard Langford
Szkolenie - SMACK Stack for Data Science
Przetłumaczone przez sztuczną inteligencję
Wystarczająca praktyka, trener jest kompetentny
Chris Tan
Szkolenie - A Practical Introduction to Stream Processing
Przetłumaczone przez sztuczną inteligencję
Dowiedz się o Spark Streaming, Databricks i AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Szkolenie - Apache Spark in the Cloud
Przetłumaczone przez sztuczną inteligencję