Big Data Hadoop Analyst Training - Plan Szkolenia
Big Data Analyst Training to praktyczny kurs, który polecany jest każdemu, kto chce w przyszłości zostać ekspertem Data Scientist. Kurs skupia sie na aspektach potrzebnych do pracy nowoczesnego analityka w technologii Big Data. W trakcie kursu prezentowane są narzędzia pozwalające na uzyskanie dostępu, zmianę, transformację i analizę skomplikowanych struktur danych umieszczonych w klastrze Hadoop. W trakcie kursu będą poruszane tematy w ramach technologii Hadoop Ecosystem (Pig, Hive, Impala, ELK i inne).
- Funkcjonaloność narzędzi Pig, Hive, Impala, ELK, pozwalające na zbieranie danych, zapisywanie wyników i analitykę.
- Jak Pig, Hive i Impala mogą podnieść wydajność typowych i codziennych zadań analitycznych.
- Wykonywanie w czasie rzeczywistym interaktywnych analiz ogromnych zbiorów danych aby uzyskać cenne i wartościowe elementy dla biznesu oraz jak interpretować wnioski.
- Wykonywanie złożonych zapytań na bardzo dużych wolumenach danych.
Plan Szkolenia
-
Podstawy Hadoop.
-
Wprowadzenie do Pig.
-
Podstawowa analiza danych z wykorzystaniem narzędzia Pig.
-
Procesowanie złożonych danych z Pig.
-
Operacje na wielu zbiorach danych z wykorzytaniem Pig.
-
Rozwiązywanie problemów i optymalizacja Pig.
-
Wprowadzenie do Hive, Impala, ELK.
-
Wykonywanie zapytań w Hive, Impala, ELK.
-
Zarządzanie danymi w Hive.
-
Przechowywanie danych i wydajność.
-
Analizy z wykorzystaniem narzędzi Hive i Impala.
-
Praca z narzędziem Impala i ELK.
-
Analiza tekstu i złożonych typów danych.
-
Optymalizacja Hive, Pig, Impala, ELK.
-
Interoperacyjność i przepływ pracy.
-
Pytania, zadania, certyfikacja.
Wymagania
Kurs ten jest sugerowany dla wszystkich analityków danych, analityków biznesowych, programistów i administratorów, którzy mają doświadczenie z SQL lub/i językami skryptowymi. Przed tym szkoleniem nie jest wymagana wiedza na temat Apache Hadoop.
Szkolenia zdalne są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.
Big Data Hadoop Analyst Training - Plan Szkolenia - Booking
Big Data Hadoop Analyst Training - Plan Szkolenia - ZAPYTANIE O SZKOLENIE
Big Data Hadoop Analyst Training - Zapytanie o Konsultacje
Opinie uczestników (1)
Część praktyczna.
Arkadiusz Iwaszko
Szkolenie - Big Data Hadoop Analyst Training
Szkolenia Powiązane
Hortonworks Data Platform (HDP) for Administrators
21 godzinTen prowadzony przez instruktora trening na żywo w Polsce (online lub na miejscu) wprowadza Hortonworks Data Platform (HDP) i przeprowadza uczestników przez wdrożenie rozwiązania Spark + Hadoop.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
-
Wykorzystaj Hortonworks do niezawodnego uruchamiania Hadoop na dużą skalę.
Ujednolicenie zabezpieczeń, zarządzania i możliwości operacyjnych Hadoop ze zwinnymi analitycznymi przepływami pracy Spark.
Wykorzystaj Hortonworks do badania, walidacji, certyfikacji i wsparcia każdego z komponentów projektu Spark.
Przetwarzanie różnych typów danych, w tym ustrukturyzowanych, nieustrukturyzowanych, w ruchu i w spoczynku.
Apache Ambari: Efficiently Manage Hadoop Clusters
21 godzinApache Ambari to platforma zarządzania typu open-source do udostępniania, zarządzania, monitorowania i zabezpieczania klastrów Apache Hadoop.
W tym instruktażowym szkoleniu na żywo uczestnicy poznają narzędzia i praktyki zarządzania dostarczane przez Ambari w celu skutecznego zarządzania klastrami Hadoop.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Konfiguracja klastra Big Data na żywo przy użyciu Ambari
- Zastosowanie zaawansowanych funkcji i funkcjonalności Ambari w różnych przypadkach użycia
- Płynne dodawanie i usuwanie węzłów w razie potrzeby
- Poprawa wydajności klastra Hadoop poprzez dostrajanie i modyfikowanie
Publiczność
- DevOps
- Administratorzy systemów
- DBA
- Hadoop Specjaliści ds. testowania
Format kursu
- Część wykładu, część dyskusji, ćwiczenia i ciężka praktyka praktyczna
Impala for Business Intelligence
21 godzinCloudera Impala to silnik zapytań typu open source do masowego przetwarzania równoległego (MPP) SQL dla klastrów Apache Hadoop.
Impala umożliwia użytkownikom wysyłanie zapytań o niskim opóźnieniu SQL do danych przechowywanych w rozproszonym systemie plików Hadoop i Apache Hbase bez konieczności przenoszenia lub przekształcania danych.
Publiczność
Ten kurs jest skierowany do analityków i badaczy danych przeprowadzających analizy danych przechowywanych w Hadoop za pośrednictwem narzędzi Business Intelligence lub SQL.
Po tym kursie uczestnicy będą w stanie
- Wydobywanie istotnych informacji z klastrów Hadoop za pomocą Impala.
- Pisanie konkretnych programów w celu ułatwienia analizy biznesowej w Impala SQL Dialect.
- Rozwiązywanie problemów z Impalą.
Data Analysis with Hive/HiveQL
7 godzinTen kurs obejmuje sposób korzystania z języka Hive SQL (AKA: Hive HQL, SQL on Hive, HiveQL) dla osób, które wyodrębniają dane z Hive
Administrator Training for Apache Hadoop
35 godzinGłównym celem szkolenia jest zdobycie wiedzy z administracji systemem Apache Hadoop w środowiskach MapReduce oraz YARN na poziomie zaawansowanym. Tematyka szkolenia dotyczy w głównej mierze architektury systemu Hadoop, a w szczególności systemu plików HDFS oraz modeli programistycznych MapReduce i YARN oraz zagadnień związanych z planowaniem, instalacją, konfiguracją, administracją, zarządzaniem i monitorowaniem klastra systemu Hadoop. Pozostałe zagadnienia związane z tematyką BigData takie jak HBase, Cassandra, Impala, Pig, Hiver oraz Sqoop są również omówione, choć pobieżnie. Kurs przeznaczony jest w głównej mierze do specjalistów z branży IT, którzy chcą przygotować się i zdać egzamin CCAH (Cloudera Certified administrator for Apache Hadoop).
Big Data Analytics in Health
21 godzinAnalityka Big Data obejmuje proces badania dużych ilości różnorodnych zestawów danych w celu odkrycia korelacji, ukrytych wzorców i innych przydatnych informacji.
Branża medyczna dysponuje ogromnymi ilościami złożonych, heterogenicznych danych medycznych i klinicznych. Zastosowanie analizy dużych zbiorów danych na danych dotyczących zdrowia stanowi ogromny potencjał w uzyskiwaniu wglądu w celu poprawy świadczenia opieki zdrowotnej. Jednak ogrom tych zbiorów danych stanowi ogromne wyzwanie w analizach i praktycznych zastosowaniach w środowisku klinicznym.
W tym prowadzonym przez instruktora szkoleniu na żywo (zdalnie) uczestnicy dowiedzą się, jak przeprowadzić analizę dużych zbiorów danych w zakresie zdrowia, przechodząc przez serię praktycznych ćwiczeń laboratoryjnych na żywo.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Instalowanie i konfigurowanie narzędzi do analizy dużych zbiorów danych, takich jak Hadoop MapReduce i Spark.
- Zrozumienie charakterystyki danych medycznych
- Stosowanie technik big data do przetwarzania danych medycznych
- Badanie systemów i algorytmów big data w kontekście aplikacji zdrowotnych
Publiczność
- Programiści
- Naukowcy ds. danych
Format kursu
- Część wykładu, część dyskusji, ćwiczenia i ciężka praktyka praktyczna.
Uwaga
- Aby zamówić niestandardowe szkolenie dla tego kursu, skontaktuj się z nami.
Datameer for Data Analysts
14 godzinDatameer to platforma analityczno-biznesowa oparta na Hadoop. Umożliwia użytkownikom końcowym dostęp, eksplorację i korelację dużych, ustrukturyzowanych, częściowo ustrukturyzowanych i nieustrukturyzowanych danych w łatwy w użyciu sposób.
W tym prowadzonym przez instruktora szkoleniu na żywo uczestnicy dowiedzą się, jak korzystać z Datameer, aby pokonać stromą krzywą uczenia się Hadoop, przechodząc przez konfigurację i analizę szeregu dużych źródeł danych.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Tworzenie, zarządzanie i interaktywna eksploracja korporacyjnego jeziora danych
- [Hurtownie danych analityki biznesowej, transakcyjne bazy danych i inne magazyny analityczne.
- Korzystanie z interfejsu użytkownika arkusza kalkulacyjnego do projektowania kompleksowych potoków przetwarzania danych
- [Wstępnie wbudowane funkcje do eksploracji złożonych relacji danych
- Korzystanie z kreatorów "przeciągnij i upuść" do wizualizacji danych i tworzenia pulpitów nawigacyjnych
- korzystanie z tabel, wykresów, grafów i map do analizowania wyników zapytań
Publiczność
- Analitycy danych
Format kursu
- Część wykładu, część dyskusji, ćwiczenia i ciężka praktyka praktyczna
Big Data Hadoop Administration Training
21 godzinSzkolenie pozwoli w pełni zapoznać się i zrozumieć wszystkie niezbędne kroki do obsługi i utrzymywania klastra Hadoop. Dostarcza wiedzę począwszy od zagadnień związanych ze specyfikacją sprzętu, instalacją i konfiguracją systemu, aż do zagadnien związanych z równoważeniem obciążenia, strojeniem, diagnozowaniem i rozwiązywaniu problemów przy wdrożeniu.
Kurs dedykowany administratorom, którzy będą tworzyć lub/i utrzymywać klaster Hadoop.
Materiały szkoleniowe
- Materiały szkoleniowe Student Guide
- Materiały szkoleniowe Lab Guide
Hadoop For Administrators
21 godzinApache Hadoop to najpopularniejszy framework do przetwarzania Big Data na klastrach serwerów. Podczas tego trzydniowego (opcjonalnie czterodniowego) kursu uczestnicy dowiedzą się o korzyściach biznesowych i przypadkach użycia Hadoop i jego ekosystemu, jak zaplanować wdrożenie i rozwój klastra, jak zainstalować, utrzymywać, monitorować, rozwiązywać problemy i optymalizować Hadoop. Uczestnicy przećwiczą również masowe ładowanie danych klastra, zapoznają się z różnymi dystrybucjami Hadoop oraz przećwiczą instalację i zarządzanie narzędziami ekosystemu Hadoop. Kurs kończy się dyskusją na temat zabezpieczania klastra za pomocą Kerberos.
“… Materiały były bardzo dobrze przygotowane i dokładnie omówione. Laboratorium było bardzo pomocne i dobrze zorganizowane” — Andrew Nguyen, główny inżynier integracji DW, Microsoft Reklama online
Publiczność
Hadoop Administratorzy
Format
Wykłady i praktyczne laboratoria, około 60% wykładów, 40% laboratoriów.
Hadoop for Developers (4 days)
28 godzinApache Hadoop to najpopularniejszy framework do przetwarzania Big Data na klastrach serwerów. Ten kurs wprowadzi programistę w różne komponenty (HDFS, MapReduce, Pig, Hive i HBase) ekosystemu Hadoop.
Advanced Hadoop for Developers
21 godzinApache Hadoop to jeden z najpopularniejszych frameworków do przetwarzania Big Data na klastrach serwerów. Ten kurs zagłębia się w zarządzanie danymi w HDFS, zaawansowane Pig, Hive i HBase. Te zaawansowane techniki programowania będą korzystne dla doświadczonych programistów Hadoop.
Odbiorcy: deweloperzy
Czas trwania: trzy dni
Format: wykłady (50%) i praktyczne laboratoria (50%).
Hadoop for Developers and Administrators
21 godzinHadoop jest najpopularniejszym Big Data frameworkiem przetwarzania danych.
Hadoop for Project Managers
14 godzinPodczas tego szkolenia prowadzonego przez instruktora w Polsce uczestnicy poznają podstawowe elementy ekosystemu Hadoop i dowiedzą się, w jaki sposób technologie te mogą być wykorzystywane do rozwiązywania problemów na dużą skalę. Ucząc się tych podstaw, uczestnicy poprawią swoją zdolność do komunikowania się z programistami i wdrożeniowcami tych systemów, a także naukowcami i analitykami danych, którzy biorą udział w wielu projektach IT.
Publiczność
- Menedżerowie projektów, którzy chcą wdrożyć Hadoop do istniejącej infrastruktury programistycznej lub IT
- Menedżerowie projektów, którzy muszą komunikować się z wielofunkcyjnymi zespołami, w tym inżynierami Big Data, analitykami danych i analitykami biznesowymi
Hadoop Administration on MapR
28 godzinPubliczność:
Kurs ten ma na celu demistyfikację technologii big data/hadoop i pokazanie, że nie jest ona trudna do zrozumienia.
Hadoop with Python
28 godzinHadoop to popularny framework do przetwarzania Big Data. Python to język programowania wysokiego poziomu słynący z przejrzystej składni i czytelności kodu.
W tym prowadzonym przez instruktora szkoleniu na żywo uczestnicy dowiedzą się, jak pracować z Hadoop, MapReduce, Pig i Spark przy użyciu Python, przechodząc przez wiele przykładów i przypadków użycia.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Zrozumienie podstawowych pojęć związanych z Hadoop, MapReduce, Pig i Spark
- Używanie Python z rozproszonym systemem plików Hadoop (HDFS), MapReduce, Pig i Spark
- Używanie Snakebite do programowego dostępu do HDFS w ramach Python.
- Używanie mrjob do pisania zadań MapReduce w Python.
- Pisanie programów Spark za pomocą Python
- Rozszerzanie funkcjonalności pig przy użyciu Python UDF
- Zarządzanie zadaniami MapReduce i skryptami Pig przy użyciu Luigi
Publiczność
- Programiści
- Specjaliści IT
Format kursu
- Część wykładu, część dyskusji, ćwiczenia i ciężka praktyka praktyczna