Strona główna
Szkolenia Big Data
Szkolenia Hadoop
Administrator Training for Apache Hadoop - Plan Szkolenia

Administrator Training for Apache Hadoop - Plan Szkolenia

Grupa docelowa:

Kurs przeznaczony jest dla specjalistów IT szukających rozwiązania do przechowywania i przetwarzania dużych zestawów danych w środowisku systemów rozproszonych.

Wymagania:

Głęboka wiedza z zarządzania klastrami Hadoop.

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Plan Szkolenia

1: HDFS (17%)

Opisz funkcję demonów HDFS
Opisz normalną operację klastera Apache Hadoop, zarówno w zakresie przechowywania danych, jak i przetwarzania danych.
Zidentyfikuj obecne cechy systemów obliczeniowych, które motywują system taki jak Apache Hadoop.
Sklasyfikuj główne cele projektu HDFS
Na podstawie scenariusza zidentyfikuj odpowiednie zastosowanie HDFS Federation
Zidentyfikuj komponenty i demona klastera HDFS HA-Quorum
Zanalizuj rolę bezpieczeństwa HDFS (Kerberos)
Określ najlepszy wybór serializacji danych dla danego scenariusza
Opisz ścieżki odczytu i zapisu plików
Zidentyfikuj polecenia służące do manipulowania plikami w powłoce systemu plików Hadoop

2: YARN i MapReduce wersja 2 (MRv2) (17%)

Zrozum, jak aktualizacja klastera z Hadoop 1 do Hadoop 2 wpływa na ustawienia klastera
Zrozum, jak wdrożyć MapReduce v2 (MRv2 / YARN), w tym wszystkie demony YARN
Zrozum podstawową strategię projektowania MapReduce v2 (MRv2)
Określ, jak YARN obsługuje przydzielanie zasobów
Zidentyfikuj przepływ pracy zadania MapReduce uruchomionego w YARN
Określ, które pliki należy zmienić i jak, aby przenieść klaster z MapReduce wersja 1 (MRv1) na MapReduce wersja 2 (MRv2) uruchomionego w YARN.

3: Planowanie klastera Hadoop (16%)

Głównych punktów do rozważenia przy wyborze sprzętu i systemów operacyjnych do hostowania klastera Apache Hadoop.
Zanalizuj wybory dotyczące wyboru systemu operacyjnego
Zrozum regulację jądra i wymianę dysków
Na podstawie scenariusza i wzorca obciążenia zidentyfikuj konfigurację sprzętową odpowiednią dla scenariusza
Na podstawie scenariusza określ, jakie komponenty ekosystemu potrzebuje Twój klaster, aby spełnić SLA
Rozmiar klastera: na podstawie scenariusza i częstotliwości wykonania zidentyfikuj szczegóły dla obciążenia, w tym CPU, pamięć, przechowywanie, I/O dysku
Rozmiar i konfiguracja dysków, w tym JBOD w przeciwieństwie do RAID, SANów, wirtualizacji i wymagań dotyczących rozmiaru dysku w klastrze
Topologie sieciowe: zrozum użycie sieci w Hadoop (dla HDFS i MapReduce) i zaproponuj lub zidentyfikuj kluczowe komponenty projektowania sieci dla danego scenariusza

4: Instalacja i administrowanie klasterem Hadoop (25%)

Na podstawie scenariusza zidentyfikuj, jak klaster będzie obsługiwał awarie dysków i maszyn
Zanalizuj konfigurację rejestrowania i format pliku konfiguracyjnego rejestrowania
Zrozum podstawy monitorowania zdrowia klastera i metryk Hadoop
Zidentyfikuj funkcję i cel dostępnych narzędzi do monitorowania klastera
Bądź w stanie zainstalować wszystkie komponenty ekosystemu w CDH 5, w tym (ale nie ograniczone do): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive i Pig
Zidentyfikuj funkcję i cel dostępnych narzędzi do zarządzania systemem plików Apache Hadoop

5: Zasoby Management (10%)

Zrozum ogólne cele projektowe każdego z planistów Hadoop
Na podstawie scenariusza określ, jak planista FIFO przydziela zasoby klastera
Na podstawie scenariusza określ, jak planista Fair przydziela zasoby klastera w YARN
Na podstawie scenariusza określ, jak planista Capacity przydziela zasoby klastera

6: Monitorowanie i rejestrowanie (15%)

Zrozum funkcje i cechy możliwości zbierania metryk przez Hadoop
Zanalizuj interfejsy WWW NameNode i JobTracker
Zrozum, jak monitorować demony klastera
Zidentyfikuj i monitoruj zużycie procesora na węzłach głównych
Opisz, jak monitorować wymianę i przydział pamięci na wszystkich węzłach
Zidentyfikuj, jak wyświetlać i zarządzać plikami dziennika Hadoop
Interpretuj plik dziennika

Wymagania

Podstawowe umiejętności administracyjne Linux
Podstawowe umiejętności programowania

35 godzin

Liczba uczestników

Online

Classroom

Wybierz lokalizację

Wybierz miejsce szkolenia

cena netto za uczestnika

Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.

Administrator Training for Apache Hadoop - Plan Szkolenia - Booking

Imię i nazwisko *

Email *

Numer kontaktowy *

Stanowisko

Nazwa Firmy

Adres *

Miejscowość *

Województwo / Prowincja / Region

Kraj *

Kod pocztowy *

Data rozpoczęcia

Identyfikator podatkowy (np. NIP, PESEL)

Dates are subject to availability and take place between 09:00 and 16:00.

Metoda płatności *

Przelew bankowy (na podstawie faktury VAT lub pro formy)

Karta kredytowa / debetowa

Uwagi

Zgoda na opublikowanie certyfikatów

Jeżeli zaznaczona będzie ta opcja, to uczestnicy otrzymają możliwość publikowania swoich certyfikatów ukończenia szkolenia w katalogu NobleProg Certified Professional Catalogue.

Regulamin świadczenia usług szkoleniowych *

Jako osoba upoważniona do reprezentowania wymienionego powyżej Klienta, dokonuję rezerwacji wymienionych kursów lub usług, zgodnie z Warunkami Świadczenia Usług oraz Polityką Prywatności NobleProg.

Chcę dowiedzieć się więcej o nowych planach szkoleniowych, zniżkach i promocjach

Please read our Privacy Policy to find out how we use your data

Administrator Training for Apache Hadoop - Plan Szkolenia - Enquiry

Imię i nazwisko *

Email *

Numer kontaktowy *

Liczba uczestników

Nazwa Firmy

Adres firmowy

Jak chciał(a)byś wziąć udział w szkoleniu?

Lokalizacja Zamawiającego

Zdalne

Stacjonarne

Uwagi

Chcę dowiedzieć się więcej o nowych planach szkoleniowych, zniżkach i promocjach

Please read our Privacy Policy to find out how we use your data

Administrator Training for Apache Hadoop - Zapytanie o Konsultacje

Zapytanie o Konsultacje

Imię i nazwisko *

Numer kontaktowy *

Email *

Nazwa Firmy

Temat Konsultacji *

Cel Konsultacji

Długość Konsultacji

Liczba Konsultantów

Dogodny termin

Z kim będzie pracował konsultant?

Pilność Konsultacji *

Uwagi

Chcę dowiedzieć się więcej o nowych planach szkoleniowych, zniżkach i promocjach

Please read our Privacy Policy to find out how we use your data

Opinie uczestników (3)

Naprawdę cieszyłem się wieloma sesjami praktycznymi.

Jacek Pieczatka

Szkolenie - Administrator Training for Apache Hadoop

Przetłumaczone przez sztuczną inteligencję

Rzeczywiście cieszyłem się wieloma kompetencjami Trenera.

Grzegorz Gorski

Szkolenie - Administrator Training for Apache Hadoop

Przetłumaczone przez sztuczną inteligencję

Najbardziej podobały mi się przykłady z życia rzeczywistego podawane przez trenera.

Simon Hahn

Szkolenie - Administrator Training for Apache Hadoop

6450 PLN (Zdalne)

6950 PLN (Stacjonarne)

Szkolenia Powiązane

Programming with Big Data in R

21 godzin

Big Data to termin odnoszący się do rozwiązań przeznaczonych do przechowywania i przetwarzania dużych zbiorów danych. Opracowane początkowo przez Google rozwiązania Big Data ewoluowały i zainspirowały inne podobne projekty, z których wiele jest dostępnych jako open-source. R jest popularnym językiem programowania w branży finansowej.

Więcej...

Data Mining z wykorzystaniem R

14 godzin

Więcej...

Ekonometria: Eviews i Symulator Ryzyka

21 godzin

To prowadzone przez instruktora szkolenie na żywo (na miejscu lub zdalnie) jest przeznaczone dla każdego, kto chce nauczyć się i opanować podstawy analizy ekonometrycznej i modelowania.

Po zakończeniu tego szkolenia uczestnicy będą w stanie

Poznanie i zrozumienie podstaw ekonometrii.
Używaj Eviews i symulatorów ryzyka.

Więcej...

Prognozowanie w R

14 godzin

Ten szkolenie prowadzone przez instruktora, dostępne online lub na miejscu, jest przeznaczone dla analityków danych i profesjonalistów biznesowych o poziomie średnim, którzy chcą wykonywać prognozowanie szeregów czasowych oraz automatyzować przepływy danych za pomocą języka R.

Na koniec tego szkolenia uczestnicy będą w stanie:

Zrozumieć podstawy technik prognozowania w R.
Zastosować metodę gładzenia eksponencjalnego i modele ARIMA do analizy szeregów czasowych.
Wykorzystać pakiet ‘forecast’ do generowania dokładnych modeli prognozujących.
Automatyzować procesy prognozowania dla zastosowań biznesowych i badawczych.

Więcej...

Analityka HR dla organizacji publicznych

14 godzin

Ten szkolenie prowadzone przez instruktora (online lub stacjonarne) jest skierowane do profesjonalistów HR, którzy chcą wykorzystać metody analityczne do poprawy wydajności organizacji. Ten kurs obejmuje zarówno jakościowe, jak i ilościowe, empiryczne i statystyczne podejścia.

Format kursu

Interaktywne wykłady i dyskusje.
Dużo ćwiczeń i praktyki.

Opcje dostosowania kursu

Aby zapytać o dostosowane szkolenie dla tego kursu, skontaktuj się z nami, aby umówić.

Więcej...

Analiza Marketingowa w R

21 godzin

Uczestnicy

Business właściciele (kierownicy ds. marketingu, kierownicy ds. produktu, kierownicy ds. bazy klientów) i ich zespoły; specjaliści ds. analizy klientów.

Przegląd

Kurs śledzi cykl życia klienta od pozyskiwania nowych klientów, zarządzania istniejącymi klientami w celu uzyskania rentowności, utrzymania dobrych klientów i wreszcie zrozumienia, którzy klienci nas opuszczają i dlaczego. Będziemy pracować z prawdziwymi (jeśli anonimowymi) danymi z różnych branż, w tym telekomunikacji, ubezpieczeń, mediów i zaawansowanych technologii.

Format

Szkolenie prowadzone przez instruktora w trakcie pięciu półdniowych sesji z ćwiczeniami w klasie oraz zadaniami domowymi. Szkolenie może być prowadzone w klasie lub na odległość (online).

Więcej...

R dla analityków danych i naukowców

7 godzin

Uczestnicy

menedżerowie
deweloperzy
naukowcy
studenci

Format kursu

instruktaż i dyskusja online LUB warsztaty bezpośrednie

Więcej...

Wprowadzenie do R

21 godzin

R to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R znalazł również zwolenników wśród statystyków, inżynierów i naukowców bez umiejętności programowania komputerowego, którzy uważają go za łatwy w użyciu. Jego popularność wynika z rosnącego wykorzystania eksploracji danych do różnych celów, takich jak ustalanie cen reklam, szybsze znajdowanie nowych leków lub dostrajanie modeli finansowych. R posiada szeroką gamę pakietów do eksploracji danych.

Ten kurs obejmuje manipulowanie obiektami w R, w tym odczytywanie danych, uzyskiwanie dostępu do pakietów R, pisanie funkcji R i tworzenie wykresów informacyjnych. Kurs uczy, jak korzystać z oprogramowania R (https://www.r-project.org) zarówno w wierszu poleceń, jak i w graficznym interfejsie użytkownika (GUI).

Więcej...

R

21 godzin

Więcej...

Sieci Neuronowe w R

14 godzin

Ten kurs jest wprowadzeniem do stosowania sieci neuronowych w rzeczywistych problemach przy użyciu oprogramowania R-project.

Więcej...

Advanced R Programming

7 godzin

Kurs jest przeznaczony dla data scientistów i statystyków, którzy już posiadają podstawowe umiejętności kodowania w języku R i kod R oraz potrzebują zaawansowanych umiejętności kodowania w R.

Celem jest zapewnienie uczestnikom praktycznego zaawansowanego kursu programowania w R, którzy chcą stosować te metody w pracy.

Do przykładów używanych są przykłady z branży, aby uczynić szkolenie rzetelne dla uczestników.

Więcej...

Analiza statystyczna przy użyciu SPSS

21 godzin

To prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla początkujących i średnio zaawansowanych profesjonalistów, którzy chcą przeprowadzić analizę statystyczną przy użyciu SPSS w celu dokładnej interpretacji danych, przeprowadzenia złożonych testów statystycznych i wygenerowania znaczących spostrzeżeń.

Pod koniec tego szkolenia uczestnicy będą mogli

Poruszać się po interfejsie SPSS i efektywnie zarządzać zestawami danych.
Przeprowadzać opisowe i wnioskowe analizy statystyczne.
Przeprowadzać testy t, ANOVA, MANOVA, regresję i analizy korelacji.
Stosować testy nieparametryczne, analizę składowych głównych i analizę czynnikową w celu zaawansowanej interpretacji danych.

Więcej...

Analiza pozyskiwania talentów

14 godzin

Trening ten prowadzony przez instruktora (online lub na miejscu) i skierowany jest do profesjonalistów HR oraz specjalistów od rekrutacji, którzy chcą użyć metod analitycznych do poprawy wydajności organizacji. Kurs obejmuje zarówno podejścia jakościowe, jak i ilościowe, empiryczne i statystyczne.

Format kursu

Interaktywne wykłady i dyskusje.
Wiele ćwiczeń i praktyki.

Opcje dostosowania kursu

Aby zapytać o dostosowany trening dla tego kursu, skontaktuj się z nami w celu uzgodnienia.

Więcej...

Wprowadzenie do wizualizacji danych za pomocą Tidyverse i R

7 godzin

Grupa docelowa

Format kursu

Po zakończeniu tego szkolenia uczestnicy będą mogli:

W tym szkoleniu prowadzonym przez instruktora uczestnicy nauczą się manipulowania i wizualizacji danych za pomocą narzędzi zawartych w Tidyverse.

Tidyverse to zbiór wszechstronnych pakietów R służących do czyszczenia, przetwarzania, modelowania i wizualizacji danych. Niektóre z pakietów zawartych w zbiorze to: ggplot2, dplyr, tidyr, readr, purrr oraz tibble.

Początkujący w języku R
Początkujący w analizie danych i wizualizacji danych

Część wykładu, część dyskusji, ćwiczenia i intensywne praktyczne ćwiczenia

Wykonanie analizy danych i stworzenie przyjemnych wizualizacji
Wnioskowanie użytecznych wniosków z różnych zestawów danych próbek
Filtrowanie, sortowanie i podsumowywanie danych w celu odpowiedzi na pytania eksploracyjne
Przekształcanie przetworzonych danych w informacyjne wykresy liniowe, wykresy słupkowe i histogramy
Importowanie i filtrowanie danych z różnych źródeł danych, w tym Excel, CSV i plików SPSS

Więcej...

Tworzenie aplikacji internetowych w R z Shiny

7 godzin

Opis:

Jest to kurs przeznaczony dla użytkowników R, którzy chcą tworzyć aplikacje webowe bez konieczności uczenia się skryptów dla różnych przeglądarek.

Cel:

Obejmuje podstawy działania aplikacji Shiny.

Obejmuje wszystkie powszechnie używane funkcje wejścia/wyjścia/wyświetlania/panelowania z biblioteki Shiny.

Więcej...

Administrator Training for Apache Hadoop - Plan Szkolenia

Grupa docelowa:

Wymagania:

Plan Szkolenia

1: HDFS (17%)

2: YARN i MapReduce wersja 2 (MRv2) (17%)

3: Planowanie klastera Hadoop (16%)

4: Instalacja i administrowanie klasterem Hadoop (25%)

5: Zasoby Management (10%)

6: Monitorowanie i rejestrowanie (15%)

Wymagania

Opinie uczestników (3)

Jacek Pieczatka

Szkolenie - Administrator Training for Apache Hadoop

Grzegorz Gorski

Szkolenie - Administrator Training for Apache Hadoop

Simon Hahn

Szkolenie - Administrator Training for Apache Hadoop

Propozycje terminów

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Powiązane Kategorie

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Administrator Training for Apache Hadoop - Plan Szkolenia

Grupa docelowa:

Wymagania:

Plan Szkolenia

1: HDFS (17%)

2: YARN i MapReduce wersja 2 (MRv2) (17%)

3: Planowanie klastera Hadoop (16%)

4: Instalacja i administrowanie klasterem Hadoop (25%)

5: Zasoby Management (10%)

6: Monitorowanie i rejestrowanie (15%)

Wymagania

Opinie uczestników (3)

Jacek Pieczatka

Szkolenie - Administrator Training for Apache Hadoop

Grzegorz Gorski

Szkolenie - Administrator Training for Apache Hadoop

Simon Hahn

Szkolenie - Administrator Training for Apache Hadoop

Propozycje terminów

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Szkolenia Powiązane

Programming with Big Data in R

Data Mining z wykorzystaniem R

Ekonometria: Eviews i Symulator Ryzyka

Prognozowanie w R

Analityka HR dla organizacji publicznych

Analiza Marketingowa w R

Uczestnicy

Przegląd

Format

R dla analityków danych i naukowców

Uczestnicy

Format kursu

Wprowadzenie do R

R

Sieci Neuronowe w R

Advanced R Programming

Analiza statystyczna przy użyciu SPSS

Analiza pozyskiwania talentów

Wprowadzenie do wizualizacji danych za pomocą Tidyverse i R

Tworzenie aplikacji internetowych w R z Shiny

Opis:

Cel:

Powiązane Kategorie

Hadoop

Statystyka

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites