Strona główna
Szkolenia Big Data
Programowanie z Big Data w R - Plan Szkolenia

Programowanie z Big Data w R - Plan Szkolenia

Big Data to termin odnoszący się do rozwiązań przeznaczonych do przechowywania i przetwarzania dużych zbiorów danych. Rozwiązania te, początkowo opracowane przez Google, ewoluowały i zainspirowały inne podobne projekty, z których wiele jest dostępnych jako oprogramowanie open-source. R jest popularnym językiem programowania w branży finansowej.

Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.

Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.

Plan Szkolenia

Wprowadzenie do programowania Big Data w R (bpdR)

Konfiguracja środowiska do korzystania z pbdR
Zakres i dostępne narzędzia w pbdR
Pakiety często używane z Big Data obok pbdR

Interfejs Przekazywania Wiadomości (MPI)

Korzystanie z pbdR MPI 5
Przetwarzanie równoległe
Komunikacja punkt-punkt
Wysyłanie macierzy
Sumowanie macierzy
Komunikacja zbiorowa
Sumowanie macierzy z użyciem Reduce
Scatter / Gather
Inne komunikaty MPI

Macierze rozproszone

Tworzenie rozproszonej macierzy diagonalnej
SVD rozproszonej macierzy
Budowanie rozproszonej macierzy równolegle

Zastosowania statystyczne

Całkowanie Monte Carlo
Odczyt zbiorów danych
Odczyt na wszystkich procesach
Rozgłaszanie z jednego procesu
Odczyt partycjonowanych danych
Regresja rozproszona
Rozproszony Bootstrap

21 godzin

Liczba uczestników

Online

Stacjonarne

Wybierz lokalizację

Wybierz miejsce szkolenia

Cena za uczestnika (netto)

Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.

Programowanie z Big Data w R - Plan Szkolenia - Rezerwacja

Imię i nazwisko *

E-mail *

Numer kontaktowy *

Stanowisko

Nazwa Firmy

Adres *

Miejscowość *

Województwo / Prowincja / Region

Kraj *

Kod pocztowy *

Data rozpoczęcia

Identyfikator podatkowy (np. NIP, PESEL)

Daty są podległe dostępności i odbywają się między 09:00 a 16:00.

Metoda płatności *

Przelew bankowy (na podstawie faktury VAT lub pro formy)

Karta kredytowa / debetowa

Uwagi

Regulamin świadczenia usług szkoleniowych *

Jako osoba upoważniona do reprezentowania wymienionego powyżej Klienta, dokonuję rezerwacji wymienionych kursów lub usług, zgodnie z Warunkami Świadczenia Usług oraz Polityką Prywatności NobleProg.

Chcę dowiedzieć się więcej o nowych planach szkoleniowych, zniżkach i promocjach

Proszę przeczytać naszą Politykę Prywatności , aby dowiedzieć się, jak używamy Twoich danych

Programowanie z Big Data w R - Plan Szkolenia - Zapytanie

Imię i nazwisko *

E-mail *

Numer kontaktowy *

Liczba uczestników

Nazwa Firmy

Adres firmowy

Jak chciał(a)byś wziąć udział w szkoleniu?

Lokalizacja Zamawiającego

Zdalne

Stacjonarne

Uwagi

Chcę dowiedzieć się więcej o nowych planach szkoleniowych, zniżkach i promocjach

Proszę przeczytać naszą Politykę Prywatności , aby dowiedzieć się, jak używamy Twoich danych

Programowanie z Big Data w R - Zapytanie o Konsultacje

Imię i nazwisko *

Numer kontaktowy *

E-mail *

Nazwa Firmy

Temat Konsultacji *

Cel Konsultacji

Z kim będzie pracował konsultant?

Pilność Konsultacji *

Uwagi

Chcę dowiedzieć się więcej o nowych planach szkoleniowych, zniżkach i promocjach

Proszę przeczytać naszą Politykę Prywatności , aby dowiedzieć się, jak używamy Twoich danych

Opinie uczestników (2)

The subject matter and the pace were perfect.

Tim - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada

Szkolenie - Programming with Big Data in R

Przetłumaczone przez sztuczną inteligencję

Michael the trainer is very knowledgeable and skillful about the subject of Big Data and R. He is very flexible and quickly customize the training meeting clients' need. He is also very capable to solve technical and subject matter problems on the go. Fantastic and professional training!.

Xiaoyuan Geng - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada

Szkolenie - Programming with Big Data in R

3870 PLN (Zdalne)

4770 PLN (Stacjonarne)

Szkolenia Powiązane

Administrator Training for Apache Hadoop

35 godzin

Grupa docelowa:

Kurs jest przeznaczony dla specjalistów IT poszukujących rozwiązania do przechowywania i przetwarzania dużych zbiorów danych w środowisku systemów rozproszonych.

Cel:

Pogłębienie wiedzy na temat administracji klastrem Hadoop.

Więcej...

Analiza Danych Dużych Objętości w Zdrowiu

21 godzin

Analiza danych dużych objętości obejmuje proces badania dużych ilości różnorodnych zestawów danych w celu odkrycia korelacji, ukrytych wzorców i innych użytecznych informacji.

Branża zdrowia generuje ogromne ilości złożonych, heterogenicznych danych medycznych i klinicznych. Zastosowanie analizy danych dużych objętości w danych zdrowotnych stwarza ogromny potencjał w uzyskiwaniu informacji mających na celu poprawę jakości opieki zdrowotnej. Jednak ogrom tych zbiorów danych stanowi duże wyzwanie w analizach i praktycznych zastosowaniach w środowisku klinicznym.

Podczas tego szkolenia prowadzonego przez instruktora (zdalnie), uczestnicy nauczą się, jak przeprowadzać analizę danych dużych objętości w dziedzinie zdrowia, przechodząc przez serię praktycznych ćwiczeń w laboratorium.

Pod koniec szkolenia uczestnicy będą mogli:

Zainstalować i skonfigurować narzędzia do analizy danych dużych objętości, takie jak Hadoop MapReduce i Spark
Zrozumieć charakterystykę danych medycznych
Zastosować techniki danych dużych objętości do pracy z danymi medycznymi
Poznać systemy i algorytmy danych dużych objętości w kontekście zastosowań w zdrowiu

Grupa docelowa

Programiści
Analitycy danych

Format kursu

Część wykładowa, część dyskusyjna, ćwiczenia i intensywna praktyka.

Uwaga

Aby zamówić szkolenie dostosowane do potrzeb, prosimy o kontakt w celu uzgodnienia szczegółów.

Więcej...

Hadoop dla Administratorów

21 godzin

Apache Hadoop to najpopularniejsze framework do przetwarzania Big Data na klastrach serwerów. W tym trzydniowym (opcjonalnie czterodniowym) kursie uczestnicy dowiedzą się, jakie korzyści biznesowe i przypadki użycia oferuje Hadoop oraz jego ekosystem, jak planować wdrożenie i rozwój klastra, jak instalować, utrzymywać, monitorować, rozwiązywać problemy i optymalizować Hadoop. Będą również ćwiczyć masowe ładowanie danych do klastra, zapoznają się z różnymi dystrybucjami Hadoop oraz będą ćwiczyć instalację i zarządzanie narzędziami ekosystemu Hadoop. Kurs kończy się omówieniem zabezpieczania klastra za pomocą Kerberosa.

“…Materiały były bardzo dobrze przygotowane i szczegółowo omówione. Laboratorium było bardzo pomocne i dobrze zorganizowane”
— Andrew Nguyen, Główny Inżynier Integracji DW, Microsoft Online Advertising

Grupa docelowa

Administratorzy Hadoop

Format

Wykłady i praktyczne laboratoria, w przybliżeniu 60% wykładów, 40% laboratoriów.

Więcej...

Hadoop dla programistów (4 dni)

28 godzin

Apache Hadoop to najbardziej popularne framework do przetwarzania Big Data na klastrach serwerów. Ten kurs wprowadzi programistę w różne komponenty (HDFS, MapReduce, Pig, Hive i HBase) ekosystemu Hadoop.

Więcej...

Zaawansowany Hadoop dla programistów

21 godzin

Apache Hadoop to jedna z najpopularniejszych platform do przetwarzania Big Data na klastrach serwerów. Ten kurs zagłębia się w zarządzanie danymi w HDFS oraz zaawansowane techniki pracy z Pig, Hive i HBase. Te zaawansowane techniki programowania będą korzystne dla doświadczonych programistów Hadoop.

Grupa docelowa: programiści

Czas trwania: trzy dni

Format: wykłady (50%) i warsztaty praktyczne (50%).

Więcej...

Administracja Hadoop na MapR

28 godzin

Grupa docelowa:

Ten kurs ma na celu demistyfikację technologii big data/hadoop i pokazanie, że nie jest trudna do zrozumienia.

Więcej...

Hadoop i Spark dla administratorów

35 godzin

To szkolenie prowadzone przez instruktora na żywo w Polsce (online lub na miejscu) jest skierowane do administratorów systemów, którzy chcą nauczyć się, jak konfigurować, wdrażać i zarządzać klastrami Hadoop w swojej organizacji.

Pod koniec szkolenia uczestnicy będą mogli:

Zainstalować i skonfigurować Apache Hadoop.
Zrozumieć cztery główne komponenty ekosystemu Hadoop: HDFS, MapReduce, YARN i Hadoop Common.
Używać Hadoop Distributed File System (HDFS) do skalowania klastra do setek lub tysięcy węzłów.
Skonfigurować HDFS jako silnik magazynowania dla lokalnych wdrożeń Spark.
Skonfigurować Spark do korzystania z alternatywnych rozwiązań magazynowych, takich jak Amazon S3, oraz systemów bazodanowych NoSQL, takich jak Redis, Elasticsearch, Couchbase, Aerospike itp.
Wykonywać zadania administracyjne, takie jak provisionowanie, zarządzanie, monitorowanie i zabezpieczanie klastra Apache Hadoop.

Więcej...

HBase dla programistów

21 godzin

Ten kurs wprowadza HBase – magazyn NoSQL oparty na Hadoop. Kurs jest przeznaczony dla programistów, którzy będą używać HBase do tworzenia aplikacji, oraz administratorów, którzy będą zarządzać klastrami HBase.

Przeprowadzimy programistę przez architekturę HBase, modelowanie danych oraz rozwój aplikacji na HBase. Omówimy również użycie MapReduce z HBase oraz niektóre tematy administracyjne związane z optymalizacją wydajności. Kurs jest bardzo praktyczny, z wieloma ćwiczeniami laboratoryjnymi.

Czas trwania: 3 dni

Grupa docelowa: Programiści i administratorzy

Więcej...

Apache NiFi dla administratorów

21 godzin

Apache NiFi to platforma do integracji danych i przetwarzania zdarzeń oparta na przepływach, dostępna jako oprogramowanie open-source. Umożliwia automatyczne, w czasie rzeczywistym, routowanie, transformację i mediację danych między różnymi systemami, oferując interfejs webowy oraz szczegółową kontrolę.

To szkolenie prowadzone przez instruktora (na miejscu lub zdalnie) jest skierowane do administratorów i inżynierów na poziomie średniozaawansowanym, którzy chcą wdrażać, zarządzać, zabezpieczać i optymalizować przepływy danych NiFi w środowiskach produkcyjnych.

Po zakończeniu szkolenia uczestnicy będą mogli:

Instalować, konfigurować i utrzymywać klastry Apache NiFi.
Projektować i zarządzać przepływami danych z różnych źródeł i miejsc docelowych.
Implementować automatyzację przepływów, routowanie i logikę transformacji.
Optymalizować wydajność, monitorować operacje i rozwiązywać problemy.

Format kursu

Interaktywny wykład z omówieniem architektury w oparciu o rzeczywiste przypadki.
Praktyczne laboratoria: budowanie, wdrażanie i zarządzanie przepływami.
Ćwiczenia oparte na scenariuszach w środowisku live-lab.

Opcje dostosowania kursu

Aby zamówić dostosowane szkolenie, prosimy o kontakt w celu uzgodnienia szczegółów.

Więcej...

Apache NiFi dla programistów

7 godzin

W tym szkoleniu prowadzonym przez instruktora, uczestnicy nauczą się podstaw programowania opartego na przepływie, tworząc szereg demonstracyjnych rozszerzeń, komponentów i procesorów przy użyciu Apache NiFi.

Po zakończeniu szkolenia uczestnicy będą mogli:

Zrozumieć architekturę NiFi oraz koncepcje przepływu danych.
Tworzyć rozszerzenia przy użyciu NiFi i zewnętrznych API.
Samodzielnie opracować własny procesor Apache NiFi.
Pozyskiwać i przetwarzać dane w czasie rzeczywistym z różnych i nietypowych formatów plików oraz źródeł danych.

Więcej...

PySpark i Uczenie Maszynowe

21 godzin

Szkolenie to zapewnia praktyczne wprowadzenie do budowania skalowalnych procesów przetwarzania danych i przepływów pracy w zakresie uczenia maszynowego przy użyciu PySpark. Uczestnicy dowiedzą się, jak Apache Spark działa w ramach nowoczesnych ekosystemów Big Data oraz jak efektywnie przetwarzać duże zbiory danych, korzystając z zasad obliczeń rozproszonych.

Więcej...

Python i Spark dla Big Data (PySpark)

21 godzin

Podczas tego szkolenia prowadzonego przez instruktora na żywo w Polsce, uczestnicy nauczą się, jak używać Pythona i Sparka razem do analizy dużych zbiorów danych, pracując nad praktycznymi ćwiczeniami.

Po zakończeniu szkolenia uczestnicy będą mogli:

Nauczyć się, jak używać Sparka z Pythonem do analizy dużych zbiorów danych.
Pracować nad ćwiczeniami, które odzwierciedlają rzeczywiste przypadki.
Stosować różne narzędzia i techniki do analizy dużych zbiorów danych za pomocą PySpark.

Więcej...

Python, Spark i Hadoop dla Big Data

21 godzin

To szkolenie prowadzone przez instruktora na żywo w Polsce (online lub na miejscu) jest skierowane do programistów, którzy chcą wykorzystywać i integrować Spark, Hadoop i Python do przetwarzania, analizy i transformacji dużych i złożonych zbiorów danych.

Pod koniec szkolenia uczestnicy będą mogli:

Skonfigurować niezbędne środowisko do rozpoczęcia przetwarzania dużych zbiorów danych za pomocą Spark, Hadoop i Python.
Zrozumieć funkcje, główne komponenty i architekturę Spark i Hadoop.
Nauczyć się, jak integrować Spark, Hadoop i Python do przetwarzania dużych zbiorów danych.
Poznać narzędzia w ekosystemie Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka i Flume).
Budować systemy rekomendacji oparte na filtrowaniu współpracującym, podobne do tych używanych przez Netflix, YouTube, Amazon, Spotify i Google.
Wykorzystać Apache Mahout do skalowania algorytmów uczenia maszynowego.

Więcej...

Stratio: Moduły Rocket i Intelligence z PySpark

14 godzin

Stratio to platforma zorientowana na dane, która integruje big data, sztuczną inteligencję i zarządzanie w jednym rozwiązaniu. Jej moduły Rocket i Intelligence umożliwiają szybkie eksplorowanie, przekształcanie i zaawansowaną analizę danych w środowiskach przedsiębiorstw.

To szkolenie prowadzone przez instruktora (online lub na miejscu) jest skierowane do specjalistów od danych na poziomie średniozaawansowanym, którzy chcą efektywnie korzystać z modułów Rocket i Intelligence w Stratio z wykorzystaniem PySpark, koncentrując się na strukturach pętlowych, funkcjach zdefiniowanych przez użytkownika oraz zaawansowanej logice danych.

Po zakończeniu szkolenia uczestnicy będą mogli:

Poruszać się i pracować w platformie Stratio, korzystając z modułów Rocket i Intelligence.
Stosować PySpark w kontekście pozyskiwania, przekształcania i analizy danych.
Używać pętli i logiki warunkowej do kontrolowania przepływów danych i zadań inżynierii cech.
Tworzyć i zarządzać funkcjami zdefiniowanymi przez użytkownika (UDF) do wielokrotnego wykorzystania operacji na danych w PySpark.

Format kursu

Interaktywny wykład i dyskusja.
Wiele ćwiczeń i praktyki.
Praktyczna implementacja w środowisku live-lab.

Opcje dostosowania kursu

Aby zamówić dostosowane szkolenie, skontaktuj się z nami w celu uzgodnienia szczegółów.

Więcej...

Wprowadzenie do wizualizacji danych z użyciem Tidyverse i R

7 godzin

Grupa docelowa

Format kursu

Pod koniec szkolenia uczestnicy będą w stanie:

W tym prowadzonym przez instruktora, live szkoleniu, uczestnicy nauczą się, jak manipulować i wizualizować dane przy użyciu narzędzi zawartych w Tidyverse.

Tidyverse to zbiór wszechstronnych pakietów R do czyszczenia, przetwarzania, modelowania i wizualizacji danych. Niektóre z wchodzących w skład pakietów to: ggplot2, dplyr, tidyr, readr, purrr i tibble.

Początkujący w języku R
Początkujący w analizie i wizualizacji danych

Część wykładowa, część dyskusyjna, ćwiczenia i intensywna praktyka

Przeprowadzać analizę danych i tworzyć atrakcyjne wizualizacje
Wyciągać użyteczne wnioski z różnych zestawów danych przykładowych
Filtrować, sortować i podsumowywać dane, aby odpowiadać na pytania eksploracyjne
Przekształcać przetworzone dane w informacyjne wykresy liniowe, słupkowe, histogramy
Importować i filtrować dane z różnych źródeł, w tym z plików Excel, CSV i SPSS

Więcej...

Programowanie z Big Data w R - Plan Szkolenia

Plan Szkolenia

Wprowadzenie do programowania Big Data w R (bpdR)

Interfejs Przekazywania Wiadomości (MPI)

Macierze rozproszone

Zastosowania statystyczne

Opinie uczestników (2)

Tim - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada

Szkolenie - Programming with Big Data in R

Xiaoyuan Geng - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada

Szkolenie - Programming with Big Data in R

Propozycje terminów

Programowanie z Big Data w R

Programowanie z Big Data w R

Programowanie z Big Data w R

Programowanie z Big Data w R

Programowanie z Big Data w R

Powiązane Kategorie

Ta strona w innych krajach/regionach

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Programowanie z Big Data w R - Plan Szkolenia

Plan Szkolenia

Wprowadzenie do programowania Big Data w R (bpdR)

Interfejs Przekazywania Wiadomości (MPI)

Macierze rozproszone

Zastosowania statystyczne

Opinie uczestników (2)

Tim - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada

Szkolenie - Programming with Big Data in R

Xiaoyuan Geng - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada

Szkolenie - Programming with Big Data in R

Propozycje terminów

Programowanie z Big Data w R

Programowanie z Big Data w R

Programowanie z Big Data w R

Programowanie z Big Data w R

Programowanie z Big Data w R

Szkolenia Powiązane

Administrator Training for Apache Hadoop

Grupa docelowa:

Cel:

Analiza Danych Dużych Objętości w Zdrowiu

Hadoop dla Administratorów

Grupa docelowa

Format

Hadoop dla programistów (4 dni)

Zaawansowany Hadoop dla programistów

Administracja Hadoop na MapR

Grupa docelowa:

Hadoop i Spark dla administratorów

HBase dla programistów

Apache NiFi dla administratorów

Apache NiFi dla programistów

PySpark i Uczenie Maszynowe

Python i Spark dla Big Data (PySpark)

Python, Spark i Hadoop dla Big Data

Stratio: Moduły Rocket i Intelligence z PySpark

Wprowadzenie do wizualizacji danych z użyciem Tidyverse i R

Powiązane Kategorie

Big Data

R Language

Ta strona w innych krajach/regionach

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites