Strona główna
Szkolenia Big Data
Szkolenia Apache Spark
SMACK Stack dla Data Science - Plan Szkolenia

SMACK Stack dla Data Science - Plan Szkolenia

SMACK to zestaw oprogramowania platformy danych, obejmujący Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra i Apache Kafka. Korzystając ze stosu SMACK, użytkownicy mogą tworzyć i skalować platformy do przetwarzania danych.

To szkolenie prowadzone przez instruktora na żywo (online lub na miejscu) jest skierowane do data scientistów, którzy chcą wykorzystać stos SMACK do budowy platform przetwarzania danych dla rozwiązań big data.

Pod koniec szkolenia uczestnicy będą w stanie:

Zaimplementować architekturę potoku danych do przetwarzania big data.
Rozwinąć infrastrukturę klastrową z wykorzystaniem Apache Mesos i Dockera.
Analizować dane za pomocą Spark i Scala.
Zarządzać danymi niestrukturyzowanymi za pomocą Apache Cassandra.

Format kursu

Interaktywny wykład i dyskusja.
Wiele ćwiczeń i praktyki.
Praktyczna implementacja w środowisku live-lab.

Opcje dostosowania kursu

Aby zamówić dostosowane szkolenie, skontaktuj się z nami.

Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.

Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.

Plan Szkolenia

Wprowadzenie

Przegląd stosu SMACK

Co to jest Apache Spark? Funkcje Apache Spark
Co to jest Apache Mesos? Funkcje Apache Mesos
Co to jest Apache Akka? Funkcje Apache Akka
Co to jest Apache Cassandra? Funkcje Apache Cassandra
Co to jest Apache Kafka? Funkcje Apache Kafka

Język Scala

Składnia i struktura Scali
Przepływ sterowania w Scali

Przygotowanie środowiska deweloperskiego

Instalacja i konfiguracja stosu SMACK
Instalacja i konfiguracja Dockera

Apache Akka

Korzystanie z aktorów

Apache Cassandra

Tworzenie bazy danych do operacji odczytu
Praca z kopiami zapasowymi i odzyskiwaniem

Łączniki

Tworzenie strumienia
Budowanie aplikacji Akka
Przechowywanie danych za pomocą Cassandra
Przegląd łączników

Apache Kafka

Praca z klastrami
Tworzenie, publikowanie i konsumowanie wiadomości

Apache Mesos

Alokacja zasobów
Uruchamianie klastrów
Praca z Apache Aurora i Dockerem
Uruchamianie usług i zadań
Wdrażanie Spark, Cassandra i Kafka na Mesos

Apache Spark

Zarządzanie przepływami danych
Praca z RDD i dataframami
Przeprowadzanie analizy danych

Rozwiązywanie problemów

Obsługa awarii usług i błędów

Podsumowanie i zakończenie

Wymagania

Zrozumienie systemów przetwarzania danych

Grupa docelowa

Data Scientist

14 godzin

Liczba uczestników

Online

Stacjonarne

Wybierz lokalizację

Wybierz miejsce szkolenia

Cena za uczestnika (netto)

Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.

SMACK Stack dla Data Science - Plan Szkolenia - Rezerwacja

Imię i nazwisko *

E-mail *

Numer kontaktowy *

Stanowisko

Nazwa Firmy

Adres *

Miejscowość *

Województwo / Prowincja / Region

Kraj *

Kod pocztowy *

Data rozpoczęcia

Identyfikator podatkowy (np. NIP, PESEL)

Daty są podległe dostępności i odbywają się między 09:00 a 16:00.

Metoda płatności *

Przelew bankowy (na podstawie faktury VAT lub pro formy)

Karta kredytowa / debetowa

Uwagi

Regulamin świadczenia usług szkoleniowych *

Jako osoba upoważniona do reprezentowania wymienionego powyżej Klienta, dokonuję rezerwacji wymienionych kursów lub usług, zgodnie z Warunkami Świadczenia Usług oraz Polityką Prywatności NobleProg.

Chcę dowiedzieć się więcej o nowych planach szkoleniowych, zniżkach i promocjach

Proszę przeczytać naszą Politykę Prywatności , aby dowiedzieć się, jak używamy Twoich danych

SMACK Stack dla Data Science - Plan Szkolenia - Zapytanie

Imię i nazwisko *

E-mail *

Numer kontaktowy *

Liczba uczestników

Nazwa Firmy

Adres firmowy

Jak chciał(a)byś wziąć udział w szkoleniu?

Lokalizacja Zamawiającego

Zdalne

Stacjonarne

Uwagi

Chcę dowiedzieć się więcej o nowych planach szkoleniowych, zniżkach i promocjach

Proszę przeczytać naszą Politykę Prywatności , aby dowiedzieć się, jak używamy Twoich danych

SMACK Stack dla Data Science - Zapytanie o Konsultacje

Imię i nazwisko *

Numer kontaktowy *

E-mail *

Nazwa Firmy

Temat Konsultacji *

Cel Konsultacji

Z kim będzie pracował konsultant?

Pilność Konsultacji *

Uwagi

Chcę dowiedzieć się więcej o nowych planach szkoleniowych, zniżkach i promocjach

Proszę przeczytać naszą Politykę Prywatności , aby dowiedzieć się, jak używamy Twoich danych

Opinie uczestników (1)

bardzo interaktywny...

Richard Langford

Szkolenie - SMACK Stack for Data Science

Przetłumaczone przez sztuczną inteligencję

Propozycje terminów

SMACK Stack dla Data Science

2026-07-01 09:00

14 godzin

Katowice

3100 PLN (Zdalne)

3700 PLN (Stacjonarne)

SMACK Stack dla Data Science

2026-07-15 09:00

14 godzin

Kielce

3100 PLN (Zdalne)

3700 PLN (Stacjonarne)

SMACK Stack dla Data Science

2026-07-29 09:00

14 godzin

Ostrowiec Świętokrzyski

3100 PLN (Zdalne)

3700 PLN (Stacjonarne)

SMACK Stack dla Data Science

2026-08-12 09:00

14 godzin

Olsztyn

3100 PLN (Zdalne)

3700 PLN (Stacjonarne)

Szkolenia Powiązane

Wprowadzenie do Data Science i AI przy użyciu Pythona

35 godzin

To 5-dniowe wprowadzenie do Data Science i Sztucznej Inteligencji (AI).

Kurs jest prowadzony z przykładami i ćwiczeniami przy użyciu Pythona.

Więcej...

Apache Airflow dla Data Science: Automatyzacja Potoków Uczenia Maszynowego

21 godzin

To szkolenie prowadzone przez instruktora na żywo w Polsce (online lub na miejscu) jest skierowane do uczestników na poziomie średnio zaawansowanym, którzy chcą automatyzować i zarządzać przepływami pracy w uczeniu maszynowym, w tym trenowaniem, walidacją i wdrażaniem modeli przy użyciu Apache Airflow.

Pod koniec tego szkolenia uczestnicy będą mogli:

Skonfigurować Apache Airflow do orkiestracji przepływów pracy w uczeniu maszynowym.
Automatyzować zadania przetwarzania danych, trenowania i walidacji modeli.
Integrować Airflow z frameworkami i narzędziami do uczenia maszynowego.
Wdrażać modele uczenia maszynowego przy użyciu zautomatyzowanych potoków.
Monitorować i optymalizować przepływy pracy w produkcji.

Więcej...

Ekosystem Anaconda dla Data Scientistów

14 godzin

To szkolenie prowadzone przez instruktora, na żywo w Polsce (online lub na miejscu) jest skierowane do data scientistów, którzy chcą wykorzystać ekosystem Anaconda do przechwytywania, zarządzania i wdrażania pakietów oraz przepływów pracy analizy danych na jednej platformie.

Pod koniec szkolenia uczestnicy będą mogli:

Zainstalować i skonfigurować komponenty i biblioteki Anaconda.
Zrozumieć podstawowe koncepcje, funkcje i korzyści Anaconda.
Zarządzać pakietami, środowiskami i kanałami za pomocą Anaconda Navigator.
Korzystać z pakietów Conda, R i Python do nauki danych i uczenia maszynowego.
Poznać praktyczne przypadki użycia i techniki zarządzania wieloma środowiskami danych.

Więcej...

AWS Cloud9 dla Data Science

28 godzin

To szkolenie prowadzone przez instruktora, na żywo w Polsce (online lub na miejscu) jest skierowane do średnio zaawansowanych data scientistów i analityków, którzy chcą korzystać z AWS Cloud9 w celu usprawnienia przepływów pracy związanych z data science.

Po zakończeniu szkolenia uczestnicy będą w stanie:

Skonfigurować środowisko data science w AWS Cloud9.
Przeprowadzać analizę danych przy użyciu Python, R i Jupyter Notebook w Cloud9.
Zintegrować AWS Cloud9 z usługami danych AWS, takimi jak S3, RDS i Redshift.
Wykorzystać AWS Cloud9 do tworzenia i wdrażania modeli uczenia maszynowego.
Optymalizować przepływy pracy oparte na chmurze do analizy i przetwarzania danych.

Więcej...

Wprowadzenie do Google Colab dla Data Science

14 godzin

To szkolenie prowadzone przez instruktora na żywo w Polsce (online lub na miejscu) jest skierowane do początkujących data scientistów i profesjonalistów IT, którzy chcą poznać podstawy data science przy użyciu Google Colab.

Pod koniec szkolenia uczestnicy będą mogli:

Skonfigurować i poruszać się po Google Colab.
Pisać i wykonywać podstawowy kod Python.
Importować i zarządzać zbiorami danych.
Tworzyć wizualizacje przy użyciu bibliotek Python.

Więcej...

Praktyczne wprowadzenie do Data Science

35 godzin

Uczestnicy, którzy ukończą to szkolenie, zdobędą praktyczną, rzeczywistą wiedzę na temat Data Science oraz związanych z nią technologii, metodologii i narzędzi.

Uczestnicy będą mieli okazję zastosować tę wiedzę w praktyce poprzez ćwiczenia praktyczne. Interakcja w grupie i feedback od instruktora stanowią ważny element zajęć.

Kurs rozpoczyna się od wprowadzenia do podstawowych pojęć Data Science, a następnie przechodzi do narzędzi i metodologii stosowanych w Data Science.

Grupa docelowa

Programiści
Analitycy techniczni
Konsultanci IT

Format kursu

Część wykładowa, część dyskusyjna, ćwiczenia i intensywna praktyka

Uwaga

Aby zamówić szkolenie dostosowane do potrzeb, prosimy o kontakt w celu uzgodnienia szczegółów.

Więcej...

Nauka o danych dla analizy dużych zbiorów danych

35 godzin

Duże zbiory danych to zestawy danych tak obszerne i złożone, że tradycyjne oprogramowanie do przetwarzania danych jest niewystarczające, aby sobie z nimi poradzić. Wyzwania związane z dużymi zbiorami danych obejmują pozyskiwanie danych, przechowywanie, analizę, wyszukiwanie, udostępnianie, transfer, wizualizację, zapytania, aktualizację oraz prywatność informacji.

Więcej...

Data Science niezbędne dla profesjonalistów z marketingu/sprzedaży

21 godzin

Ten kurs jest przeznaczony dla profesjonalistów z marketingu i sprzedaży, którzy chcą zgłębić zastosowanie data science w marketingu i sprzedaży. Kurs zapewnia
szczegółowe omówienie różnych technik data science stosowanych w „upsell”, „cross-sell”, segmentacji rynku, budowaniu marki i CLV.

Różnica między marketingiem a sprzedażą - Czym różni się sprzedaż od marketingu?

W bardzo prostych słowach, sprzedaż można określić jako proces, który koncentruje się na jednostkach lub małych grupach. Marketing natomiast jest skierowany do większej grupy lub ogółu społeczeństwa. Marketing obejmuje badania (identyfikację potrzeb klienta), rozwój produktów (tworzenie innowacyjnych produktów) i promocję produktu (poprzez reklamy) oraz budowanie świadomości produktu wśród konsumentów. W ten sposób marketing oznacza generowanie potencjalnych klientów. Gdy produkt jest już na rynku, zadaniem sprzedawcy jest przekonanie klienta do zakupu. Sprzedaż oznacza przekształcanie potencjalnych klientów w zakupy i zamówienia, podczas gdy marketing ma na celu długoterminowe cele, a sprzedaż dotyczy celów krótkoterminowych.

Więcej...

Wprowadzenie do Data Science

35 godzin

To prowadzone przez instruktora szkolenie na żywo (online lub na miejscu) jest skierowane do profesjonalistów, którzy chcą rozpocząć karierę w Data Science.

Po zakończeniu szkolenia uczestnicy będą mogli:

Zainstalować i skonfigurować Python oraz MySql.
Zrozumieć, czym jest Data Science i jak może dodać wartość do praktycznie każdego biznesu.
Poznać podstawy programowania w Pythonie
Nauczyć się technik uczenia maszynowego nadzorowanego i nienadzorowanego oraz ich implementacji i interpretacji wyników.

Format kursu

Interaktywny wykład i dyskusja.
Liczne ćwiczenia i praktyka.
Praktyczna implementacja w środowisku live-lab.

Opcje dostosowania kursu

Aby zamówić dostosowane szkolenie dla tego kursu, prosimy o kontakt w celu uzgodnienia szczegółów.

Więcej...

Kaggle

14 godzin

To szkolenie prowadzone przez instruktora, na żywo w Polsce (online lub na miejscu) jest skierowane do naukowców zajmujących się danymi i programistów, którzy chcą się uczyć i rozwijać swoje kariery w dziedzinie Data Science przy użyciu Kaggle.

Pod koniec szkolenia uczestnicy będą mogli:

Poznać zagadnienia związane z nauką o danych i uczeniem maszynowym.
Eksplorować analizy danych.
Poznać Kaggle i sposób jego działania.

Więcej...

Przyspieszanie przepływów pracy w Python Pandas z wykorzystaniem Modin

14 godzin

To szkolenie prowadzone przez instruktora, na żywo w Polsce (online lub na miejscu) jest skierowane do naukowców zajmujących się danymi oraz programistów, którzy chcą wykorzystać Modin do budowania i implementowania równoległych obliczeń z Pandas w celu szybszej analizy danych.

Pod koniec szkolenia uczestnicy będą mogli:

Skonfigurować niezbędne środowisko do rozpoczęcia tworzenia przepływów pracy w Pandas na dużą skalę z wykorzystaniem Modin.
Zrozumieć funkcje, architekturę i zalety Modin.
Poznać różnice między Modin, Dask i Ray.
Wykonywać operacje w Pandas szybciej z wykorzystaniem Modin.
Implementować całe API i funkcje Pandas.

Więcej...

PySpark i Uczenie Maszynowe

21 godzin

Szkolenie to zapewnia praktyczne wprowadzenie do budowania skalowalnych procesów przetwarzania danych i przepływów pracy w zakresie uczenia maszynowego przy użyciu PySpark. Uczestnicy dowiedzą się, jak Apache Spark działa w ramach nowoczesnych ekosystemów Big Data oraz jak efektywnie przetwarzać duże zbiory danych, korzystając z zasad obliczeń rozproszonych.

Więcej...

Data Science na GPU z wykorzystaniem NVIDIA RAPIDS

14 godzin

To szkolenie prowadzone przez instruktora w Polsce (online lub na miejscu) jest skierowane do naukowców zajmujących się danymi oraz programistów, którzy chcą wykorzystać RAPIDS do budowania zoptymalizowanych pod kątem GPU potoków danych, przepływów pracy i wizualizacji, stosując algorytmy uczenia maszynowego, takie jak XGBoost, cuML itp.

Po zakończeniu szkolenia uczestnicy będą mogli:

Skonfigurować niezbędne środowisko programistyczne do budowania modeli danych z wykorzystaniem NVIDIA RAPIDS.
Zrozumieć funkcje, komponenty i zalety RAPIDS.
Wykorzystać GPU do przyspieszenia kompleksowych potoków danych i analizy.
Wdrożyć przygotowanie danych i ETL zoptymalizowane pod kątem GPU z wykorzystaniem cuDF i Apache Arrow.
Nauczyć się wykonywać zadania uczenia maszynowego z algorytmami XGBoost i cuML.
Tworzyć wizualizacje danych i przeprowadzać analizę grafów z wykorzystaniem cuXfilter i cuGraph.

Więcej...

Python i Spark dla Big Data (PySpark)

21 godzin

Podczas tego szkolenia prowadzonego przez instruktora na żywo w Polsce, uczestnicy nauczą się, jak używać Pythona i Sparka razem do analizy dużych zbiorów danych, pracując nad praktycznymi ćwiczeniami.

Po zakończeniu szkolenia uczestnicy będą mogli:

Nauczyć się, jak używać Sparka z Pythonem do analizy dużych zbiorów danych.
Pracować nad ćwiczeniami, które odzwierciedlają rzeczywiste przypadki.
Stosować różne narzędzia i techniki do analizy dużych zbiorów danych za pomocą PySpark.

Więcej...

Stratio: Moduły Rocket i Intelligence z PySpark

14 godzin

Stratio to platforma zorientowana na dane, która integruje big data, sztuczną inteligencję i zarządzanie w jednym rozwiązaniu. Jej moduły Rocket i Intelligence umożliwiają szybkie eksplorowanie, przekształcanie i zaawansowaną analizę danych w środowiskach przedsiębiorstw.

To szkolenie prowadzone przez instruktora (online lub na miejscu) jest skierowane do specjalistów od danych na poziomie średniozaawansowanym, którzy chcą efektywnie korzystać z modułów Rocket i Intelligence w Stratio z wykorzystaniem PySpark, koncentrując się na strukturach pętlowych, funkcjach zdefiniowanych przez użytkownika oraz zaawansowanej logice danych.

Po zakończeniu szkolenia uczestnicy będą mogli:

Poruszać się i pracować w platformie Stratio, korzystając z modułów Rocket i Intelligence.
Stosować PySpark w kontekście pozyskiwania, przekształcania i analizy danych.
Używać pętli i logiki warunkowej do kontrolowania przepływów danych i zadań inżynierii cech.
Tworzyć i zarządzać funkcjami zdefiniowanymi przez użytkownika (UDF) do wielokrotnego wykorzystania operacji na danych w PySpark.

Format kursu

Interaktywny wykład i dyskusja.
Wiele ćwiczeń i praktyki.
Praktyczna implementacja w środowisku live-lab.

Opcje dostosowania kursu

Aby zamówić dostosowane szkolenie, skontaktuj się z nami w celu uzgodnienia szczegółów.

Więcej...

Powiązane Kategorie

SMACK Stack dla Data Science - Plan Szkolenia

Plan Szkolenia

Wymagania

Opinie uczestników (1)

Richard Langford

Szkolenie - SMACK Stack for Data Science

Propozycje terminów

SMACK Stack dla Data Science

SMACK Stack dla Data Science

SMACK Stack dla Data Science

SMACK Stack dla Data Science

Powiązane Kategorie

Ta strona w innych krajach/regionach

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites