Jupyter dla zespołów zajmujących się nauką o danych - Plan Szkolenia
Jupyter to otwarte, oparte na przeglądarce interaktywne środowisko programistyczne (IDE) i środowisko obliczeniowe.
To szkolenie prowadzone przez instruktora na żywo (online lub na miejscu) wprowadza ideę współpracy w dziedzinie nauki o danych i pokazuje, jak używać Jupytera do śledzenia i uczestniczenia jako zespół w „cyklu życia obliczeniowego pomysłu”. Uczestnicy przechodzą przez proces tworzenia przykładowego projektu z zakresu nauki o danych opartego na ekosystemie Jupytera.
Po zakończeniu szkolenia uczestnicy będą mogli:
- Zainstalować i skonfigurować Jupytera, w tym utworzyć i zintegrować repozytorium zespołowe na Git.
- Korzystać z funkcji Jupytera, takich jak rozszerzenia, interaktywne widżety, tryb wieloużytkownikowy i inne, aby umożliwić współpracę przy projekcie.
- Tworzyć, udostępniać i organizować Notebooki Jupytera z członkami zespołu.
- Wybrać spośród języków takich jak Scala, Python, R, aby pisać i wykonywać kod na systemach big data, takich jak Apache Spark, wszystko za pośrednictwem interfejsu Jupytera.
Format kursu
- Interaktywny wykład i dyskusja.
- Wiele ćwiczeń i praktyki.
- Praktyczna implementacja w środowisku live-lab.
Opcje dostosowania kursu
- Notebook Jupyter obsługuje ponad 40 języków, w tym R, Python, Scala, Julia itp. Aby dostosować ten kurs do wybranych języków, skontaktuj się z nami, aby to uzgodnić.
Plan Szkolenia
Wprowadzenie do Jupytera
- Przegląd Jupytera i jego ekosystemu
- Instalacja i konfiguracja
- Konfigurowanie Jupytera do współpracy zespołowej
Funkcje współpracy
- Korzystanie z Git do kontroli wersji
- Rozszerzenia i interaktywne widżety
- Tryb wieloużytkownikowy
Tworzenie i zarządzanie Notebookami
- Struktura i funkcjonalność Notebooka
- Udostępnianie i organizowanie Notebooków
- Najlepsze praktyki współpracy
Programowanie z Jupyterem
- Wybór i używanie języków programowania (Python, R, Scala)
- Pisanie i wykonywanie kodu
- Integracja z systemami big data (Apache Spark)
Zaawansowane funkcje Jupytera
- Dostosowywanie środowiska Jupytera
- Automatyzacja przepływów pracy z Jupyterem
- Eksploracja zaawansowanych przypadków użycia
Sesje praktyczne
- Praktyczne laboratoria
- Projekty z zakresu nauki o danych w rzeczywistych warunkach
- Ćwiczenia grupowe i recenzje koleżeńskie
Podsumowanie i kolejne kroki
Wymagania
- Doświadczenie w programowaniu w językach takich jak Python, R, Scala itp.
- Podstawy z zakresu nauki o danych
Grupa docelowa
- Zespoły zajmujące się nauką o danych
Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.
Jupyter dla zespołów zajmujących się nauką o danych - Plan Szkolenia - Rezerwacja
Jupyter dla zespołów zajmujących się nauką o danych - Plan Szkolenia - Zapytanie
Jupyter dla zespołów zajmujących się nauką o danych - Zapytanie o Konsultacje
Opinie uczestników (1)
Wspaniale jest, że kurs został dostosowany do kluczowych obszarów, które zaznaczyłem w ankierce przed kursową. To naprawdę pomaga odpowiedzieć na moje pytania dotyczące tematyki i dopasować się do moich celów edukacyjnych.
Winnie Chan - Statistics Canada
Szkolenie - Jupyter for Data Science Teams
Przetłumaczone przez sztuczną inteligencję
Propozycje terminów
Szkolenia Powiązane
Wprowadzenie do Data Science i AI przy użyciu Pythona
35 godzinTo 5-dniowe wprowadzenie do Data Science i Sztucznej Inteligencji (AI).
Kurs jest prowadzony z przykładami i ćwiczeniami przy użyciu Pythona.
Apache Airflow dla Data Science: Automatyzacja Potoków Uczenia Maszynowego
21 godzinTo szkolenie prowadzone przez instruktora na żywo w Polsce (online lub na miejscu) jest skierowane do uczestników na poziomie średnio zaawansowanym, którzy chcą automatyzować i zarządzać przepływami pracy w uczeniu maszynowym, w tym trenowaniem, walidacją i wdrażaniem modeli przy użyciu Apache Airflow.
Pod koniec tego szkolenia uczestnicy będą mogli:
- Skonfigurować Apache Airflow do orkiestracji przepływów pracy w uczeniu maszynowym.
- Automatyzować zadania przetwarzania danych, trenowania i walidacji modeli.
- Integrować Airflow z frameworkami i narzędziami do uczenia maszynowego.
- Wdrażać modele uczenia maszynowego przy użyciu zautomatyzowanych potoków.
- Monitorować i optymalizować przepływy pracy w produkcji.
Ekosystem Anaconda dla Data Scientistów
14 godzinTo szkolenie prowadzone przez instruktora, na żywo w Polsce (online lub na miejscu) jest skierowane do data scientistów, którzy chcą wykorzystać ekosystem Anaconda do przechwytywania, zarządzania i wdrażania pakietów oraz przepływów pracy analizy danych na jednej platformie.
Pod koniec szkolenia uczestnicy będą mogli:
- Zainstalować i skonfigurować komponenty i biblioteki Anaconda.
- Zrozumieć podstawowe koncepcje, funkcje i korzyści Anaconda.
- Zarządzać pakietami, środowiskami i kanałami za pomocą Anaconda Navigator.
- Korzystać z pakietów Conda, R i Python do nauki danych i uczenia maszynowego.
- Poznać praktyczne przypadki użycia i techniki zarządzania wieloma środowiskami danych.
AWS Cloud9 dla Data Science
28 godzinTo szkolenie prowadzone przez instruktora, na żywo w Polsce (online lub na miejscu) jest skierowane do średnio zaawansowanych data scientistów i analityków, którzy chcą korzystać z AWS Cloud9 w celu usprawnienia przepływów pracy związanych z data science.
Po zakończeniu szkolenia uczestnicy będą w stanie:
- Skonfigurować środowisko data science w AWS Cloud9.
- Przeprowadzać analizę danych przy użyciu Python, R i Jupyter Notebook w Cloud9.
- Zintegrować AWS Cloud9 z usługami danych AWS, takimi jak S3, RDS i Redshift.
- Wykorzystać AWS Cloud9 do tworzenia i wdrażania modeli uczenia maszynowego.
- Optymalizować przepływy pracy oparte na chmurze do analizy i przetwarzania danych.
Wprowadzenie do Google Colab dla Data Science
14 godzinTo szkolenie prowadzone przez instruktora na żywo w Polsce (online lub na miejscu) jest skierowane do początkujących data scientistów i profesjonalistów IT, którzy chcą poznać podstawy data science przy użyciu Google Colab.
Pod koniec szkolenia uczestnicy będą mogli:
- Skonfigurować i poruszać się po Google Colab.
- Pisać i wykonywać podstawowy kod Python.
- Importować i zarządzać zbiorami danych.
- Tworzyć wizualizacje przy użyciu bibliotek Python.
Praktyczne wprowadzenie do nauki o danych
35 godzinUczestnicy, którzy ukończą to szkolenie, uzyskają praktyczną, zorientowaną na rzeczywistość wiedzę o Nauce o Danych oraz jej powiązanych technologiach, metodologii i narzędziach.
Uczestnicy będą mieli okazję praktycznie zastosować zdobyte wiedzę poprzez ćwiczenia praktyczne. Współpraca grupowa oraz opinie instruktora stanowią ważny element szkolenia.
Szkolenie rozpoczyna się od wprowadzenia do podstawowych pojęć Nauki o Danych, a następnie postępuje w kierunku narzędzi i metodologii wykorzystywanych w tej dziedzinie.
Odbiorcy szkolenia
- Programiści
- Analitycy techniczni
- Konsultanci IT
Format szkolenia
- Część prezentacji, część dyskusji, ćwiczenia i intensywne praktyki praktyczne
Uwaga
- Aby zamówić dostosowane szkolenie dla tego kursu, prosimy o kontakt z nami w celu uzgodnienia szczegółów.
Data Science for Big Data Analytics
35 godzinBig data to zbiory danych, które są tak obszerne i złożone, że tradycyjne aplikacje do przetwarzania danych nie są w stanie sobie z nimi poradzić. Wyzwania związane z dużymi zbiorami danych obejmują przechwytywanie danych, przechowywanie danych, analizę danych, wyszukiwanie, udostępnianie, przesyłanie, wizualizację, zapytania, aktualizację i prywatność informacji.
Data Science niezbędne dla profesjonalistów marketingowych/handlowych
21 godzin Ten kurs jest przeznaczony dla profesjonalistów z dziedziny marketingu i sprzedaży, którzy chcą pogłębić swoją wiedzę na temat zastosowań nauki o danych w marketingu/sprzedaży. Kurs dostarcza szczegółowych informacji o różnych technikach nauki o danych stosowanych do „upsale”, „cross-sale”, segmentacji rynku, budowania marki oraz CLV.
Różnice między marketingiem a sprzedażą - w jaki sposób sprzedaż i marketing różnią się między sobą?
W bardzo prostych słowach sprzedaż można określić jako proces skupiony na indywidualnych klientach lub małych grupach. Marketing natomiast kierowany jest do większych grup lub do ogółu społeczeństwa. Marketing obejmuje badania (identyfikacja potrzeb klienta), rozwój produktów (tworzenie innowacyjnych produktów) oraz promocję produktu (przez reklamy) i tworzenie świadomości produktu wśród konsumentów. Dlatego marketing oznacza generowanie potencjalnych klientów. Gdy produkt pojawia się na rynku, zadanie sprzedawcy polega na przekonaniu klienta do zakupu. Sprzedaż oznacza przekształcenie potencjalnych klientów w zakupy i zamówienia, podczas gdy marketing ma na celu dłuższy okres, sprzedaż dotyczy krótkoterminowych celów.
Wprowadzenie do nauki o danych
35 godzinTo prowadzone przez instruktora szkolenie na żywo (online lub stacjonarnie) jest skierowane do profesjonalistów, którzy chcą zacząć karierę w dziedzinie nauki o danych.
Na koniec tego szkolenia uczestnicy będą w stanie:
- Zainstalować i skonfigurować Pythona i MySql.
- Poznać, czym jest nauka o danych i jak może ona dodawać wartość praktycznie dla każdego biznesu.
- Nauczyć się podstaw programowania w języku Python
- Dowiedzieć się o nadzorowanych i nienadzorowanych technikach uczenia maszynowego, jak je zaimplementować i interpretować ich wyniki.
Format kursu
- Interaktywna prezentacja i dyskusja.
- Wiele ćwiczeń i praktyki.
- Ręczna implementacja w środowisku laboratoryjnym na żywo.
Opcje dostosowywania kursu
- Aby zamówić dostosowane szkolenie dla tego kursu, prosimy o kontakt z nami w celu ustalenia szczegółów.
Kaggle
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą uczyć się i budować swoją karierę w Data Science za pomocą Kaggle.
Pod koniec tego szkolenia uczestnicy będą mogli:
- Dowiedzieć się o nauce o danych i uczeniu maszynowym.
- Poznaj analitykę danych.
- Dowiedzieć się o Kaggle i jak to działa.
Data Science z KNIME Analytics Platform
21 godzinKNIME Analytics Platform to prowadząca otwarta platforma do innowacji opartej na danych, która pomaga odkryć ukryty potencjał w Twoich danych, wydobywać świeże wglądania lub przewidywać nowe przyszłości. Dzięki ponad 1000 modułów, setkom gotowych do uruchomienia przykładów, szerokiemu zakresowi zintegrowanych narzędzi i największej ofercie zaawansowanych algorytmów, KNIME Analytics Platform jest idealnym zestawem narzędzi dla każdego data scientista i business analysta.
Ten kurs dotyczący KNIME Analytics Platform to idealna okazja dla początkujących, zaawansowanych użytkowników oraz ekspertów KNIME, aby zapoznać się z KNIME, nauczyć się korzystać z niego bardziej efektywnie i tworzyć jasne, kompleksowe raporty oparte na workflow KNIME.
Ta prowadzona przez instruktora, żywa trening (online lub stacjonarny) jest skierowana do profesjonalistów danych, którzy chcą korzystać z KNIME w celu rozwiązania złożonych potrzeb biznesowych.
Kurs jest przeznaczony dla publiczności, która nie zna programowania i zamierza korzystać z nowoczesnych narzędzi do implementacji scenariuszy analizy danych.
Na końcu tego treningu uczestnicy będą w stanie:
- Zainstalować i skonfigurować KNIME.
- Budować scenariusze Data Science
- Trening, testowanie i walidacja modeli
- Implementacja end-to-end łańcucha wartości modeli Data Science
Format Kursu
- Interaktywna wykłady i dyskusje.
- Wiele ćwiczeń i praktyki.
- Przełożenie na rzeczywiste laboratorium.
Opcje Dostosowywania Kursu
- Aby poprosić o dostosowany trening dla tego kursu lub dowiedzieć się więcej na temat programu, prosimy skontaktować się z nami, aby zorganizować.
Machine Learning dla Data Science z Python
21 godzinTo szkolenie prowadzone przez instruktora, dostępne online lub na miejscu w Polsce, jest skierowane do analityków danych, programistów na poziomie średnim lub przyszłych naukowców danych, którzy chcą zastosować techniki uczenia maszynowego w Python do wyciągania wniosków, robienia prognoz i automatyzacji decyzji opartego na danych.
Po ukończeniu tego kursu uczestnicy będą w stanie:
- Rozumieć i rozróżniać kluczowe paradygmaty uczenia maszynowego.
- Badać techniki przygotowania danych i metryki oceny modeli.
- Zastosować algorytmy uczenia maszynowego do rozwiązywania rzeczywistych problemów danych.
- Używać bibliotek Python oraz notatników Jupyter do praktycznego rozwoju.
- Budować modele do prognozowania, klasyfikacji, rekomendacji i klasyfikacji grupowej.
Przyspieszanie przepływów pracy w Python Pandas z wykorzystaniem Modin
14 godzinTo szkolenie prowadzone przez instruktora, na żywo w Polsce (online lub na miejscu) jest skierowane do naukowców zajmujących się danymi oraz programistów, którzy chcą wykorzystać Modin do budowania i implementowania równoległych obliczeń z Pandas w celu szybszej analizy danych.
Pod koniec szkolenia uczestnicy będą mogli:
- Skonfigurować niezbędne środowisko do rozpoczęcia tworzenia przepływów pracy w Pandas na dużą skalę z wykorzystaniem Modin.
- Zrozumieć funkcje, architekturę i zalety Modin.
- Poznać różnice między Modin, Dask i Ray.
- Wykonywać operacje w Pandas szybciej z wykorzystaniem Modin.
- Implementować całe API i funkcje Pandas.
Wprowadzenie do modeli przetrenowanych
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (online lub na miejscu) jest przeznaczone dla początkujących profesjonalistów, którzy chcą zrozumieć koncepcję wstępnie wytrenowanych modeli i dowiedzieć się, jak zastosować je do rozwiązywania rzeczywistych problemów bez budowania modeli od zera.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Zrozumieć koncepcję i zalety wstępnie wytrenowanych modeli.
- Zapoznać się z różnymi architekturami wstępnie wytrenowanych modeli i ich przypadkami użycia.
- Dostroić wstępnie wytrenowany model do określonych zadań.
- Wdrożyć wstępnie wytrenowane modele w prostych projektach uczenia maszynowego.
Data Science na GPU z wykorzystaniem NVIDIA RAPIDS
14 godzinTo szkolenie prowadzone przez instruktora w Polsce (online lub na miejscu) jest skierowane do naukowców zajmujących się danymi oraz programistów, którzy chcą wykorzystać RAPIDS do budowania zoptymalizowanych pod kątem GPU potoków danych, przepływów pracy i wizualizacji, stosując algorytmy uczenia maszynowego, takie jak XGBoost, cuML itp.
Po zakończeniu szkolenia uczestnicy będą mogli:
- Skonfigurować niezbędne środowisko programistyczne do budowania modeli danych z wykorzystaniem NVIDIA RAPIDS.
- Zrozumieć funkcje, komponenty i zalety RAPIDS.
- Wykorzystać GPU do przyspieszenia kompleksowych potoków danych i analizy.
- Wdrożyć przygotowanie danych i ETL zoptymalizowane pod kątem GPU z wykorzystaniem cuDF i Apache Arrow.
- Nauczyć się wykonywać zadania uczenia maszynowego z algorytmami XGBoost i cuML.
- Tworzyć wizualizacje danych i przeprowadzać analizę grafów z wykorzystaniem cuXfilter i cuGraph.