Jupyter dla zespołów nauki o danych - Plan Szkolenia
Jupyter to interaktywne IDE i środowisko obliczeniowe oparte na otwartym kodzie źródłowym.
To prowadzone przez instruktora szkolenie na żywo (online lub na miejscu) wprowadza ideę wspólnego rozwoju w nauce o danych i pokazuje, jak używać Jupyter do śledzenia i uczestniczenia jako zespół w "cyklu życia pomysłu obliczeniowego". Szkolenie prowadzi uczestników przez proces tworzenia przykładowego projektu nauki o danych w oparciu o ekosystem Jupyter.
Pod koniec tego szkolenia uczestnicy będą mogli
- Zainstalować i skonfigurować Jupyter, w tym utworzyć i zintegrować repozytorium zespołu na Git.
- Korzystać z funkcji Jupyter, takich jak rozszerzenia, interaktywne widżety, tryb wielu użytkowników i inne, aby umożliwić współpracę nad projektem.
- Twórz, udostępniaj i organizuj notatniki Jupyter z członkami zespołu.
- Wybieraj spośród Scala, Python, R, aby pisać i wykonywać kod w systemach dużych zbiorów danych, takich jak Apache Spark, wszystko za pośrednictwem interfejsu Jupyter.
Format kursu
- Interaktywny wykład i dyskusja.
- Wiele ćwiczeń i praktyki.
- Praktyczne wdrożenie w środowisku laboratoryjnym na żywo.
Opcje dostosowywania kursu
- Notatnik Jupyter obsługuje ponad 40 języków, w tym R, Python, Scala, Julia itp. Aby dostosować ten kurs do wybranego języka (języków), skontaktuj się z nami w celu ustalenia szczegółów.
Plan Szkolenia
Wprowadzenie do Jupyter
- Przegląd aplikacji Jupyter i jej ekosystemu
- Instalacja i konfiguracja
- Konfiguracja Jupyter do współpracy zespołowej
Funkcje współpracy
- Korzystanie z Git do kontroli wersji
- Rozszerzenia i interaktywne widżety
- Tryb wielu użytkowników
Tworzenie notesów i zarządzanie nimi
- Struktura i funkcjonalność notatników
- Udostępnianie i organizowanie notesów
- Najlepsze praktyki dotyczące współpracy
Współpraca z Jupyter Programming
- Wybieranie i używanie języków programowania (Python, R, Scala)
- Pisanie i wykonywanie kodu
- Integracja z systemami Big Data (Apache Spark)
Zaawansowane funkcje Jupyter
- Dostosowywanie środowiska Jupyter
- Automatyzacja przepływów pracy za pomocą Jupyter
- Odkrywanie zaawansowanych przypadków użycia
Sesje praktyczne
- Praktyczne laboratoria
- Projekty nauki o danych w świecie rzeczywistym
- Ćwiczenia grupowe i wzajemne oceny
Podsumowanie i kolejne kroki
Wymagania
- Programming doświadczenie w językach takich jak Python, R, Scala itp.
- Doświadczenie w nauce o danych
Publiczność
- Zespoły zajmujące się nauką o danych
Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.
Jupyter dla zespołów nauki o danych - Plan Szkolenia - Rezerwacja
Jupyter dla zespołów nauki o danych - Plan Szkolenia - Zapytanie
Jupyter dla zespołów nauki o danych - Zapytanie o Konsultacje
Zapytanie o Konsultacje
Opinie uczestników (1)
Wspaniale jest, że kurs został dostosowany do kluczowych obszarów, które zaznaczyłem w ankierce przed kursową. To naprawdę pomaga odpowiedzieć na moje pytania dotyczące tematyki i dopasować się do moich celów edukacyjnych.
Winnie Chan - Statistics Canada
Szkolenie - Jupyter for Data Science Teams
Przetłumaczone przez sztuczną inteligencję
Propozycje terminów
Szkolenia Powiązane
Wprowadzenie do nauki o danych i sztucznej inteligencji za pomocą Pythona
35 godzinTo jest pięciodniowe wprowadzenie do nauki o danych i sztucznej inteligencji (AI).
Kurs realizowany jest z przykładami i ćwiczeniami wykorzystującymi Python
Anaconda Ekosystem dla Naukowców Danych
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi, którzy chcą korzystać z ekosystemu Anaconda do przechwytywania, zarządzania i wdrażania pakietów i przepływów pracy analizy danych na jednej platformie.
Pod koniec tego szkolenia uczestnicy będą mogli
- Zainstalować i skonfigurować komponenty i biblioteki Anaconda.
- Zrozumieć podstawowe pojęcia, funkcje i zalety Anaconda.
- Zarządzać pakietami, środowiskami i kanałami za pomocą Anaconda Navigator.
- Używanie pakietów Conda, R i Python do nauki o danych i uczenia maszynowego.
- Poznanie praktycznych przypadków użycia i technik zarządzania wieloma środowiskami danych.
Praktyczne wprowadzenie do nauki o danych
35 godzinUczestnicy, którzy ukończą to szkolenie, uzyskają praktyczną, zorientowaną na rzeczywistość wiedzę o Nauce o Danych oraz jej powiązanych technologiach, metodologii i narzędziach.
Uczestnicy będą mieli okazję praktycznie zastosować zdobyte wiedzę poprzez ćwiczenia praktyczne. Współpraca grupowa oraz opinie instruktora stanowią ważny element szkolenia.
Szkolenie rozpoczyna się od wprowadzenia do podstawowych pojęć Nauki o Danych, a następnie postępuje w kierunku narzędzi i metodologii wykorzystywanych w tej dziedzinie.
Odbiorcy szkolenia
- Programiści
- Analitycy techniczni
- Konsultanci IT
Format szkolenia
- Część prezentacji, część dyskusji, ćwiczenia i intensywne praktyki praktyczne
Uwaga
- Aby zamówić dostosowane szkolenie dla tego kursu, prosimy o kontakt z nami w celu uzgodnienia szczegółów.
Data Science for Big Data Analytics
35 godzinBig data to zbiory danych, które są tak obszerne i złożone, że tradycyjne aplikacje do przetwarzania danych nie są w stanie sobie z nimi poradzić. Wyzwania związane z dużymi zbiorami danych obejmują przechwytywanie danych, przechowywanie danych, analizę danych, wyszukiwanie, udostępnianie, przesyłanie, wizualizację, zapytania, aktualizację i prywatność informacji.
Data Science niezbędne dla profesjonalistów marketingowych/handlowych
21 godzin Ten kurs jest przeznaczony dla profesjonalistów z dziedziny marketingu i sprzedaży, którzy chcą pogłębić swoją wiedzę na temat zastosowań nauki o danych w marketingu/sprzedaży. Kurs dostarcza szczegółowych informacji o różnych technikach nauki o danych stosowanych do „upsale”, „cross-sale”, segmentacji rynku, budowania marki oraz CLV.
Różnice między marketingiem a sprzedażą - w jaki sposób sprzedaż i marketing różnią się między sobą?
W bardzo prostych słowach sprzedaż można określić jako proces skupiony na indywidualnych klientach lub małych grupach. Marketing natomiast kierowany jest do większych grup lub do ogółu społeczeństwa. Marketing obejmuje badania (identyfikacja potrzeb klienta), rozwój produktów (tworzenie innowacyjnych produktów) oraz promocję produktu (przez reklamy) i tworzenie świadomości produktu wśród konsumentów. Dlatego marketing oznacza generowanie potencjalnych klientów. Gdy produkt pojawia się na rynku, zadanie sprzedawcy polega na przekonaniu klienta do zakupu. Sprzedaż oznacza przekształcenie potencjalnych klientów w zakupy i zamówienia, podczas gdy marketing ma na celu dłuższy okres, sprzedaż dotyczy krótkoterminowych celów.
Wprowadzenie do nauki o danych
35 godzinTo prowadzone przez instruktora szkolenie na żywo (online lub stacjonarnie) jest skierowane do profesjonalistów, którzy chcą zacząć karierę w dziedzinie nauki o danych.
Na koniec tego szkolenia uczestnicy będą w stanie:
- Zainstalować i skonfigurować Pythona i MySql.
- Poznać, czym jest nauka o danych i jak może ona dodawać wartość praktycznie dla każdego biznesu.
- Nauczyć się podstaw programowania w języku Python
- Dowiedzieć się o nadzorowanych i nienadzorowanych technikach uczenia maszynowego, jak je zaimplementować i interpretować ich wyniki.
Format kursu
- Interaktywna prezentacja i dyskusja.
- Wiele ćwiczeń i praktyki.
- Ręczna implementacja w środowisku laboratoryjnym na żywo.
Opcje dostosowywania kursu
- Aby zamówić dostosowane szkolenie dla tego kursu, prosimy o kontakt z nami w celu ustalenia szczegółów.
Kaggle
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą uczyć się i budować swoją karierę w Data Science za pomocą Kaggle.
Pod koniec tego szkolenia uczestnicy będą mogli:
- Dowiedzieć się o nauce o danych i uczeniu maszynowym.
- Poznaj analitykę danych.
- Dowiedzieć się o Kaggle i jak to działa.
Data Science z KNIME Analytics Platform
21 godzinKNIME Analytics Platform to prowadząca otwarta platforma do innowacji opartej na danych, która pomaga odkryć ukryty potencjał w Twoich danych, wydobywać świeże wglądania lub przewidywać nowe przyszłości. Dzięki ponad 1000 modułów, setkom gotowych do uruchomienia przykładów, szerokiemu zakresowi zintegrowanych narzędzi i największej ofercie zaawansowanych algorytmów, KNIME Analytics Platform jest idealnym zestawem narzędzi dla każdego data scientista i business analysta.
Ten kurs dotyczący KNIME Analytics Platform to idealna okazja dla początkujących, zaawansowanych użytkowników oraz ekspertów KNIME, aby zapoznać się z KNIME, nauczyć się korzystać z niego bardziej efektywnie i tworzyć jasne, kompleksowe raporty oparte na workflow KNIME.
Ta prowadzona przez instruktora, żywa trening (online lub stacjonarny) jest skierowana do profesjonalistów danych, którzy chcą korzystać z KNIME w celu rozwiązania złożonych potrzeb biznesowych.
Kurs jest przeznaczony dla publiczności, która nie zna programowania i zamierza korzystać z nowoczesnych narzędzi do implementacji scenariuszy analizy danych.
Na końcu tego treningu uczestnicy będą w stanie:
- Zainstalować i skonfigurować KNIME.
- Budować scenariusze Data Science
- Trening, testowanie i walidacja modeli
- Implementacja end-to-end łańcucha wartości modeli Data Science
Format Kursu
- Interaktywna wykłady i dyskusje.
- Wiele ćwiczeń i praktyki.
- Przełożenie na rzeczywiste laboratorium.
Opcje Dostosowywania Kursu
- Aby poprosić o dostosowany trening dla tego kursu lub dowiedzieć się więcej na temat programu, prosimy skontaktować się z nami, aby zorganizować.
Machine Learning dla Data Science z Python
21 godzinTo szkolenie prowadzone przez instruktora, dostępne online lub na miejscu w Polsce, jest skierowane do analityków danych, programistów na poziomie średnim lub przyszłych naukowców danych, którzy chcą zastosować techniki uczenia maszynowego w Python do wyciągania wniosków, robienia prognoz i automatyzacji decyzji opartego na danych.
Po ukończeniu tego kursu uczestnicy będą w stanie:
- Rozumieć i rozróżniać kluczowe paradygmaty uczenia maszynowego.
- Badać techniki przygotowania danych i metryki oceny modeli.
- Zastosować algorytmy uczenia maszynowego do rozwiązywania rzeczywistych problemów danych.
- Używać bibliotek Python oraz notatników Jupyter do praktycznego rozwoju.
- Budować modele do prognozowania, klasyfikacji, rekomendacji i klasyfikacji grupowej.
Przyspieszanie przepływów danych w Pythonie Pandas z użyciem Modin
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą używać Modin do tworzenia i wdrażania równoległych obliczeń z Pandas w celu szybszej analizy danych.
Pod koniec tego szkolenia uczestnicy będą w stanie
- Skonfigurować niezbędne środowisko, aby rozpocząć opracowywanie Pandas przepływów pracy na dużą skalę z Modin.
- Zrozumieć funkcje, architekturę i zalety Modin.
- Znać różnice między Modin, Dask i Ray.
- Szybsze wykonywanie operacji Pandas za pomocą Modin.
- Wdrożenie całego interfejsu API i funkcji Pandas.
Programowanie w języku Python dla Finansów
35 godzinPython jest językiem programowania, który zdobył ogromną popularność w sektorze finansowym. Został przyjęty przez największe banki inwestycyjne i fundusze hedgingowe i jest wykorzystywany do budowy szerokiej gamy aplikacji finansowych, od programów handlowych podstawowych po systemy zarządzania ryzykiem.
W tym prowadzonym przez instruktora szkoleniu online uczestnicy nauczą się, jak używać Pythona do tworzenia praktycznych aplikacji rozwiązujących różne problemy związane z finansami.
Po zakończeniu tego szkolenia uczestnicy będą w stanie:
- Zrozumieć podstawy języka programowania Python
- Pobrać, zainstalować i utrzymywać najlepsze narzędzia programistyczne do tworzenia aplikacji finansowych w Python
- Wybierać i wykorzystywać najodpowiedniejsze pakiety Python i techniki programowania do organizowania, wizualizacji i analizy danych finansowych z różnych źródeł (CSV, Excel, bazy danych, internet, itp.)
- Budować aplikacje rozwiązujące problemy związane z alokacją aktywów, analizą ryzyka, wydajnością inwestycji i innymi kwestiami
- Diagnozować, integrować, wdrażać i optymalizować aplikację Python
Grupa docelowa
- Developers
- Analysts
- Quants
Format kursu
- Część wykładu, część dyskusji, ćwiczenia i intensywne praktyczne ćwiczenia
Uwaga
- To szkolenie ma na celu dostarczenie rozwiązań dla niektórych z głównych problemów, z którymi borykają się specjaliści ds. finansowych. Jeśli jednak masz konkretny temat, narzędzie lub technikę, o której chciałbyś wiedzieć więcej, skontaktuj się z nami, aby to zaryzować.
Python w Naukach o Danych
35 godzinKurs szkoleniowy pomoże uczestnikom przygotować się do tworzenia aplikacji internetowych z użyciem programowania Python z analizą danych. Wizualizacja takich danych jest świetnym narzędziem dla zarządu w podejmowaniu decyzji.
Qlik Sense dla Nauki o Danych
14 godzinTen prowadzony przez instruktora, żywy kurs w Polsce (online lub na miejscu) jest skierowany do analityków danych i web developerów, którzy chcą tworzyć modele asocjacyjne w Qlik Sense.
Na koniec tego treningu uczestnicy będą mogli:
- Zastosować Qlik Sense w nauce o danych.
- Używać i nawigować po interfejsie Qlik Sense.
- Budować zasób ludzki, który potrafi korzystać z danych wraz z AI.
- Tworzyć przedsiębiorstwo oparte na danych za pomocą Qlik Sense.
Naukowa analiza danych GPU z użyciem NVIDIA RAPIDS
14 godzinTo szkolenie prowadzone przez instruktora w formie online lub stacjonarnej jest skierowane do naukowców danych i deweloperów, którzy chcą wykorzystać RAPIDS do budowy GPU-przyspieszanych przepływów danych, procesów pracy oraz wizualizacji, stosując algorytmy uczenia maszynowego, takie jak XGBoost, cuML, itd.
Po zakończeniu tego szkolenia uczestnicy będą w stanie:
- Ustawić niezbędne środowisko deweloperskie do budowy modeli danych z NVIDIA RAPIDS.
- Zrozumieć funkcje, składniki i zalety RAPIDS.
- Wykorzystywać GPU do przyspieszania przepływów danych i analiz od początku do końca.
- Wdrażać GPU-przyspieszane przygotowanie danych i ETL z użyciem cuDF i Apache Arrow.
- Nauczyć się wykonywania zadań uczenia maszynowego z użyciem algorytmów XGBoost i cuML.
- Tworzyć wizualizacje danych i wykonywać analizę grafu z użyciem cuXfilter i cuGraph.
SMACK Stack dla nauki o danych
14 godzinTo prowadzone przez instruktora, na żywo szkolenie w Polsce (online lub stacjonarne) jest skierowane do naukowców o danych, którzy chcą korzystać ze stosu SMACK do budowania platform przetwarzania danych dla rozwiązań Big Data.
Po zakończeniu tego szkolenia uczestnicy będą w stanie:
- Zaimplementować architekturę potoku danych do przetwarzania Big Data.
- Opracować infrastrukturę klastra przy użyciu Apache Mesos i Docker.
- Analizować dane za pomocą Spark i Scala.
- Zarządzać niestrukturalnymi danymi za pomocą Apache Cassandra.