Jupyter for Data Science Teams - Plan Szkolenia
Jupyter to interaktywne IDE i środowisko obliczeniowe oparte na otwartym kodzie źródłowym.
To prowadzone przez instruktora szkolenie na żywo (online lub na miejscu) wprowadza ideę wspólnego rozwoju w nauce o danych i pokazuje, jak używać Jupyter do śledzenia i uczestniczenia jako zespół w "cyklu życia pomysłu obliczeniowego". Szkolenie prowadzi uczestników przez proces tworzenia przykładowego projektu nauki o danych w oparciu o ekosystem Jupyter.
Pod koniec tego szkolenia uczestnicy będą mogli
- Zainstalować i skonfigurować Jupyter, w tym utworzyć i zintegrować repozytorium zespołu na Git.
- Korzystać z funkcji Jupyter, takich jak rozszerzenia, interaktywne widżety, tryb wielu użytkowników i inne, aby umożliwić współpracę nad projektem.
- Twórz, udostępniaj i organizuj notatniki Jupyter z członkami zespołu.
- Wybieraj spośród Scala, Python, R, aby pisać i wykonywać kod w systemach dużych zbiorów danych, takich jak Apache Spark, wszystko za pośrednictwem interfejsu Jupyter.
Format kursu
- Interaktywny wykład i dyskusja.
- Wiele ćwiczeń i praktyki.
- Praktyczne wdrożenie w środowisku laboratoryjnym na żywo.
Opcje dostosowywania kursu
- Notatnik Jupyter obsługuje ponad 40 języków, w tym R, Python, Scala, Julia itp. Aby dostosować ten kurs do wybranego języka (języków), skontaktuj się z nami w celu ustalenia szczegółów.
Plan Szkolenia
Wprowadzenie do Jupyter
- Przegląd aplikacji Jupyter i jej ekosystemu
- Instalacja i konfiguracja
- Konfiguracja Jupyter do współpracy zespołowej
Funkcje współpracy
- Korzystanie z Git do kontroli wersji
- Rozszerzenia i interaktywne widżety
- Tryb wielu użytkowników
Tworzenie notesów i zarządzanie nimi
- Struktura i funkcjonalność notatników
- Udostępnianie i organizowanie notesów
- Najlepsze praktyki dotyczące współpracy
Współpraca z Jupyter Programming
- Wybieranie i używanie języków programowania (Python, R, Scala)
- Pisanie i wykonywanie kodu
- Integracja z systemami Big Data (Apache Spark)
Zaawansowane funkcje Jupyter
- Dostosowywanie środowiska Jupyter
- Automatyzacja przepływów pracy za pomocą Jupyter
- Odkrywanie zaawansowanych przypadków użycia
Sesje praktyczne
- Praktyczne laboratoria
- Projekty nauki o danych w świecie rzeczywistym
- Ćwiczenia grupowe i wzajemne oceny
Podsumowanie i kolejne kroki
Wymagania
- Programming doświadczenie w językach takich jak Python, R, Scala itp.
- Doświadczenie w nauce o danych
Uczestnicy
- Zespoły zajmujące się nauką o danych
Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.
Jupyter for Data Science Teams - Plan Szkolenia - Booking
Jupyter for Data Science Teams - Plan Szkolenia - Enquiry
Jupyter for Data Science Teams - Zapytanie o Konsultacje
Zapytanie o Konsultacje
Opinie uczestników (1)
Wspaniałe jest to, że kurs jest dostosowany do kluczowych obszarów, które zaznaczyłem w ankiecie przed kursem. To naprawdę pomaga w rozwiązaniu moich pytań dotyczących materiału oraz w dostosowaniu się do moich celów uczenia.
Winnie Chan - Statistics Canada
Szkolenie - Jupyter for Data Science Teams
Przetłumaczone przez sztuczną inteligencję
Propozycje terminów
Szkolenia Powiązane
Introduction to Data Science and AI using Python
35 godzinJest to 5-dniowe wprowadzenie do Data Science i sztucznej inteligencji (AI).
Kurs obejmuje przykłady i ćwiczenia z wykorzystaniem Python
Anaconda Ecosystem for Data Scientists
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi, którzy chcą korzystać z ekosystemu Anaconda do przechwytywania, zarządzania i wdrażania pakietów i przepływów pracy analizy danych na jednej platformie.
Pod koniec tego szkolenia uczestnicy będą mogli
- Zainstalować i skonfigurować komponenty i biblioteki Anaconda.
- Zrozumieć podstawowe pojęcia, funkcje i zalety Anaconda.
- Zarządzać pakietami, środowiskami i kanałami za pomocą Anaconda Navigator.
- Używanie pakietów Conda, R i Python do nauki o danych i uczenia maszynowego.
- Poznanie praktycznych przypadków użycia i technik zarządzania wieloma środowiskami danych.
Big Data Business Intelligence for Telecom & Communication Service Providers
35 godzinPrzegląd
Communication Dostawcy usług (CSP) stoją w obliczu presji na redukcję kosztów i maksymalizację średniego przychodu na użytkownika (ARPU), przy jednoczesnym zapewnieniu doskonałego doświadczenia klienta, ale ilość danych wciąż rośnie. Globalny ruch danych w sieciach komórkowych będzie rósł w tempie 78% rocznie (CAGR) do 2016 roku, osiągając 10,8 eksabajtów miesięcznie.
W międzyczasie CSP generują duże ilości danych, w tym rejestry szczegółów połączeń (CDR), dane sieciowe i dane klientów. Firmy, które w pełni wykorzystują te dane, zyskują przewagę konkurencyjną. Według niedawnego badania przeprowadzonego przez The Economist Intelligence Unit, firmy, które wykorzystują podejmowanie decyzji w oparciu o dane, cieszą się 5-6% wzrostem produktywności. Jednak 53% firm wykorzystuje tylko połowę swoich cennych danych, a jedna czwarta respondentów zauważyła, że ogromne ilości przydatnych danych pozostają niewykorzystane. Ilość danych jest tak duża, że ich ręczna analiza jest niemożliwa, a większość starszych systemów oprogramowania nie nadąża, przez co cenne dane są odrzucane lub ignorowane.
Dzięki szybkiemu, skalowalnemu oprogramowaniu Big Data & Analytics&rsquo, dostawcy usług CSP mogą wydobywać wszystkie swoje dane w celu podejmowania lepszych decyzji w krótszym czasie. Różne produkty i techniki Big Data zapewniają kompleksową platformę oprogramowania do gromadzenia, przygotowywania, analizowania i prezentowania wniosków z dużych zbiorów danych. Obszary zastosowań obejmują monitorowanie wydajności sieci, wykrywanie oszustw, wykrywanie rezygnacji klientów i analizę ryzyka kredytowego. Produkty Big Data & Analytics skalują się do obsługi terabajtów danych, ale wdrożenie takich narzędzi wymaga nowego rodzaju systemu baz danych opartego na chmurze, takiego jak Hadoop lub masowego procesora obliczeń równoległych (KPU itp.).
Ten kurs na temat Big Data BI dla Telco obejmuje wszystkie pojawiające się nowe obszary, w które CSP inwestują w celu zwiększenia produktywności i otwarcia nowego strumienia przychodów biznesowych. Kurs zapewni pełny 360-stopniowy przegląd Big Data BI w Telco, dzięki czemu decydenci i menedżerowie będą mieli bardzo szeroki i kompleksowy przegląd możliwości Big Data BI w Telco w celu zwiększenia produktywności i przychodów.
Cele kursu
Głównym celem kursu jest wprowadzenie nowych technik analityki biznesowej Big Data w 4 sektorach Telecom biznesu (marketing / sprzedaż, operacje sieciowe, operacje finansowe i zarządzanie relacjami z klientami). Studenci zostaną zapoznani z następującymi zagadnieniami:
- Wprowadzenie do Big Data - czym są 4V (objętość, szybkość, różnorodność i prawdziwość) w Big Data - generowanie, ekstrakcja i zarządzanie z perspektywy Telco
- Czym różni się analityka Big Data od dotychczasowej analityki danych
- Wewnętrzne uzasadnienie Big Data - perspektywa Telco
- Wprowadzenie do ekosystemu Hadoop - znajomość wszystkich narzędzi Hadoop, takich jak Hive, Pig, SPARC – kiedy i jak są one wykorzystywane do rozwiązywania problemów Big Data
- W jaki sposób Big Data są pozyskiwane do analizy w narzędziach analitycznych - w jaki sposób analiza biznesowa może zmniejszyć ból związany z gromadzeniem i analizą danych dzięki zintegrowanemu podejściu do pulpitu nawigacyjnego Hadoop
- Podstawowe wprowadzenie do analityki Insight, analityki wizualizacyjnej i analityki predykcyjnej dla Telco
- Analityka rezygnacji klientów i Big Data - jak analityka Big Data może zmniejszyć rezygnację klientów i niezadowolenie klientów w Telco - studia przypadków
- Analiza awarii sieci i usług na podstawie metadanych sieciowych i IPDR
- Analiza finansowa - oszustwa, marnotrawstwo i szacowanie ROI na podstawie danych sprzedażowych i operacyjnych
- Problem pozyskiwania klientów - marketing docelowy, segmentacja klientów i sprzedaż krzyżowa na podstawie danych sprzedażowych
- Wprowadzenie i podsumowanie wszystkich produktów analitycznych Big Data i ich miejsca w przestrzeni analitycznej Telco
- Podsumowanie - jak krok po kroku wprowadzić Big Data Business Intelligence w swojej organizacji
Docelowi odbiorcy
- Operacje sieciowe, menedżerowie finansowi, menedżerowie CRM i najlepsi menedżerowie IT w biurze Telco CIO.
- Business Analitycy w Telco
- Menedżerowie/analitycy biura CFO
- Menedżerowie operacyjni
- Menedżerowie QA
A Practical Introduction to Data Science
35 godzinUczestnicy, którzy ukończą to szkolenie, zdobędą praktyczne, rzeczywiste zrozumienie Data Science i powiązanych z nim technologii, metodologii i narzędzi.
Uczestnicy będą mieli okazję wykorzystać tę wiedzę w praktyce poprzez praktyczne ćwiczenia. Interakcja w grupie i informacje zwrotne od instruktora stanowią ważny element zajęć.
Kurs rozpoczyna się od wprowadzenia do podstawowych pojęć Data Science, a następnie przechodzi do narzędzi i metodologii stosowanych w Data Science.
Uczestnicy
- Deweloperzy
- Analitycy techniczni
- Konsultanci IT
Format kursu
- Część wykładu, część dyskusji, ćwiczenia i ciężka praktyka praktyczna
Uwaga
- Aby zamówić niestandardowe szkolenie dla tego kursu, skontaktuj się z nami.
Data Science for Big Data Analytics
35 godzinBig data to zbiory danych, które są tak obszerne i złożone, że tradycyjne aplikacje do przetwarzania danych nie są w stanie sobie z nimi poradzić. Wyzwania związane z dużymi zbiorami danych obejmują przechwytywanie danych, przechowywanie danych, analizę danych, wyszukiwanie, udostępnianie, przesyłanie, wizualizację, zapytania, aktualizację i prywatność informacji.
Data Science essential for Marketing/Sales professionals
21 godzinTen kurs jest przeznaczony dla Marketing specjalistów ds. sprzedaży, którzy zamierzają zagłębić się w zastosowanie nauki o danych w Marketing / sprzedaży. Kurs zapewnia szczegółowe omówienie różnych technik data science stosowanych w “upsale”, “cross-sale”, segmentacji rynku, brandingu i CLV.
Różnica między Marketing a sprzedażą - Czym różni się sprzedaż od marketingu?
W bardzo prostych słowach sprzedaż można określić jako proces, który koncentruje się lub jest skierowany do osób lub małych grup. [Z drugiej strony, sprzedaż skierowana jest do większej grupy lub ogółu społeczeństwa. [Marketing obejmuje badania (identyfikacja potrzeb klienta), rozwój produktów (wytwarzanie innowacyjnych produktów) i promowanie produktu (poprzez reklamy) oraz tworzenie świadomości na temat produktu wśród konsumentów. Jako taki marketing oznacza generowanie potencjalnych klientów. Gdy produkt jest już dostępny na rynku, zadaniem sprzedawcy jest przekonanie klienta do zakupu produktu. Sprzedaż oznacza przekształcanie potencjalnych klientów w zakupy i zamówienia, podczas gdy marketing jest ukierunkowany na dłuższe okresy, sprzedaż dotyczy krótszych celów.
Introduction to Data Science
35 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla profesjonalistów, którzy chcą rozpocząć karierę w Data Science.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Instalowanie i konfigurowanie Python i MySql.
- Zrozumienie, czym jest nauka o danych i jak może ona zwiększyć wartość praktycznie każdej firmy;
- Poznanie podstaw kodowania w Python.
- Poznanie nadzorowanych i nienadzorowanych technik uczenia maszynowego oraz sposobów ich wdrażania i interpretowania wyników;
Format kursu
- Interaktywny wykład i dyskusja.
- Dużo ćwiczeń i praktyki.
- Praktyczne wdrożenie w środowisku live-lab.
Opcje dostosowywania kursu
- Aby zamówić niestandardowe szkolenie dla tego kursu, skontaktuj się z nami.
Kaggle
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą uczyć się i budować swoją karierę w Data Science za pomocą Kaggle.
Pod koniec tego szkolenia uczestnicy będą mogli:
- Dowiedzieć się o nauce o danych i uczeniu maszynowym.
- Poznaj analitykę danych.
- Dowiedzieć się o Kaggle i jak to działa.
Machine Learning for Data Science with Python
21 godzinTo szkolenie prowadzone przez instruktora, dostępne online lub na miejscu w Polsce, jest skierowane do analityków danych, programistów na poziomie średnim lub przyszłych naukowców danych, którzy chcą zastosować techniki uczenia maszynowego w Python do wyciągania wniosków, robienia prognoz i automatyzacji decyzji opartego na danych.
Po ukończeniu tego kursu uczestnicy będą w stanie:
- Rozumieć i rozróżniać kluczowe paradygmaty uczenia maszynowego.
- Badać techniki przygotowania danych i metryki oceny modeli.
- Zastosować algorytmy uczenia maszynowego do rozwiązywania rzeczywistych problemów danych.
- Używać bibliotek Python oraz notatników Jupyter do praktycznego rozwoju.
- Budować modele do prognozowania, klasyfikacji, rekomendacji i klasyfikacji grupowej.
Accelerating Python Pandas Workflows with Modin
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą używać Modin do tworzenia i wdrażania równoległych obliczeń z Pandas w celu szybszej analizy danych.
Pod koniec tego szkolenia uczestnicy będą w stanie
- Skonfigurować niezbędne środowisko, aby rozpocząć opracowywanie Pandas przepływów pracy na dużą skalę z Modin.
- Zrozumieć funkcje, architekturę i zalety Modin.
- Znać różnice między Modin, Dask i Ray.
- Szybsze wykonywanie operacji Pandas za pomocą Modin.
- Wdrożenie całego interfejsu API i funkcji Pandas.
Python Programming for Finance
35 godzinPython to język programowania, który zyskał ogromną popularność w branży finansowej. Przyjęty przez największe banki inwestycyjne i fundusze hedgingowe, jest wykorzystywany do tworzenia szerokiej gamy aplikacji finansowych, od podstawowych programów handlowych po systemy zarządzania ryzykiem.
W tym prowadzonym przez instruktora szkoleniu na żywo uczestnicy dowiedzą się, jak używać Python do tworzenia praktycznych aplikacji do rozwiązywania szeregu konkretnych problemów związanych z finansami.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Zrozumieć podstawy języka programowania Python
- Pobrać, zainstalować i utrzymywać najlepsze narzędzia programistyczne do tworzenia aplikacji finansowych w Python
- Wybierać i wykorzystywać najbardziej odpowiednie pakiety i techniki programowania Python do organizowania, wizualizacji i analizy danych finansowych z różnych źródeł (CSV, Excel, bazy danych, web, itp.)
- Budować aplikacje rozwiązujące problemy związane z alokacją aktywów, analizą ryzyka, wynikami inwestycji i innymi
- Rozwiązywać problemy, integrować, wdrażać i optymalizować aplikację Python
Uczestnicy
- Programiści
- Analitycy
- Specjaliści od ilościowych metod (Quants)
Format kursu
- Połączenie wykładów, dyskusji, ćwiczeń i intensywnej praktyki
Uwaga
- To szkolenie ma na celu dostarczenie rozwiązań dla niektórych z głównych problemów, z jakimi borykają się profesjonaliści w branży finansowej. Jeśli jednak masz konkretny temat, narzędzie lub technikę, którą chcesz rozwinąć lub doprecyzować, skontaktuj się z nami w celu ustalenia szczegółów.
Python in Data Science
35 godzinSzkolenie pomoże uczestnikom przygotować się do tworzenia aplikacji internetowych przy użyciu Python Programming with Data Analytics. Taka wizualizacja danych jest doskonałym narzędziem dla najwyższego kierownictwa w podejmowaniu decyzji.
Qlik Sense for Data Science
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla analityków danych i programistów internetowych, którzy chcą opracowywać modele asocjacyjne w Qlik Sense.
Pod koniec tego szkolenia uczestnicy będą mogli
- Zastosować Qlik Sense w nauce o danych.
- Używać i poruszać się po interfejsie Qlik Sense.
- Budować siłę roboczą znającą się na danych dzięki interakcji AI.
- Tworzyć przedsiębiorstwo oparte na danych za pomocą Qlik Sense.
GPU Data Science with NVIDIA RAPIDS
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą używać RAPIDS do tworzenia GPU przyspieszonych potoków danych, przepływów pracy i wizualizacji, stosując algorytmy uczenia maszynowego, takie jak XGBoost, cuML itp.
Pod koniec tego szkolenia uczestnicy będą w stanie
- Skonfigurować niezbędne środowisko programistyczne do tworzenia modeli danych za pomocą NVIDIA RAPIDS.
- Zrozumieć funkcje, komponenty i zalety RAPIDS.
- Wykorzystać GPU do przyspieszenia kompleksowych potoków danych i analiz.
- Wdrożenie akcelerowanego przez GPU przygotowywania danych i ETL za pomocą cuDF i Apache Arrow.
- Dowiedz się, jak wykonywać zadania uczenia maszynowego za pomocą algorytmów XGBoost i cuML.
- Twórz wizualizacje danych i wykonuj analizę wykresów za pomocą cuXfilter i cuGraph.
SMACK Stack for Data Science
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi, którzy chcą używać stosu SMACK do tworzenia platform przetwarzania danych dla rozwiązań Big Data.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Wdrożenie architektury potoku danych do przetwarzania dużych zbiorów danych.
- Rozwój infrastruktury klastrowej przy użyciu Apache Mesos i Docker.
- Analiza danych za pomocą Spark i Scala.
- Zarządzanie nieustrukturyzowanymi danymi za pomocą Apache Cassandra.