Wprowadzenie do nauki o danych - Plan Szkolenia
To prowadzone przez instruktora szkolenie na żywo (online lub stacjonarnie) jest skierowane do profesjonalistów, którzy chcą zacząć karierę w dziedzinie nauki o danych.
Na koniec tego szkolenia uczestnicy będą w stanie:
- Zainstalować i skonfigurować Pythona i MySql.
- Poznać, czym jest nauka o danych i jak może ona dodawać wartość praktycznie dla każdego biznesu.
- Nauczyć się podstaw programowania w języku Python
- Dowiedzieć się o nadzorowanych i nienadzorowanych technikach uczenia maszynowego, jak je zaimplementować i interpretować ich wyniki.
Format kursu
- Interaktywna prezentacja i dyskusja.
- Wiele ćwiczeń i praktyki.
- Ręczna implementacja w środowisku laboratoryjnym na żywo.
Opcje dostosowywania kursu
- Aby zamówić dostosowane szkolenie dla tego kursu, prosimy o kontakt z nami w celu ustalenia szczegółów.
Plan Szkolenia
Dzień 1
- Nauka o danych: przegląd
- Część praktyczna: Zacznijmy od Pythona - podstawowe cechy języka
- Cykl życia projektu nauki o danych - część 1
- Część praktyczna: Praca z strukturowanymi danymi - biblioteka Pandas
Dzień 2
- Cykl życia projektu nauki o danych - część 2
- Część praktyczna: Praca z rzeczywistymi danymi
- Wizualizacja danych
- Część praktyczna: Biblioteka Matplotlib
Dzień 3
- SQL - część 1
- Część praktyczna: Tworzenie bazy danych MySql, tworzenie tabel, wstawianie danych i wykonywanie prostych zapytań
- SQL - część 2
- Część praktyczna: Integracja MySql z Pythonem
Dzień 4
- Uczenie nadzorowane - część 1
- Część praktyczna: Regresja
- Uczenie nadzorowane - część 2
- Część praktyczna: Klasyfikacja
Dzień 5
- Uczenie nadzorowane - część 3
- Część praktyczna: Tworzenie filtra spamu
- Uczenie nienadzorowane
- Część praktyczna: Klasterowanie obrazów za pomocą k-średnich
Wymagania
- Zrozumienie matematyki i statystyki.
- Podstawowa znajomość programowania,preferowanie języka Python.
Grupa docelowa
- Profesjonalisci zainteresowani zmianą kariery
- Ludzie ciekawi nauki o danych i analizy danych
Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.
Wprowadzenie do nauki o danych - Plan Szkolenia - Rezerwacja
Wprowadzenie do nauki o danych - Plan Szkolenia - Zapytanie
Wprowadzenie do nauki o danych - Zapytanie o Konsultacje
Opinie uczestników (1)
Rzeczowa wiedza poparta doświadczeniem praktycznym. Pierwszy raz brałem udział w szkoleniu 1 osobowym co znaczanie bardziej ułatwiło kontakt i przyswajanie wiedzy, także tutaj też duzy plus.
Mateusz Macalik - LG Energy Solution Wroclaw Sp. z o.o.
Szkolenie - Introduction to Data Science
Propozycje terminów
Szkolenia Powiązane
Wprowadzenie do nauki o danych i sztucznej inteligencji za pomocą Pythona
35 godzinTo jest pięciodniowe wprowadzenie do nauki o danych i sztucznej inteligencji (AI).
Kurs realizowany jest z przykładami i ćwiczeniami wykorzystującymi Python
Ekosystem Anaconda dla Data Scientistów
14 godzinTo szkolenie prowadzone przez instruktora, na żywo w Polsce (online lub na miejscu) jest skierowane do data scientistów, którzy chcą wykorzystać ekosystem Anaconda do przechwytywania, zarządzania i wdrażania pakietów oraz przepływów pracy analizy danych na jednej platformie.
Pod koniec szkolenia uczestnicy będą mogli:
- Zainstalować i skonfigurować komponenty i biblioteki Anaconda.
- Zrozumieć podstawowe koncepcje, funkcje i korzyści Anaconda.
- Zarządzać pakietami, środowiskami i kanałami za pomocą Anaconda Navigator.
- Korzystać z pakietów Conda, R i Python do nauki danych i uczenia maszynowego.
- Poznać praktyczne przypadki użycia i techniki zarządzania wieloma środowiskami danych.
Praktyczne wprowadzenie do nauki o danych
35 godzinUczestnicy, którzy ukończą to szkolenie, uzyskają praktyczną, zorientowaną na rzeczywistość wiedzę o Nauce o Danych oraz jej powiązanych technologiach, metodologii i narzędziach.
Uczestnicy będą mieli okazję praktycznie zastosować zdobyte wiedzę poprzez ćwiczenia praktyczne. Współpraca grupowa oraz opinie instruktora stanowią ważny element szkolenia.
Szkolenie rozpoczyna się od wprowadzenia do podstawowych pojęć Nauki o Danych, a następnie postępuje w kierunku narzędzi i metodologii wykorzystywanych w tej dziedzinie.
Odbiorcy szkolenia
- Programiści
- Analitycy techniczni
- Konsultanci IT
Format szkolenia
- Część prezentacji, część dyskusji, ćwiczenia i intensywne praktyki praktyczne
Uwaga
- Aby zamówić dostosowane szkolenie dla tego kursu, prosimy o kontakt z nami w celu uzgodnienia szczegółów.
Data Science for Big Data Analytics
35 godzinBig data to zbiory danych, które są tak obszerne i złożone, że tradycyjne aplikacje do przetwarzania danych nie są w stanie sobie z nimi poradzić. Wyzwania związane z dużymi zbiorami danych obejmują przechwytywanie danych, przechowywanie danych, analizę danych, wyszukiwanie, udostępnianie, przesyłanie, wizualizację, zapytania, aktualizację i prywatność informacji.
Data Science niezbędne dla profesjonalistów marketingowych/handlowych
21 godzin Ten kurs jest przeznaczony dla profesjonalistów z dziedziny marketingu i sprzedaży, którzy chcą pogłębić swoją wiedzę na temat zastosowań nauki o danych w marketingu/sprzedaży. Kurs dostarcza szczegółowych informacji o różnych technikach nauki o danych stosowanych do „upsale”, „cross-sale”, segmentacji rynku, budowania marki oraz CLV.
Różnice między marketingiem a sprzedażą - w jaki sposób sprzedaż i marketing różnią się między sobą?
W bardzo prostych słowach sprzedaż można określić jako proces skupiony na indywidualnych klientach lub małych grupach. Marketing natomiast kierowany jest do większych grup lub do ogółu społeczeństwa. Marketing obejmuje badania (identyfikacja potrzeb klienta), rozwój produktów (tworzenie innowacyjnych produktów) oraz promocję produktu (przez reklamy) i tworzenie świadomości produktu wśród konsumentów. Dlatego marketing oznacza generowanie potencjalnych klientów. Gdy produkt pojawia się na rynku, zadanie sprzedawcy polega na przekonaniu klienta do zakupu. Sprzedaż oznacza przekształcenie potencjalnych klientów w zakupy i zamówienia, podczas gdy marketing ma na celu dłuższy okres, sprzedaż dotyczy krótkoterminowych celów.
Jupyter dla zespołów zajmujących się nauką o danych
7 godzinTo szkolenie prowadzone przez instruktora na żywo w Polsce (online lub na miejscu) wprowadza ideę współpracy w dziedzinie nauki o danych i pokazuje, jak używać Jupytera do śledzenia i uczestniczenia jako zespół w „cyklu życia obliczeniowego pomysłu”. Uczestnicy przechodzą przez proces tworzenia przykładowego projektu z zakresu nauki o danych opartego na ekosystemie Jupytera.
Po zakończeniu szkolenia uczestnicy będą mogli:
- Zainstalować i skonfigurować Jupytera, w tym utworzyć i zintegrować repozytorium zespołowe na Git.
- Korzystać z funkcji Jupytera, takich jak rozszerzenia, interaktywne widżety, tryb wieloużytkownikowy i inne, aby umożliwić współpracę przy projekcie.
- Tworzyć, udostępniać i organizować Notebooki Jupytera z członkami zespołu.
- Wybrać spośród języków takich jak Scala, Python, R, aby pisać i wykonywać kod na systemach big data, takich jak Apache Spark, wszystko za pośrednictwem interfejsu Jupytera.
Kaggle
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą uczyć się i budować swoją karierę w Data Science za pomocą Kaggle.
Pod koniec tego szkolenia uczestnicy będą mogli:
- Dowiedzieć się o nauce o danych i uczeniu maszynowym.
- Poznaj analitykę danych.
- Dowiedzieć się o Kaggle i jak to działa.
Data Science z KNIME Analytics Platform
21 godzinKNIME Analytics Platform to prowadząca otwarta platforma do innowacji opartej na danych, która pomaga odkryć ukryty potencjał w Twoich danych, wydobywać świeże wglądania lub przewidywać nowe przyszłości. Dzięki ponad 1000 modułów, setkom gotowych do uruchomienia przykładów, szerokiemu zakresowi zintegrowanych narzędzi i największej ofercie zaawansowanych algorytmów, KNIME Analytics Platform jest idealnym zestawem narzędzi dla każdego data scientista i business analysta.
Ten kurs dotyczący KNIME Analytics Platform to idealna okazja dla początkujących, zaawansowanych użytkowników oraz ekspertów KNIME, aby zapoznać się z KNIME, nauczyć się korzystać z niego bardziej efektywnie i tworzyć jasne, kompleksowe raporty oparte na workflow KNIME.
Ta prowadzona przez instruktora, żywa trening (online lub stacjonarny) jest skierowana do profesjonalistów danych, którzy chcą korzystać z KNIME w celu rozwiązania złożonych potrzeb biznesowych.
Kurs jest przeznaczony dla publiczności, która nie zna programowania i zamierza korzystać z nowoczesnych narzędzi do implementacji scenariuszy analizy danych.
Na końcu tego treningu uczestnicy będą w stanie:
- Zainstalować i skonfigurować KNIME.
- Budować scenariusze Data Science
- Trening, testowanie i walidacja modeli
- Implementacja end-to-end łańcucha wartości modeli Data Science
Format Kursu
- Interaktywna wykłady i dyskusje.
- Wiele ćwiczeń i praktyki.
- Przełożenie na rzeczywiste laboratorium.
Opcje Dostosowywania Kursu
- Aby poprosić o dostosowany trening dla tego kursu lub dowiedzieć się więcej na temat programu, prosimy skontaktować się z nami, aby zorganizować.
Machine Learning dla Data Science z Python
21 godzinTo szkolenie prowadzone przez instruktora, dostępne online lub na miejscu w Polsce, jest skierowane do analityków danych, programistów na poziomie średnim lub przyszłych naukowców danych, którzy chcą zastosować techniki uczenia maszynowego w Python do wyciągania wniosków, robienia prognoz i automatyzacji decyzji opartego na danych.
Po ukończeniu tego kursu uczestnicy będą w stanie:
- Rozumieć i rozróżniać kluczowe paradygmaty uczenia maszynowego.
- Badać techniki przygotowania danych i metryki oceny modeli.
- Zastosować algorytmy uczenia maszynowego do rozwiązywania rzeczywistych problemów danych.
- Używać bibliotek Python oraz notatników Jupyter do praktycznego rozwoju.
- Budować modele do prognozowania, klasyfikacji, rekomendacji i klasyfikacji grupowej.
Przyspieszanie przepływów danych w Pythonie Pandas z użyciem Modin
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą używać Modin do tworzenia i wdrażania równoległych obliczeń z Pandas w celu szybszej analizy danych.
Pod koniec tego szkolenia uczestnicy będą w stanie
- Skonfigurować niezbędne środowisko, aby rozpocząć opracowywanie Pandas przepływów pracy na dużą skalę z Modin.
- Zrozumieć funkcje, architekturę i zalety Modin.
- Znać różnice między Modin, Dask i Ray.
- Szybsze wykonywanie operacji Pandas za pomocą Modin.
- Wdrożenie całego interfejsu API i funkcji Pandas.
Programowanie w Pythonie dla Finansów
35 godzinPython to język programowania, który zdobył ogromną popularność w branży finansowej. Wykorzystywany przez największe banki inwestycyjne i fundusze hedgingowe, służy do budowania szerokiego zakresu aplikacji finansowych, od podstawowych programów handlowych po systemy zarządzania ryzykiem.
W tym szkoleniu prowadzonym przez instruktora na żywo uczestnicy nauczą się, jak wykorzystywać Pythona do tworzenia praktycznych aplikacji rozwiązujących szereg konkretnych problemów związanych z finansami.
Pod koniec szkolenia uczestnicy będą potrafili:
- Zrozumieć podstawy języka programowania Python
- Pobrać, zainstalować i utrzymywać najlepsze narzędzia do tworzenia aplikacji finansowych w Pythonie
- Wybierać i wykorzystywać najbardziej odpowiednie pakiety Pythona oraz techniki programowania do organizowania, wizualizacji i analizowania danych finansowych z różnych źródeł (CSV, Excel, bazy danych, internet itp.)
- Tworzyć aplikacje rozwiązujące problemy związane z alokacją aktywów, analizą ryzyka, efektywnością inwestycji i nie tylko
- Diagnozować, integrować, wdrażać i optymalizować aplikację w Pythonie
Grupa docelowa
- Programiści
- Analitycy
- Quantowie
Format kursu
- Część wykładowa, część dyskusyjna, ćwiczenia i intensywna praktyka
Uwaga
- Niniejsze szkolenie ma na celu dostarczenie rozwiązań dla niektórych głównych problemów, z jakimi borykają się profesjonaliści w dziedzinie finansów. Jeśli jednak masz konkretny temat, narzędzie lub technikę, które chciałbyś dodać lub rozwinąć, skontaktuj się z nami, aby to uzgodnić.
Python w Naukach o Danych
35 godzinKurs szkoleniowy pomoże uczestnikom przygotować się do tworzenia aplikacji internetowych z użyciem programowania Python z analizą danych. Wizualizacja takich danych jest świetnym narzędziem dla zarządu w podejmowaniu decyzji.
Qlik Sense dla Nauki o Danych
14 godzinTen prowadzony przez instruktora, żywy kurs w Polsce (online lub na miejscu) jest skierowany do analityków danych i web developerów, którzy chcą tworzyć modele asocjacyjne w Qlik Sense.
Na koniec tego treningu uczestnicy będą mogli:
- Zastosować Qlik Sense w nauce o danych.
- Używać i nawigować po interfejsie Qlik Sense.
- Budować zasób ludzki, który potrafi korzystać z danych wraz z AI.
- Tworzyć przedsiębiorstwo oparte na danych za pomocą Qlik Sense.
Naukowa analiza danych GPU z użyciem NVIDIA RAPIDS
14 godzinTo szkolenie prowadzone przez instruktora w formie online lub stacjonarnej jest skierowane do naukowców danych i deweloperów, którzy chcą wykorzystać RAPIDS do budowy GPU-przyspieszanych przepływów danych, procesów pracy oraz wizualizacji, stosując algorytmy uczenia maszynowego, takie jak XGBoost, cuML, itd.
Po zakończeniu tego szkolenia uczestnicy będą w stanie:
- Ustawić niezbędne środowisko deweloperskie do budowy modeli danych z NVIDIA RAPIDS.
- Zrozumieć funkcje, składniki i zalety RAPIDS.
- Wykorzystywać GPU do przyspieszania przepływów danych i analiz od początku do końca.
- Wdrażać GPU-przyspieszane przygotowanie danych i ETL z użyciem cuDF i Apache Arrow.
- Nauczyć się wykonywania zadań uczenia maszynowego z użyciem algorytmów XGBoost i cuML.
- Tworzyć wizualizacje danych i wykonywać analizę grafu z użyciem cuXfilter i cuGraph.
SMACK Stack dla nauki o danych
14 godzinTo prowadzone przez instruktora, na żywo szkolenie w Polsce (online lub stacjonarne) jest skierowane do naukowców o danych, którzy chcą korzystać ze stosu SMACK do budowania platform przetwarzania danych dla rozwiązań Big Data.
Po zakończeniu tego szkolenia uczestnicy będą w stanie:
- Zaimplementować architekturę potoku danych do przetwarzania Big Data.
- Opracować infrastrukturę klastra przy użyciu Apache Mesos i Docker.
- Analizować dane za pomocą Spark i Scala.
- Zarządzać niestrukturalnymi danymi za pomocą Apache Cassandra.