Data Mining with Python - Plan Szkolenia
To prowadzone przez instruktora szkolenie na żywo (na miejscu lub zdalnie) jest przeznaczone dla analityków danych i naukowców zajmujących się danymi, którzy chcą wdrożyć bardziej zaawansowane techniki analizy danych do eksploracji danych przy użyciu Python.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Zrozumieć kluczowe obszary eksploracji danych, w tym analizę reguł asocjacyjnych, analizę sentymentu tekstu, automatyczne streszczanie tekstu oraz wykrywanie anomalii w danych.
- Porównać i wdrożyć różne strategie rozwiązywania problemów eksploracji danych w realnych scenariuszach.
- Zrozumieć i interpretować wyniki.
Format kursu
- Interaktywny wykład i dyskusja.
- Duża ilość ćwiczeń i praktycznych zadań.
- Praktyczna implementacja w środowisku live-lab.
Opcje dostosowywania kursu
- Aby poprosić o dostosowane szkolenie w ramach tego kursu, prosimy o kontakt w celu ustalenia szczegółów.
Plan Szkolenia
Wstęp
Przegląd Data Mining pojęć
Data Mining Techniki
Znalezienie reguł stowarzyszenia
Pasujące elementy
Analizowanie sieci
Analiza sentymentu tekstu
Rozpoznawanie nazwanych jednostek
Implementacja podsumowania tekstu
Generowanie modeli tematycznych
Wykrywanie anomalii danych
Najlepsze praktyki
Podsumowanie i wnioski
Wymagania
- Zrozumienie programowania Python.
- Zrozumienie bibliotek programistycznych w ogóle.
Uczestnicy
- Analitycy danych
- Specjaliści ds. danych
Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.
Data Mining with Python - Plan Szkolenia - Booking
Data Mining with Python - Plan Szkolenia - Enquiry
Data Mining with Python - Zapytanie o Konsultacje
Zapytanie o Konsultacje
Opinie uczestników (1)
pozytywna atmosfera na szkoleniu
Piotr Wojciechowski - Centrum Informatyki Resortu Finansow
Szkolenie - Data Mining with Python
Propozycje terminów
Szkolenia Powiązane
Statystyka z SPSS Predictive Analytics SoftWare
14 godzinGoal:
Nauka pracy z SPSS na poziomie samodzielności
Adresaci:
Analitycy, badacze, naukowcy, studenci i wszyscy, którzy chcą nabyć umiejętność posługiwania się pakietem SPSS i poznać popularne techniki eksploracji danych.
Data Mining
21 godzinKurs może być prowadzony przy użyciu dowolnych narzędzi, w tym bezpłatnego oprogramowania i aplikacji do eksploracji danych typu open source.
From Data to Decision with Big Data and Predictive Analytics
21 godzinUczestnicy
Jeśli próbujesz nadać sens danym, do których masz dostęp lub chcesz analizować nieustrukturyzowane dane dostępne w sieci (takie jak Twitter, LinkedIn itp.), ten kurs jest dla Ciebie.
Jest on skierowany głównie do decydentów i osób, które muszą wybrać, jakie dane warto gromadzić i co warto analizować.
Nie jest on skierowany do osób konfigurujących rozwiązanie, jednak osoby te skorzystają z szerszej perspektywy.
Tryb dostawy
Podczas kursu delegaci zostaną zapoznani z działającymi przykładami głównie technologii open source.
Po krótkich wykładach odbędzie się prezentacja i proste ćwiczenia dla uczestników.
Używana zawartość i oprogramowanie
Całe używane oprogramowanie jest aktualizowane za każdym razem, gdy kurs jest uruchamiany, więc sprawdzamy najnowsze możliwe wersje.
Obejmuje proces pozyskiwania, formatowania, przetwarzania i analizowania danych, aby wyjaśnić, jak zautomatyzować proces podejmowania decyzji za pomocą uczenia maszynowego.
Data Mining z wykorzystaniem R
14 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R posiada szeroką gamę pakietów do eksploracji danych.
Oracle SQL Intermediate - Data Extraction
14 godzinCelem kursu jest umożliwienie uczestnikom opanowania pracy z językiem SQL w bazie danych Oracle w celu ekstrakcji danych na poziomie średniozaawansowanym.
Data Mining and Analysis
28 godzinCel:
Uczestnicy będą w stanie analizować duże zbiory danych, wyodrębniać wzorce, wybierać odpowiednią zmienną wpływającą na wyniki, tak aby nowy model był prognozowany z wynikami predykcyjnymi.
Introductory R for Biologists
28 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R znalazł również zwolenników wśród statystyków, inżynierów i naukowców bez umiejętności programowania komputerowego, którzy uważają go za łatwy w użyciu. Jego popularność wynika z rosnącego wykorzystania eksploracji danych do różnych celów, takich jak ustalanie cen reklam, szybsze znajdowanie nowych leków lub dostrajanie modeli finansowych. R posiada szeroką gamę pakietów do eksploracji danych.
Data Mining & Machine Learning with R
14 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R posiada szeroką gamę pakietów do eksploracji danych.
Data Visualization
28 godzinTen kurs jest przeznaczony dla inżynierów i decydentów pracujących w eksploracji danych i odkrywaniu wiedzy.
Dowiesz się, jak tworzyć efektywne wykresy oraz sposoby prezentowania i przedstawiania danych w sposób, który spodoba się decydentom i pomoże im zrozumieć ukryte informacje.
Data Analysis with Python, Pandas and Numpy
14 godzinTo szkolenie prowadzone przez instruktora, dostępne online lub na miejscu, jest skierowane do developerów i analityków danych na poziomie średnim, którzy chcą podnieść swoje umiejętności w zakresie analizy i manipulacji danych za pomocą Pandas i NumPy.
Na koniec tego szkolenia uczestnicy będą w stanie:
- Uruchomić środowisko rozwojowe, które obejmuje Python, Pandas i NumPy.
- Stworzyć aplikację do analizy danych za pomocą Pandas i NumPy.
- Wykonawać zaawansowane operacje przygotowania danych, sortowania i filtrowania.
- Przeprowadzać operacje agregacji i analizować dane czasowe.
- Wizualizować dane za pomocą Matplotlib i innych bibliotek wizualizacyjnych.
- Debugować i optymalizować swój kod analizy danych.
Data Science for Big Data Analytics
35 godzinBig data to zbiory danych, które są tak obszerne i złożone, że tradycyjne aplikacje do przetwarzania danych nie są w stanie sobie z nimi poradzić. Wyzwania związane z dużymi zbiorami danych obejmują przechwytywanie danych, przechowywanie danych, analizę danych, wyszukiwanie, udostępnianie, przesyłanie, wizualizację, zapytania, aktualizację i prywatność informacji.
Developing APIs with Python and FastAPI
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla programistów, którzy chcą używać FastAPI z Python do łatwiejszego i szybszego tworzenia, testowania i wdrażania interfejsów API RESTful.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Skonfigurować niezbędne środowisko programistyczne do tworzenia API z wykorzystaniem Python i FastAPI.
- Tworzyć API szybciej i łatwiej, korzystając z biblioteki FastAPI.
- Nauczyć się tworzyć modele danych i schematy oparte na Pydantic i OpenAPI.
- Połączyć API z bazą danych za pomocą SQLAlchemy.
- Zaimplementować zabezpieczenia i uwierzytelnianie w API, korzystając z narzędzi FastAPI.
- Budować obrazy kontenerów i wdrażać API internetowe na serwerze chmurowym.
Scaling Data Analysis with Python and Dask
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla analityków danych i inżynierów oprogramowania, którzy chcą używać Dask z ekosystemem Python do tworzenia, skalowania i analizowania dużych zbiorów danych.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Skonfiguruj środowisko, aby rozpocząć przetwarzanie dużych zbiorów danych za pomocą Dask i Pythona.
- Zapoznanie się z funkcjami, bibliotekami, narzędziami i interfejsami API dostępnymi w Dask.
- Zrozumienie, w jaki sposób Dask przyspiesza obliczenia równoległe w Pythonie.
- Dowiedz się, jak skalować ekosystem Pythona (Numpy, SciPy i Pandas) przy użyciu Dask.
- Optymalizacja środowiska Dask w celu utrzymania wysokiej wydajności w obsłudze dużych zbiorów danych.
Accelerating Python Pandas Workflows with Modin
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą używać Modin do tworzenia i wdrażania równoległych obliczeń z Pandas w celu szybszej analizy danych.
Pod koniec tego szkolenia uczestnicy będą w stanie
- Skonfigurować niezbędne środowisko, aby rozpocząć opracowywanie Pandas przepływów pracy na dużą skalę z Modin.
- Zrozumieć funkcje, architekturę i zalety Modin.
- Znać różnice między Modin, Dask i Ray.
- Szybsze wykonywanie operacji Pandas za pomocą Modin.
- Wdrożenie całego interfejsu API i funkcji Pandas.
FARM (FastAPI, React, and MongoDB) Full Stack Development
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla programistów, którzy chcą korzystać ze stosu FARM (FastAPI, React i MongoDB) do tworzenia dynamicznych, wydajnych i skalowalnych aplikacji internetowych.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
-
Skonfigurowanie niezbędnego środowiska programistycznego, które integruje FastAPI, React i MongoDB.
Zrozumienie kluczowych pojęć, funkcji i zalet stosu FARM.
Dowiedz się, jak tworzyć interfejsy API REST za pomocą FastAPI.
Dowiedz się, jak projektować interaktywne aplikacje za pomocą React.
Rozwijaj, testuj i wdrażaj aplikacje (front-end i back-end) przy użyciu stosu FARM.