Data Mining z Python - Plan Szkolenia
To szkolenie prowadzone przez instruktora (online lub stacjonarnie) jest skierowane do analityków danych i naukowców danych, którzy chcą wdrożyć bardziej zaawansowane techniki analizy danych dla górnictwa danych za pomocą Python.
Na koniec tego szkolenia uczestnicy będą mogli:
- Zrozumieć ważne dziedziny górnictwa danych, w tym wydobywanie reguł asocjacyjnych, analiza sentymentu tekstu, automatyczne skracanie tekstu oraz wykrywanie anomalii danych.
- Porównywać i wdrażać różne strategie rozwiązywania realnych problemów górnictwa danych.
- Zrozumieć i interpretować wyniki.
Format kursu
- Interaktywne wykłady i dyskusje.
- Wiele ćwiczeń i praktyki.
- Wdrożenie w rękawiczce w środowisku live-lab.
Opcje dostosowania kursu
- Aby złożyć wniosek o dostosowane szkolenie dla tego kursu, prosimy o kontakt z nami w celu uzgodnienia.
Plan Szkolenia
Wprowadzenie
Przegląd koncepcji Data Mining
Data Mining Techniki
Wyszukiwanie reguł asocjacyjnych
Dopasowywanie encji
Analiza sieci
Analiza sentymentu tekstu
Rozpoznawanie nazwanych encji
Wdrażanie skrótowania tekstu
Generowanie modeli tematów
Wykrywanie anomalii danych
Najlepsze praktyki
Podsumowanie i wnioski
Wymagania
- Znajomość Python programowania.
- Znajomość bibliotek Python w ogóle.
Grupa docelowa
- Analitycy danych
- Naukowcy danych
Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.
Data Mining z Python - Plan Szkolenia - Booking
Data Mining z Python - Plan Szkolenia - Enquiry
Data Mining z Python - Zapytanie o Konsultacje
Zapytanie o Konsultacje
Opinie uczestników (1)
pozytywna atmosfera na szkoleniu
Piotr Wojciechowski - Centrum Informatyki Resortu Finansow
Szkolenie - Data Mining with Python
Propozycje terminów
Szkolenia Powiązane
Z danych do decyzji z Big Data i analityką predykcyjną
21 godzinUczestnicy
Jeśli próbujesz nadać sens danym, do których masz dostęp lub chcesz analizować nieustrukturyzowane dane dostępne w sieci (takie jak Twitter, LinkedIn itp.), ten kurs jest dla Ciebie.
Jest on skierowany głównie do decydentów i osób, które muszą wybrać, jakie dane warto gromadzić i co warto analizować.
Nie jest on skierowany do osób konfigurujących rozwiązanie, jednak osoby te skorzystają z szerszej perspektywy.
Tryb dostawy
Podczas kursu delegaci zostaną zapoznani z działającymi przykładami głównie technologii open source.
Po krótkich wykładach odbędzie się prezentacja i proste ćwiczenia dla uczestników.
Używana zawartość i oprogramowanie
Całe używane oprogramowanie jest aktualizowane za każdym razem, gdy kurs jest uruchamiany, więc sprawdzamy najnowsze możliwe wersje.
Obejmuje proces pozyskiwania, formatowania, przetwarzania i analizowania danych, aby wyjaśnić, jak zautomatyzować proces podejmowania decyzji za pomocą uczenia maszynowego.
Skalowanie analizy danych z użyciem Pythona i Dask
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla analityków danych i inżynierów oprogramowania, którzy chcą używać Dask z ekosystemem Python do tworzenia, skalowania i analizowania dużych zbiorów danych.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Skonfiguruj środowisko, aby rozpocząć przetwarzanie dużych zbiorów danych za pomocą Dask i Pythona.
- Zapoznanie się z funkcjami, bibliotekami, narzędziami i interfejsami API dostępnymi w Dask.
- Zrozumienie, w jaki sposób Dask przyspiesza obliczenia równoległe w Pythonie.
- Dowiedz się, jak skalować ekosystem Pythona (Numpy, SciPy i Pandas) przy użyciu Dask.
- Optymalizacja środowiska Dask w celu utrzymania wysokiej wydajności w obsłudze dużych zbiorów danych.
Data Mining and Analysis
28 godzinCel:
Uczestnicy będą w stanie analizować duże zbiory danych, wyodrębniać wzorce, wybierać odpowiednią zmienną wpływającą na wyniki, tak aby nowy model był prognozowany z wynikami predykcyjnymi.
Data Mining
21 godzinKurs może być prowadzony przy użyciu dowolnych narzędzi, w tym bezpłatnego oprogramowania i aplikacji do eksploracji danych typu open source.
Data Mining z wykorzystaniem R
14 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R posiada szeroką gamę pakietów do eksploracji danych.
Data Analysis with Python, Pandas and Numpy
14 godzinTo szkolenie prowadzone przez instruktora, dostępne online lub na miejscu, jest skierowane do developerów i analityków danych na poziomie średnim, którzy chcą podnieść swoje umiejętności w zakresie analizy i manipulacji danych za pomocą Pandas i NumPy.
Na koniec tego szkolenia uczestnicy będą w stanie:
- Uruchomić środowisko rozwojowe, które obejmuje Python, Pandas i NumPy.
- Stworzyć aplikację do analizy danych za pomocą Pandas i NumPy.
- Wykonawać zaawansowane operacje przygotowania danych, sortowania i filtrowania.
- Przeprowadzać operacje agregacji i analizować dane czasowe.
- Wizualizować dane za pomocą Matplotlib i innych bibliotek wizualizacyjnych.
- Debugować i optymalizować swój kod analizy danych.
Wizualizacja Danych
28 godzinTen kurs jest przeznaczony dla inżynierów i decydentów pracujących w eksploracji danych i odkrywaniu wiedzy.
Dowiesz się, jak tworzyć efektywne wykresy oraz sposoby prezentowania i przedstawiania danych w sposób, który spodoba się decydentom i pomoże im zrozumieć ukryte informacje.
Data Mining & Machine Learning z R
14 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R posiada szeroką gamę pakietów do eksploracji danych.
Data Science for Big Data Analytics
35 godzinBig data to zbiory danych, które są tak obszerne i złożone, że tradycyjne aplikacje do przetwarzania danych nie są w stanie sobie z nimi poradzić. Wyzwania związane z dużymi zbiorami danych obejmują przechwytywanie danych, przechowywanie danych, analizę danych, wyszukiwanie, udostępnianie, przesyłanie, wizualizację, zapytania, aktualizację i prywatność informacji.
FARM (FastAPI, React, and MongoDB) Full Stack Development
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla programistów, którzy chcą korzystać ze stosu FARM (FastAPI, React i MongoDB) do tworzenia dynamicznych, wydajnych i skalowalnych aplikacji internetowych.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
-
Skonfigurowanie niezbędnego środowiska programistycznego, które integruje FastAPI, React i MongoDB.
Zrozumienie kluczowych pojęć, funkcji i zalet stosu FARM.
Dowiedz się, jak tworzyć interfejsy API REST za pomocą FastAPI.
Dowiedz się, jak projektować interaktywne aplikacje za pomocą React.
Rozwijaj, testuj i wdrażaj aplikacje (front-end i back-end) przy użyciu stosu FARM.
Rozwijanie API za pomocą Python i FastAPI
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla programistów, którzy chcą używać FastAPI z Python do łatwiejszego i szybszego tworzenia, testowania i wdrażania interfejsów API RESTful.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Skonfigurować niezbędne środowisko programistyczne do tworzenia API z wykorzystaniem Python i FastAPI.
- Tworzyć API szybciej i łatwiej, korzystając z biblioteki FastAPI.
- Nauczyć się tworzyć modele danych i schematy oparte na Pydantic i OpenAPI.
- Połączyć API z bazą danych za pomocą SQLAlchemy.
- Zaimplementować zabezpieczenia i uwierzytelnianie w API, korzystając z narzędzi FastAPI.
- Budować obrazy kontenerów i wdrażać API internetowe na serwerze chmurowym.
Przyspieszanie przepływów danych w Pythonie Pandas z użyciem Modin
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą używać Modin do tworzenia i wdrażania równoległych obliczeń z Pandas w celu szybszej analizy danych.
Pod koniec tego szkolenia uczestnicy będą w stanie
- Skonfigurować niezbędne środowisko, aby rozpocząć opracowywanie Pandas przepływów pracy na dużą skalę z Modin.
- Zrozumieć funkcje, architekturę i zalety Modin.
- Znać różnice między Modin, Dask i Ray.
- Szybsze wykonywanie operacji Pandas za pomocą Modin.
- Wdrożenie całego interfejsu API i funkcji Pandas.
Oracle SQL Intermediate - ekstrakcja danych
14 godzinCelem kursu jest umożliwienie uczestnikom opanowania pracy z językiem SQL w bazie danych Oracle do wydobycia danych na poziomie średnim.
Wprowadzenie do R dla biologów
28 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R znalazł również zwolenników wśród statystyków, inżynierów i naukowców bez umiejętności programowania komputerowego, którzy uważają go za łatwy w użyciu. Jego popularność wynika z rosnącego wykorzystania eksploracji danych do różnych celów, takich jak ustalanie cen reklam, szybsze znajdowanie nowych leków lub dostrajanie modeli finansowych. R posiada szeroką gamę pakietów do eksploracji danych.
Statystyka z SPSS Predictive Analytics SoftWare
14 godzinGoal:
Nauka pracy z SPSS na poziomie samodzielności
Adresaci:
Analitycy, badacze, naukowcy, studenci i wszyscy, którzy chcą nabyć umiejętność posługiwania się pakietem SPSS i poznać popularne techniki eksploracji danych.