Data Mining - Plan Szkolenia
Kurs może być prowadzony przy użyciu dowolnych narzędzi, w tym bezpłatnego oprogramowania i aplikacji do eksploracji danych typu open source.
Plan Szkolenia
Wstęp
- Eksploracja danych jako etap analizy procesu KDD („Odkrywanie wiedzy w Database s”)
- Poddziedzina informatyki
- Odkrywanie wzorców w dużych zbiorach danych
Źródła metod
- Sztuczna inteligencja
- Nauczanie maszynowe
- Statistics
- Database systemy
O co chodzi?
- Database oraz aspekty zarządzania danymi
- Wstępne przetwarzanie danych
- Rozważania dotyczące modelu i wnioskowania
- Wskaźniki zainteresowania
- Rozważania dotyczące złożoności
- Postprocessing odkrytych struktur
- Wyobrażanie sobie
- Aktualizacja online
Główne zadania eksploracji danych
- Automatyczna lub półautomatyczna analiza dużych ilości danych
- Wydobywanie nieznanych wcześniej ciekawych wzorców
- grupy rekordów danych (analiza skupień)
- nietypowe rekordy (wykrywanie anomalii)
- zależności (eksploracja reguł asocjacyjnych)
Eksploracja danych
- Wykrywanie anomalii (wykrywanie wartości odstających/zmian/odchyłek)
- Uczenie się reguł asocjacyjnych (modelowanie zależności)
- Grupowanie
- Klasyfikacja
- Regresja
- Podsumowanie
Zastosowanie i zastosowania
- Możliwe niebezpieczeństwo
- Analityka behawioralna
- Business analizy
- Proces zgodny ze standardami branżowymi dla Data Mining
- Analityka klientów
- Eksploracja danych w rolnictwie
- Eksploracja danych w meteorologii
- Eksploracja danych edukacyjnych
- Grupowanie genów człowieka
- Atak wnioskowania
- Java Data Mining
- Inteligencja typu open source
- Analiza ścieżki (obliczenia)
- Reactaktywna analiza biznesowa
Pogłębianie danych, łowienie danych, szpiegowanie danych
Wymagania
Rzetelna wiedza na temat relacyjnych struktur danych, SQL
Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.
Data Mining - Plan Szkolenia - Booking
Data Mining - Plan Szkolenia - Enquiry
Data Mining - Zapytanie o Konsultacje
Zapytanie o Konsultacje
Opinie uczestników (5)
jak trener prezentuje swoją wiedzę z tematu, który uczy
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Szkolenie - Data Vault: Building a Scalable Data Warehouse
Przetłumaczone przez sztuczną inteligencję
Przygotowany materiał. Pełen profesjonalizm. Bardzo dobry kontakt z trenerem. Pełne zaangażowanie i otwartość na zmianę zaplanowanej formuły szkolenia (bardzo cenne dyskusje na tematy otwarte, które przygotowaliśmy)
Kamil Trebacz - Bank Gospodarstwa Krajowego
Szkolenie - Pentaho Data Integration (PDI) - moduł do przetwarzania danych ETL (poziom zaawansowany)
Otwarta dyskusja z trenerem
Tomek Danowski - GE Medical Systems Polska Sp. Z O.O.
Szkolenie - Process Mining
Przetłumaczone przez sztuczną inteligencję
Bardzo przydatne, ponieważ pomaga mi zrozumieć, co możemy zrobić z danymi w naszym kontekście. Będzie mi to również pomocne.
Nicolas NEMORIN - Adecco Groupe France
Szkolenie - KNIME Analytics Platform for BI
Przetłumaczone przez sztuczną inteligencję
Czyście cieszyłem się z ćwiczeń na żywo.
Yunfa Zhu - Environmental and Climate Change Canada
Szkolenie - Foundation R
Przetłumaczone przez sztuczną inteligencję
Propozycje terminów
Szkolenia Powiązane
From Data to Decision with Big Data and Predictive Analytics
21 godzinUczestnicy
Jeśli próbujesz nadać sens danym, do których masz dostęp lub chcesz analizować nieustrukturyzowane dane dostępne w sieci (takie jak Twitter, LinkedIn itp.), ten kurs jest dla Ciebie.
Jest on skierowany głównie do decydentów i osób, które muszą wybrać, jakie dane warto gromadzić i co warto analizować.
Nie jest on skierowany do osób konfigurujących rozwiązanie, jednak osoby te skorzystają z szerszej perspektywy.
Tryb dostawy
Podczas kursu delegaci zostaną zapoznani z działającymi przykładami głównie technologii open source.
Po krótkich wykładach odbędzie się prezentacja i proste ćwiczenia dla uczestników.
Używana zawartość i oprogramowanie
Całe używane oprogramowanie jest aktualizowane za każdym razem, gdy kurs jest uruchamiany, więc sprawdzamy najnowsze możliwe wersje.
Obejmuje proces pozyskiwania, formatowania, przetwarzania i analizowania danych, aby wyjaśnić, jak zautomatyzować proces podejmowania decyzji za pomocą uczenia maszynowego.
Data Mining and Analysis
28 godzinCel:
Uczestnicy będą w stanie analizować duże zbiory danych, wyodrębniać wzorce, wybierać odpowiednią zmienną wpływającą na wyniki, tak aby nowy model był prognozowany z wynikami predykcyjnymi.
Data Mining z wykorzystaniem R
14 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R posiada szeroką gamę pakietów do eksploracji danych.
Data Vault: Building a Scalable Data Warehouse
28 godzinW tym prowadzonym przez instruktora szkoleniu na żywo w Polsce uczestnicy dowiedzą się, jak zbudować Data Vault.
Pod koniec tego szkolenia uczestnicy będą mogli:
- Zrozumieć architekturę i koncepcje projektowe stojące za Data Vault 2.0 oraz jego interakcję z Big Data, NoSQL i AI.
- Korzystać z technik przechowywania danych w celu umożliwienia audytu, śledzenia i inspekcji danych historycznych w hurtowni danych.
- Opracowanie spójnego i powtarzalnego procesu ETL (Extract, Transform, Load).
- Tworzenie i wdrażanie wysoce skalowalnych i powtarzalnych hurtowni.
Data Visualization
28 godzinTen kurs jest przeznaczony dla inżynierów i decydentów pracujących w eksploracji danych i odkrywaniu wiedzy.
Dowiesz się, jak tworzyć efektywne wykresy oraz sposoby prezentowania i przedstawiania danych w sposób, który spodoba się decydentom i pomoże im zrozumieć ukryte informacje.
Data Mining & Machine Learning with R
14 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R posiada szeroką gamę pakietów do eksploracji danych.
Data Science for Big Data Analytics
35 godzinBig data to zbiory danych, które są tak obszerne i złożone, że tradycyjne aplikacje do przetwarzania danych nie są w stanie sobie z nimi poradzić. Wyzwania związane z dużymi zbiorami danych obejmują przechwytywanie danych, przechowywanie danych, analizę danych, wyszukiwanie, udostępnianie, przesyłanie, wizualizację, zapytania, aktualizację i prywatność informacji.
Foundation R
7 godzinTa instruktorzycka szkolenie na żywo w Polsce (online lub stacjonarnie) jest skierowane do profesjonalistów poziomu początkującego, którzy chcą zasilić się podstawami R i naukę pracy z danymi.
Do końca szkolenia uczestnicy będą mogli:
- Zrozumieć środowisko programistyczne R oraz interfejs RStudio.
- Importować, manipulować i badać zestawy danych przy użyciu poleceń i pakietów R.
- Wykonywać podstawową analizę statystyczną i podsumowanie danych.
- Tworzyć wizualizacje zarówno za pomocą bazowego R, jak i ggplot2.
- Efektywnie zarządzać przestrzeniami roboczymi, skryptami i pakietami.
KNIME Analytics Platform for BI
21 godzinKNIME Analytics Platform to wiodąca opcja open source dla innowacji opartych na danych, pomagająca odkryć potencjał ukryty w danych, wydobywać nowe spostrzeżenia lub przewidywać nowe przyszłości. Dzięki ponad 1000 modułom, setkom gotowych do uruchomienia przykładów, szerokiej gamie zintegrowanych narzędzi i najszerszemu dostępnemu wyborowi zaawansowanych algorytmów, KNIME Analytics Platform jest idealnym zestawem narzędzi dla każdego analityka danych i analityka biznesowego.
Ten kurs dla KNIME Analytics Platform to idealna okazja dla początkujących, zaawansowanych użytkowników i ekspertów KNIME, aby zapoznać się z KNIME, dowiedzieć się, jak korzystać z niego bardziej efektywnie i jak tworzyć przejrzyste, kompleksowe raporty oparte na przepływach pracy KNIME
Oracle SQL Intermediate - Data Extraction
14 godzinCelem kursu jest umożliwienie uczestnikom opanowania pracy z językiem SQL w bazie danych Oracle w celu ekstrakcji danych na poziomie średniozaawansowanym.
Pentaho Business Intelligence (PBI) - moduły raportowe
28 godzinSzkolenie "Pentaho Business Intelligence (PBI) - moduły raportowe" umożliwia zdobycie wiedzy z zakresu Business Intelligence, koncentrując się na modułach raportowych platformy Pentaho. Uczestnicy nauczą się korzystać z Report Designer, tworząc raporty od poziomu podstawowego do zaawansowanego, obejmującego zaawansowane formatowanie danych, używanie parametrów, transformacji PDI i zapytań JavaScript. Dodatkowo, szkolenie obejmuje obsługę Business Intelligence Server, harmonogramowanie, udostępnianie raportów oraz podstawy tworzenia transformacji w Pentaho Data Integration.
Pentaho Data Integration (PDI) - moduł do przetwarzania danych ETL (poziom zaawansowany)
21 godzinSzkolenie "Pentaho Data Integration (PDI) - moduł do przetwarzania danych ETL" oferuje zaawansowaną wiedzę na temat platformy Pentaho, obejmującej obszar Business Intelligence, raportowania, analiz danych i integracji danych. Skierowane jest do programistów, architektów i administratorów aplikacji, umożliwiając naukę projektowania, implementacji, monitorowania i optymalizacji procesów ETL za pomocą Pentaho Data Integration (PDI). Uczestnicy zdobędą umiejętności pracy z różnymi typami danych, filtrowania, grupowania i łączenia danych, a także harmonogramowania zadań, uruchamiania transformacji i tworzenia klastrów. Szkolenie obejmuje także tematy zaawansowane, takie jak wersjonowanie danych, transakcyjność bazodanowa, wykorzystanie JavaScript, transformacje mapujące, konwersja typów danych oraz uruchamianie zdalne.
Process Mining
21 godzinEksploracja procesów, czyli Automated Business Process Discovery (ABPD), to technika, która stosuje algorytmy do dzienników zdarzeń w celu analizy procesów biznesowych. Eksploracja procesów wykracza poza przechowywanie danych i analizę danych; łączy dane z procesami i zapewnia wgląd w trendy i wzorce, które wpływają na wydajność procesów.
Format kursu
- Kurs rozpoczyna się od przeglądu najczęściej stosowanych technik eksploracji procesów. Omawiamy różne algorytmy odkrywania procesów i narzędzia używane do odkrywania i modelowania procesów na podstawie surowych danych o zdarzeniach. Analizowane są rzeczywiste studia przypadków, a zestawy danych są analizowane przy użyciu frameworka open-source ProM.
Introductory R for Biologists
28 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R znalazł również zwolenników wśród statystyków, inżynierów i naukowców bez umiejętności programowania komputerowego, którzy uważają go za łatwy w użyciu. Jego popularność wynika z rosnącego wykorzystania eksploracji danych do różnych celów, takich jak ustalanie cen reklam, szybsze znajdowanie nowych leków lub dostrajanie modeli finansowych. R posiada szeroką gamę pakietów do eksploracji danych.
Statystyka z SPSS Predictive Analytics SoftWare
14 godzinGoal:
Nauka pracy z SPSS na poziomie samodzielności
Adresaci:
Analitycy, badacze, naukowcy, studenci i wszyscy, którzy chcą nabyć umiejętność posługiwania się pakietem SPSS i poznać popularne techniki eksploracji danych.