Data Mining and Analysis - Plan Szkolenia
Cel:
Uczestnicy będą w stanie analizować duże zbiory danych, wyodrębniać wzorce, wybierać odpowiednią zmienną wpływającą na wyniki, tak aby nowy model był prognozowany z wynikami predykcyjnymi.
Plan Szkolenia
-
Wstępne przetwarzanie danych
- Data Cleaning
- Integracja i transformacja danych
- Redukcja danych
- Dyskretyzacja i generowanie hierarchii pojęć
-
Wnioskowanie statystyczne
- Rozkłady prawdopodobieństwa, zmienne losowe, centralne twierdzenie graniczne
- Pobieranie próbek
- Przedziały ufności
- Wnioskowanie statystyczne
- Testowanie hipotez
-
Wielowymiarowa regresja liniowa
- Specyfikacja
- Wybór podzbioru
- Estymacja
- Walidacja
- Przewidywanie
-
Metody klasyfikacji
- Regresja logistyczna
- Liniowa analiza dyskryminacyjna
- K-najbliżsi sąsiedzi
- Naiwny Bayes
- Porównanie metod klasyfikacji
-
Neural Networks
- Dopasowywanie sieci neuronowych
- Zagadnienia związane z trenowaniem sieci neuronowych
-
Drzewa decyzyjne
- Drzewa regresji
- Drzewa klasyfikacyjne
- Drzewa a modele liniowe
-
Bagging, Random Forest s, Boosting
- Bagging
- Random Forests
- Boosting
-
Maszyny wektorów nośnych i elastyczne rozwiązanie
- Klasyfikator z maksymalnym marginesem
- Klasyfikatory wektorów nośnych
- Maszyny wektorów nośnych
- 2 i więcej klas SVM
- Związek z regresją logistyczną
-
Analiza składowych głównych
-
Klasteryzacja
- Klasteryzacja K-średnich
- Klastrowanie K-średnich
- Klastrowanie hierarchiczne
- Klastrowanie oparte na gęstości
-
Ocena i wybór modelu
- Odchylenie, wariancja i złożoność modelu
- Błąd predykcji w próbce
- Podejście bayesowskie
- Walidacja krzyżowa
- Metody Bootstrap
Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.
Data Mining and Analysis - Plan Szkolenia - Booking
Data Mining and Analysis - Plan Szkolenia - Enquiry
Data Mining and Analysis - Zapytanie o Konsultacje
Zapytanie o Konsultacje
Opinie uczestników (7)
Forma przekazania wiedzy poprzez dokładne wyjaśnienie zagadnienia.
Katarzyna Stanczak - Mowi Poland SA
Szkolenie - Data Mining and Analysis
Bardzo dobrze przekazywana wiedza przez prowadzącego.Brak pytań bez odpowiedzi.
Karolin Papaj - Mowi Poland SA
Szkolenie - Data Mining and Analysis
Otrzymałem korzyść z wsparcia, dzielenia się przykładami z życia oraz odpowiedzi na wszystkie pytania.
Marta Melloch - Amazon Development Center Poland Sp. z o.o.
Szkolenie - Data Mining and Analysis
Przetłumaczone przez sztuczną inteligencję
Nie mogę pomóc.
Halil polat - Amazon Development Center Poland Sp. z o.o.
Szkolenie - Data Mining and Analysis
Przetłumaczone przez sztuczną inteligencję
Informacje, które otrzymałem były ciekawe, a najlepsza część była pod koniec, gdy otrzymaliśmy dane od Durex i pracowaliśmy z danymi, z którymi jesteśmy zaznajomieni, a także wykonywaliśmy operacje, aby uzyskać wyniki.
Jessica Chaar
Szkolenie - Data Mining and Analysis
Przetłumaczone przez sztuczną inteligencję
Trening praktyczny i zdolność trenera do wyjaśniania złożonych tematów w prosty sposób.
youssef chamoun
Szkolenie - Data Mining and Analysis
Przetłumaczone przez sztuczną inteligencję
I like the exercises completed.
Nour Assaf
Szkolenie - Data Mining and Analysis
Przetłumaczone przez sztuczną inteligencję
Propozycje terminów
Szkolenia Powiązane
Programming with Big Data in R
21 godzinBig Data to termin odnoszący się do rozwiązań przeznaczonych do przechowywania i przetwarzania dużych zbiorów danych. Opracowane początkowo przez Google rozwiązania Big Data ewoluowały i zainspirowały inne podobne projekty, z których wiele jest dostępnych jako open-source. R jest popularnym językiem programowania w branży finansowej.
Data Mining z wykorzystaniem R
14 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R posiada szeroką gamę pakietów do eksploracji danych.
Econometrics: Eviews and Risk Simulator
21 godzinTo prowadzone przez instruktora szkolenie na żywo (na miejscu lub zdalnie) jest przeznaczone dla każdego, kto chce nauczyć się i opanować podstawy analizy ekonometrycznej i modelowania.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Poznanie i zrozumienie podstaw ekonometrii.
- Używaj Eviews i symulatorów ryzyka.
Prognozowanie w R
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla średnio zaawansowanych analityków danych i specjalistów biznesowych, którzy chcą prognozować szeregi czasowe i automatyzować przepływy pracy analizy danych za pomocą R.
Pod koniec tego szkolenia uczestnicy będą mogli
- Zrozumieć podstawy technik prognozowania w R.
- Zastosować wygładzanie wykładnicze i modele ARIMA do analizy szeregów czasowych.
- Wykorzystać pakiet "forecast" do generowania dokładnych modeli prognostycznych.
- Zautomatyzować przepływy pracy prognozowania dla aplikacji biznesowych i badawczych.
HR Analytics for Public Organisations
14 godzinTo prowadzone przez instruktora szkolenie na żywo (online lub na miejscu) jest skierowane do specjalistów HR, którzy chcą korzystać z metod analitycznych w celu poprawy wyników organizacji. Kurs obejmuje zarówno podejścia jakościowe, jak i ilościowe, empiryczne i statystyczne.
Format kursu
- Interaktywny wykład i dyskusja.
- Wiele ćwiczeń i praktyki.
Opcje dostosowywania kursu
- Aby poprosić o spersonalizowane szkolenie dla tego kursu, skontaktuj się z nami.
Analiza Marketingowa w R
21 godzinUczestnicy
Business właściciele (kierownicy ds. marketingu, kierownicy ds. produktu, kierownicy ds. bazy klientów) i ich zespoły; specjaliści ds. analizy klientów.
Przegląd
Kurs śledzi cykl życia klienta od pozyskiwania nowych klientów, zarządzania istniejącymi klientami w celu uzyskania rentowności, utrzymania dobrych klientów i wreszcie zrozumienia, którzy klienci nas opuszczają i dlaczego. Będziemy pracować z prawdziwymi (jeśli anonimowymi) danymi z różnych branż, w tym telekomunikacji, ubezpieczeń, mediów i zaawansowanych technologii.
Format
Szkolenie prowadzone przez instruktora w trakcie pięciu półdniowych sesji z ćwiczeniami w klasie oraz zadaniami domowymi. Szkolenie może być prowadzone w klasie lub na odległość (online).
R dla analityków danych i naukowców
7 godzinUczestnicy
- menedżerowie
- deweloperzy
- naukowcy
- studenci
Format kursu
instruktaż i dyskusja online LUB warsztaty bezpośrednie
Wprowadzenie do R
21 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R znalazł również zwolenników wśród statystyków, inżynierów i naukowców bez umiejętności programowania komputerowego, którzy uważają go za łatwy w użyciu. Jego popularność wynika z rosnącego wykorzystania eksploracji danych do różnych celów, takich jak ustalanie cen reklam, szybsze znajdowanie nowych leków lub dostrajanie modeli finansowych. R posiada szeroką gamę pakietów do eksploracji danych.
Ten kurs obejmuje manipulowanie obiektami w R, w tym odczytywanie danych, uzyskiwanie dostępu do pakietów R, pisanie funkcji R i tworzenie wykresów informacyjnych. Kurs uczy, jak korzystać z oprogramowania R (https://www.r-project.org) zarówno w wierszu poleceń, jak i w graficznym interfejsie użytkownika (GUI).
R
21 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R znalazł również zwolenników wśród statystyków, inżynierów i naukowców bez umiejętności programowania komputerowego, którzy uważają go za łatwy w użyciu. Jego popularność wynika z rosnącego wykorzystania eksploracji danych do różnych celów, takich jak ustalanie cen reklam, szybsze znajdowanie nowych leków lub dostrajanie modeli finansowych. R posiada szeroką gamę pakietów do eksploracji danych.
Sieci Neuronowe w R
14 godzinKurs ten jest wprowadzeniem do stosowania sieci neuronowych w rzeczywistych problemach przy użyciu oprogramowania R-project.
Advanced R Programming
7 godzinTen kurs jest przeznaczony dla naukowców zajmujących się danymi i statystyków, którzy mają już podstawowe umiejętności kodowania R & C++ i kod R i potrzebują zaawansowanych umiejętności kodowania R.
Celem jest przeprowadzenie praktycznego, zaawansowanego kursu programowania w języku R dla uczestników zainteresowanych zastosowaniem metod w pracy.
Aby szkolenie było odpowiednie dla odbiorców, wykorzystywane są przykłady specyficzne dla danego sektora.
Statistical Analysis using SPSS
21 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla początkujących i średnio zaawansowanych profesjonalistów, którzy chcą przeprowadzić analizę statystyczną przy użyciu SPSS w celu dokładnej interpretacji danych, przeprowadzenia złożonych testów statystycznych i wygenerowania znaczących spostrzeżeń.
Pod koniec tego szkolenia uczestnicy będą mogli
- Poruszać się po interfejsie SPSS i efektywnie zarządzać zestawami danych.
- Przeprowadzać opisowe i wnioskowe analizy statystyczne.
- Przeprowadzać testy t, ANOVA, MANOVA, regresję i analizy korelacji.
- Stosować testy nieparametryczne, analizę składowych głównych i analizę czynnikową w celu zaawansowanej interpretacji danych.
Talent Acquisition Analytics
14 godzinTo prowadzone przez instruktora szkolenie na żywo (online lub na miejscu) jest skierowane do specjalistów HR i specjalistów ds. rekrutacji, którzy chcą korzystać z metod analitycznych w celu poprawy wydajności organizacji. Kurs obejmuje zarówno podejścia jakościowe, jak i ilościowe, empiryczne i statystyczne.
Format kursu
- Interaktywny wykład i dyskusja.
- Wiele ćwiczeń i praktyki.
Opcje dostosowania kursu
- Aby poprosić o spersonalizowane szkolenie dla tego kursu, skontaktuj się z nami.
Introduction to Data Visualization with Tidyverse and R
7 godzinTidyverse to zbiór wszechstronnych pakietów R do czyszczenia, przetwarzania, modelowania i wizualizacji danych. Niektóre z zawartych pakietów to: ggplot2, dplyr, tidyr, readr, purrr i tibble.
W tym prowadzonym przez instruktora szkoleniu na żywo uczestnicy dowiedzą się, jak manipulować danymi i wizualizować je za pomocą narzędzi zawartych w Tidyverse.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Przeprowadzanie analizy danych i tworzenie atrakcyjnych wizualizacji
- Wyciąganie użytecznych wniosków z różnych zestawów przykładowych danych
- Filtrowanie, sortowanie i podsumowywanie danych w celu uzyskania odpowiedzi na pytania eksploracyjne
- Przekształcanie przetworzonych danych w pouczające wykresy liniowe, słupkowe i histogramy
- Importowanie i filtrowanie danych z różnych źródeł danych, w tym plików Excel, CSV i SPSS
Uczestnicy
- Początkujący użytkownicy języka R
- Początkujący w analizie i wizualizacji danych
Format kursu
- Część wykładu, część dyskusji, ćwiczenia i ciężka praktyka praktyczna
Building Web Applications in R with Shiny
7 godzinOpis:
Jest to kurs zaprojektowany, aby nauczyć użytkowników R, jak tworzyć aplikacje internetowe bez konieczności uczenia się HTML, Javascript i CSS w różnych przeglądarkach.
Cel:
Obejmuje podstawy działania aplikacji Shiny.
Obejmuje wszystkie najczęściej używane funkcje wejścia/wyjścia/renderowania/panelowania z biblioteki Shiny.