Data Mining & Machine Learning with R - Plan Szkolenia
R to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R posiada szeroką gamę pakietów do eksploracji danych.
Plan Szkolenia
Wprowadzenie do eksploracji danych i Machine Learning
- Uczenie statystyczne a uczenie maszynowe
- Iteracja i ocena
- Kompromis błędu systematycznego i wariancji
Regresja
- Regresja liniowa
- Uogólnienia i nieliniowość
- Ćwiczenia
Klasyfikacja
- Odświeżenie teorii Bayesa
- Naiwny Bayes
- Analiza dyskryminacyjna
- Regresja logistyczna
- K-najbliżsi sąsiedzi
- Maszyny wektorów nośnych
- Sieci neuronowe
- Drzewa decyzyjne
- Ćwiczenia
Walidacja krzyżowa i ponowne próbkowanie
- Metody walidacji krzyżowej
- Bootstrap
- Ćwiczenia
Uczenie się bez nadzoru
- Grupowanie metodą K-średnich
- Przykłady
- Wyzwania związane z uczeniem nienadzorowanym i poza metodą K-średnich
Tematy zaawansowane
- Modele złożone
- Modele mieszane
- Wzmacnianie
- Przykłady
Redukcja wielowymiarowa
- Analiza czynnikowa
- Analiza składowych głównych
- Przykłady
Wymagania
Ten kurs jest częścią zestawu umiejętności Data Scientist (Domena: Techniki i metody analityczne).
Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.
Data Mining & Machine Learning with R - Plan Szkolenia - Booking
Data Mining & Machine Learning with R - Plan Szkolenia - Enquiry
Data Mining & Machine Learning with R - Zapytanie o Konsultacje
Zapytanie o Konsultacje
Opinie uczestników (1)
Trener był bardzo wiedzący i uwzględnił obszary, które mnie interesowały.
Mohamed Salama
Szkolenie - Data Mining & Machine Learning with R
Przetłumaczone przez sztuczną inteligencję
Propozycje terminów
Szkolenia Powiązane
From Data to Decision with Big Data and Predictive Analytics
21 godzinUczestnicy
Jeśli próbujesz nadać sens danym, do których masz dostęp lub chcesz analizować nieustrukturyzowane dane dostępne w sieci (takie jak Twitter, LinkedIn itp.), ten kurs jest dla Ciebie.
Jest on skierowany głównie do decydentów i osób, które muszą wybrać, jakie dane warto gromadzić i co warto analizować.
Nie jest on skierowany do osób konfigurujących rozwiązanie, jednak osoby te skorzystają z szerszej perspektywy.
Tryb dostawy
Podczas kursu delegaci zostaną zapoznani z działającymi przykładami głównie technologii open source.
Po krótkich wykładach odbędzie się prezentacja i proste ćwiczenia dla uczestników.
Używana zawartość i oprogramowanie
Całe używane oprogramowanie jest aktualizowane za każdym razem, gdy kurs jest uruchamiany, więc sprawdzamy najnowsze możliwe wersje.
Obejmuje proces pozyskiwania, formatowania, przetwarzania i analizowania danych, aby wyjaśnić, jak zautomatyzować proces podejmowania decyzji za pomocą uczenia maszynowego.
Data Mining and Analysis
28 godzinCel:
Uczestnicy będą w stanie analizować duże zbiory danych, wyodrębniać wzorce, wybierać odpowiednią zmienną wpływającą na wyniki, tak aby nowy model był prognozowany z wynikami predykcyjnymi.
Data Mining
21 godzinKurs może być prowadzony przy użyciu dowolnych narzędzi, w tym bezpłatnego oprogramowania i aplikacji do eksploracji danych typu open source.
Data Mining z wykorzystaniem R
14 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R posiada szeroką gamę pakietów do eksploracji danych.
Data Vault: Building a Scalable Data Warehouse
28 godzinW tym prowadzonym przez instruktora szkoleniu na żywo w Polsce uczestnicy dowiedzą się, jak zbudować Data Vault.
Pod koniec tego szkolenia uczestnicy będą mogli:
- Zrozumieć architekturę i koncepcje projektowe stojące za Data Vault 2.0 oraz jego interakcję z Big Data, NoSQL i AI.
- Korzystać z technik przechowywania danych w celu umożliwienia audytu, śledzenia i inspekcji danych historycznych w hurtowni danych.
- Opracowanie spójnego i powtarzalnego procesu ETL (Extract, Transform, Load).
- Tworzenie i wdrażanie wysoce skalowalnych i powtarzalnych hurtowni.
Data Visualization
28 godzinTen kurs jest przeznaczony dla inżynierów i decydentów pracujących w eksploracji danych i odkrywaniu wiedzy.
Dowiesz się, jak tworzyć efektywne wykresy oraz sposoby prezentowania i przedstawiania danych w sposób, który spodoba się decydentom i pomoże im zrozumieć ukryte informacje.
Data Science for Big Data Analytics
35 godzinBig data to zbiory danych, które są tak obszerne i złożone, że tradycyjne aplikacje do przetwarzania danych nie są w stanie sobie z nimi poradzić. Wyzwania związane z dużymi zbiorami danych obejmują przechwytywanie danych, przechowywanie danych, analizę danych, wyszukiwanie, udostępnianie, przesyłanie, wizualizację, zapytania, aktualizację i prywatność informacji.
Foundation R
7 godzinTa instruktorzycka szkolenie na żywo w Polsce (online lub stacjonarnie) jest skierowane do profesjonalistów poziomu początkującego, którzy chcą zasilić się podstawami R i naukę pracy z danymi.
Do końca szkolenia uczestnicy będą mogli:
- Zrozumieć środowisko programistyczne R oraz interfejs RStudio.
- Importować, manipulować i badać zestawy danych przy użyciu poleceń i pakietów R.
- Wykonywać podstawową analizę statystyczną i podsumowanie danych.
- Tworzyć wizualizacje zarówno za pomocą bazowego R, jak i ggplot2.
- Efektywnie zarządzać przestrzeniami roboczymi, skryptami i pakietami.
Oracle SQL Intermediate - Data Extraction
14 godzinCelem kursu jest umożliwienie uczestnikom opanowania pracy z językiem SQL w bazie danych Oracle w celu ekstrakcji danych na poziomie średniozaawansowanym.
Pentaho Business Intelligence (PBI) - moduły raportowe
28 godzinSzkolenie "Pentaho Business Intelligence (PBI) - moduły raportowe" umożliwia zdobycie wiedzy z zakresu Business Intelligence, koncentrując się na modułach raportowych platformy Pentaho. Uczestnicy nauczą się korzystać z Report Designer, tworząc raporty od poziomu podstawowego do zaawansowanego, obejmującego zaawansowane formatowanie danych, używanie parametrów, transformacji PDI i zapytań JavaScript. Dodatkowo, szkolenie obejmuje obsługę Business Intelligence Server, harmonogramowanie, udostępnianie raportów oraz podstawy tworzenia transformacji w Pentaho Data Integration.
Pentaho Data Integration (PDI) - moduł do przetwarzania danych ETL (poziom zaawansowany)
21 godzinSzkolenie "Pentaho Data Integration (PDI) - moduł do przetwarzania danych ETL" oferuje zaawansowaną wiedzę na temat platformy Pentaho, obejmującej obszar Business Intelligence, raportowania, analiz danych i integracji danych. Skierowane jest do programistów, architektów i administratorów aplikacji, umożliwiając naukę projektowania, implementacji, monitorowania i optymalizacji procesów ETL za pomocą Pentaho Data Integration (PDI). Uczestnicy zdobędą umiejętności pracy z różnymi typami danych, filtrowania, grupowania i łączenia danych, a także harmonogramowania zadań, uruchamiania transformacji i tworzenia klastrów. Szkolenie obejmuje także tematy zaawansowane, takie jak wersjonowanie danych, transakcyjność bazodanowa, wykorzystanie JavaScript, transformacje mapujące, konwersja typów danych oraz uruchamianie zdalne.
Process Mining
21 godzinEksploracja procesów, czyli Automated Business Process Discovery (ABPD), to technika, która stosuje algorytmy do dzienników zdarzeń w celu analizy procesów biznesowych. Eksploracja procesów wykracza poza przechowywanie danych i analizę danych; łączy dane z procesami i zapewnia wgląd w trendy i wzorce, które wpływają na wydajność procesów.
Format kursu
- Kurs rozpoczyna się od przeglądu najczęściej stosowanych technik eksploracji procesów. Omawiamy różne algorytmy odkrywania procesów i narzędzia używane do odkrywania i modelowania procesów na podstawie surowych danych o zdarzeniach. Analizowane są rzeczywiste studia przypadków, a zestawy danych są analizowane przy użyciu frameworka open-source ProM.
Introductory R for Biologists
28 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R znalazł również zwolenników wśród statystyków, inżynierów i naukowców bez umiejętności programowania komputerowego, którzy uważają go za łatwy w użyciu. Jego popularność wynika z rosnącego wykorzystania eksploracji danych do różnych celów, takich jak ustalanie cen reklam, szybsze znajdowanie nowych leków lub dostrajanie modeli finansowych. R posiada szeroką gamę pakietów do eksploracji danych.
Statystyka z SPSS Predictive Analytics SoftWare
14 godzinGoal:
Nauka pracy z SPSS na poziomie samodzielności
Adresaci:
Analitycy, badacze, naukowcy, studenci i wszyscy, którzy chcą nabyć umiejętność posługiwania się pakietem SPSS i poznać popularne techniki eksploracji danych.
Introduction to Data Visualization with Tidyverse and R
7 godzinTidyverse to zbiór wszechstronnych pakietów R do czyszczenia, przetwarzania, modelowania i wizualizacji danych. Niektóre z zawartych pakietów to: ggplot2, dplyr, tidyr, readr, purrr i tibble.
W tym prowadzonym przez instruktora szkoleniu na żywo uczestnicy dowiedzą się, jak manipulować danymi i wizualizować je za pomocą narzędzi zawartych w Tidyverse.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Przeprowadzanie analizy danych i tworzenie atrakcyjnych wizualizacji
- Wyciąganie użytecznych wniosków z różnych zestawów przykładowych danych
- Filtrowanie, sortowanie i podsumowywanie danych w celu uzyskania odpowiedzi na pytania eksploracyjne
- Przekształcanie przetworzonych danych w pouczające wykresy liniowe, słupkowe i histogramy
- Importowanie i filtrowanie danych z różnych źródeł danych, w tym plików Excel, CSV i SPSS
Uczestnicy
- Początkujący użytkownicy języka R
- Początkujący w analizie i wizualizacji danych
Format kursu
- Część wykładu, część dyskusji, ćwiczenia i ciężka praktyka praktyczna