Data Mining z wykorzystaniem R - Plan Szkolenia
R to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R posiada szeroką gamę pakietów do eksploracji danych.
Plan Szkolenia
Źródła metod
- Sztuczna inteligencja
- Nauczanie maszynowe
- Statistics
- Źródła danych
Wstępne przetwarzanie danych
- Import/eksport danych
- Eksploracja i wizualizacja danych
- Redukcja wymiarowości
- Radzenie sobie z brakującymi wartościami
- Pakiety R
Główne zadania eksploracji danych
- Automatyczna lub półautomatyczna analiza dużych ilości danych
- Wydobywanie nieznanych wcześniej ciekawych wzorców
- grupy rekordów danych (analiza skupień)
- nietypowe rekordy (wykrywanie anomalii)
- zależności (eksploracja reguł asocjacyjnych)
Eksploracja danych
- Wykrywanie anomalii (wykrywanie wartości odstających/zmian/odchyłek)
- Uczenie się reguł asocjacyjnych (modelowanie zależności)
- Grupowanie
- Klasyfikacja
- Regresja
- Podsumowanie
- Częste wydobywanie wzorców
- Eksploracja tekstu
- Drzewa decyzyjne
- Regresja
- Neural Networks
- Wydobywanie sekwencyjne
- Częste wydobywanie wzorców
Pogłębianie danych, łowienie danych, szpiegowanie danych
Wymagania
Dobra znajomość języka R.
Szkolenia zdalne są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.
Data Mining z wykorzystaniem R - Plan Szkolenia - Booking
Data Mining z wykorzystaniem R - Plan Szkolenia - ZAPYTANIE O SZKOLENIE
Data Mining z wykorzystaniem R - Zapytanie o Konsultacje
Opinie uczestników (1)
Dużo zagadnień, które można zgłębić po szkoleniu
Klaudia Kłębek
Szkolenie - Data Mining z wykorzystaniem R
Szkolenia Powiązane
Knowledge Discovery in Databases (KDD)
21 godzinOdkrywanie wiedzy w bazach danych (KDD) to proces odkrywania użytecznej wiedzy ze zbioru danych. Rzeczywiste zastosowania tej techniki eksploracji danych obejmują marketing, wykrywanie oszustw, telekomunikację i produkcję.
W tym prowadzonym przez instruktora kursie na żywo przedstawiamy procesy związane z KDD i przeprowadzamy serię ćwiczeń, aby przećwiczyć wdrażanie tych procesów.
Publiczność
- Analitycy danych lub osoby zainteresowane nauką interpretacji danych w celu rozwiązywania problemów
Format kursu
- Po teoretycznym omówieniu KDD, prowadzący przedstawi rzeczywiste przypadki, które wymagają zastosowania KDD do rozwiązania problemu. Uczestnicy przygotują, wybiorą i oczyszczą przykładowe zestawy danych oraz wykorzystają swoją wcześniejszą wiedzę na temat danych, aby zaproponować rozwiązania oparte na wynikach ich obserwacji.
Introduction to Data Visualization with Tidyverse and R
7 godzinTidyverse to zbiór wszechstronnych pakietów R do czyszczenia, przetwarzania, modelowania i wizualizacji danych. Niektóre z zawartych pakietów to: ggplot2, dplyr, tidyr, readr, purrr i tibble.
W tym prowadzonym przez instruktora szkoleniu na żywo uczestnicy dowiedzą się, jak manipulować danymi i wizualizować je za pomocą narzędzi zawartych w Tidyverse.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Przeprowadzanie analizy danych i tworzenie atrakcyjnych wizualizacji
- Wyciąganie użytecznych wniosków z różnych zestawów przykładowych danych
- Filtrowanie, sortowanie i podsumowywanie danych w celu uzyskania odpowiedzi na pytania eksploracyjne
- Przekształcanie przetworzonych danych w pouczające wykresy liniowe, słupkowe i histogramy
- Importowanie i filtrowanie danych z różnych źródeł danych, w tym plików Excel, CSV i SPSS
Publiczność
- Początkujący użytkownicy języka R
- Początkujący w analizie i wizualizacji danych
Format kursu
- Część wykładu, część dyskusji, ćwiczenia i ciężka praktyka praktyczna
Cluster Analysis with R and SAS
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla analityków danych, którzy chcą programować z R w SAS do analizy skupień.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Wykorzystanie analizy skupień do eksploracji danych
- Opanowanie składni języka R dla rozwiązań klastrowania.
- Wdrażanie hierarchicznego i niehierarchicznego klastrowania.
- Podejmowanie decyzji opartych na danych w celu usprawnienia operacji biznesowych.
From Data to Decision with Big Data and Predictive Analytics
21 godzinPubliczność
Jeśli próbujesz nadać sens danym, do których masz dostęp lub chcesz analizować nieustrukturyzowane dane dostępne w sieci (takie jak Twitter, LinkedIn itp.), ten kurs jest dla Ciebie.
Jest on skierowany głównie do decydentów i osób, które muszą wybrać, jakie dane warto gromadzić i co warto analizować.
Nie jest on skierowany do osób konfigurujących rozwiązanie, jednak osoby te skorzystają z szerszej perspektywy.
Tryb dostawy
Podczas kursu delegaci zostaną zapoznani z działającymi przykładami głównie technologii open source.
Po krótkich wykładach odbędzie się prezentacja i proste ćwiczenia dla uczestników.
Używana zawartość i oprogramowanie
Całe używane oprogramowanie jest aktualizowane za każdym razem, gdy kurs jest uruchamiany, więc sprawdzamy najnowsze możliwe wersje.
Obejmuje proces pozyskiwania, formatowania, przetwarzania i analizowania danych, aby wyjaśnić, jak zautomatyzować proces podejmowania decyzji za pomocą uczenia maszynowego.
Data Mining and Analysis
28 godzinCel:
Uczestnicy będą w stanie analizować duże zbiory danych, wyodrębniać wzorce, wybierać odpowiednią zmienną wpływającą na wyniki, tak aby nowy model był prognozowany z wynikami predykcyjnymi.
Data Mining
21 godzinKurs może być prowadzony przy użyciu dowolnych narzędzi, w tym bezpłatnego oprogramowania i aplikacji do eksploracji danych typu open source.
Data Mining with Python
14 godzinTo prowadzone przez instruktora szkolenie na żywo (na miejscu lub zdalnie) jest przeznaczone dla analityków danych i naukowców zajmujących się danymi, którzy chcą wdrożyć bardziej zaawansowane techniki analizy danych do eksploracji danych przy użyciu Python.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Zrozumienie ważnych obszarów eksploracji danych, w tym eksploracji reguł asocjacyjnych, analizy sentymentu tekstu, automatycznego podsumowywania tekstu i wykrywania anomalii w danych.
- Porównać i wdrożyć różne strategie rozwiązywania rzeczywistych problemów związanych z eksploracją danych.
- Zrozumienie i interpretacja wyników;
Format kursu
- Interaktywny wykład i dyskusja.
- Dużo ćwiczeń i praktyki.
- Praktyczne wdrożenie w środowisku live-lab.
Opcje dostosowywania kursu
- Aby zamówić niestandardowe szkolenie dla tego kursu, skontaktuj się z nami.
Data Vault: Building a Scalable Data Warehouse
28 godzinW tym instruktażowym szkoleniu na żywo w Polsce uczestnicy dowiedzą się, jak zbudować Data Vault.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Zrozumienie architektury i koncepcji projektowych stojących za Data Vault 2.0 oraz jego interakcji z Big Data, NoSQL i AI.
- Używanie technik składowania danych w celu umożliwienia audytu, śledzenia i inspekcji danych historycznych w hurtowni danych.
- Rozwijanie spójnego i powtarzalnego procesu ETL (Extract, Transform, Load).
- Budowanie i wdrażanie wysoce skalowalnych i powtarzalnych hurtowni.
Data Visualization
28 godzinTen kurs jest przeznaczony dla inżynierów i decydentów pracujących w eksploracji danych i odkrywaniu wiedzy.
Dowiesz się, jak tworzyć efektywne wykresy oraz sposoby prezentowania i przedstawiania danych w sposób, który spodoba się decydentom i pomoże im zrozumieć ukryte informacje.
Data Mining with Excel
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla analityków danych, którzy chcą używać Excel do eksploracji danych.
- Pod koniec tego szkolenia uczestnicy będą w stanie:
- Eksplorować dane za pomocą programu Excel w celu eksploracji i analizy danych.
- Używać Microsoft algorytmów do eksploracji danych.
- Zrozumieć koncepcje eksploracji danych w programie Excel.
Data Mining with Weka
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla początkujących i średniozaawansowanych analityków danych i naukowców zajmujących się danymi, którzy chcą używać Weka do wykonywania zadań eksploracji danych.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Instalacja i konfiguracja Weka.
- Zrozumienie środowiska Weka i środowiska pracy.
- Wykonywanie zadań eksploracji danych przy użyciu Weka.
Data Mining & Machine Learning with R
14 godzinR to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R posiada szeroką gamę pakietów do eksploracji danych.
Data Science for Big Data Analytics
35 godzinBig data to zbiory danych, które są tak obszerne i złożone, że tradycyjne aplikacje do przetwarzania danych nie są w stanie sobie z nimi poradzić. Wyzwania związane z dużymi zbiorami danych obejmują przechwytywanie danych, przechowywanie danych, analizę danych, wyszukiwanie, udostępnianie, przesyłanie, wizualizację, zapytania, aktualizację i prywatność informacji.
Foundation R
7 godzinCelem kursu jest umożliwienie uczestnikom opanowania podstaw języka R i pracy z danymi.
Process Mining – wprowadzenie
21 godzinFormat kursu
Kurs rozpoczyna się od wprowadzenia do świata Process Mining. Omawiamy podstawowe narzędzia do odkrywania i modelowania procesów w oparciu o surowe dane z dzienników zdarzeń. Kurs skupia się wprowadzeniu pojęć z dziedziny Process Mining oraz możliwych zastosowaniach. Studia przypadków z życia codziennego analizowane są w formie ćwiczeń przy użyciu platform open source m.in. ProM.