Platforma analityczna KNIME - szkolenie kompleksowe - Plan Szkolenia
KNIME to skrócona nazwa Konstanz Information Miner, czyli platformy przeznaczonej do integracji, interaktywnej analizy i raportowania danych, dostępnej na zasadach wolnego i otwartego oprogramowania. KNIME umożliwia integrację wielu różnorodnych komponentów z dziedziny uczenia maszynowego (ang. machine learning) i eksploracji danych (ang. data mining) dzięki koncepcji modułowego przetwarzania potokowego danych. Graficzny interfejs użytkownika oraz wykorzystanie JDBC pozwala na łatwe i szybkie zestawianie węzłów (ang. nodes) w celu łączenia ze sobą różnych źródeł danych z uwzględnieniem procesu wstępnego przetwarzania - ETL oraz modelowania, analizy i wizualizacji danych bez konieczności korzystania z programowania (lub w minimalnym stopniu). KNIME w pewnym stopniu, jako zaawansowane narzędzie analityczne, można uznać za alternatywę SAS.
Od 2006 r. KNIME jest wykorzystywany w badaniach farmaceutycznych, a także w innych dziedzinach, takich jak analiza danych klienta (CRM), business intelligence (BI) i analiza danych finansowych.
Plan Szkolenia
- Wprowadznie do przetwarzania i analizy danych
- Podstawowe informacje o platformie KNIME
- instalacja i konfiguracja
- omówienie interfejsu
- Omówienia platformy w aspekcie integracji narzędzi
- Wprowadzenie do pracy. Tworzenie przepływów
- Metodyka tworzenia modeli biznesowych oraz procesów przetwarzania danych
- dokumentacja pracy
- metody importu i eksportu procesów
- Omównienie podstawowych węzłów
- Omówienie procesów ETL
- Metodyki eksploracji danych
- Metodyka importu danych
- import danych z plików
- import danych z relacyjnych baz danych z wykorzystaniem SQL
- tworzenie zapytań SQL
- Omówienie zaawansowanych węzłów
- Analiza danych
- przygotowanie danych do analizy
- jakość oraz sprawdzenie danych
- statystyczne badanie danych
- modelowanie danych
- Wstęp do wykorzystania zmiennych oraz pętli
- Budowanie zaawansowanych, zautomatyzowanych procesów
- Wizualizacja wyników
- Ogólnodostępne i darmowe źródła danych
- Podstawy Data Mining
- Omówienie wybranych rodzajów zadań i procesów Data Mining
- Odkrywanie wiedzy z danych
- Web Mining
- SNA – sieci społecznościowe
- Text Mining – analiza dokumentów
- wizualizacja danych na mapach
- Integracja innych narzędzi z KNIME
- R
- Java
- Python
- Gephi
- Neo4j
- Budowanie raportów
- Podsumowanie szkolenia
Wymagania
Znajomość podstaw analizy matematycznej.
Znajomość podstaw statystyki.
Szkolenia otwarte są realizowane w przypadku uzbierania się grupy szkoleniowej liczącej co najmniej 5 osób na dany termin.
Platforma analityczna KNIME - szkolenie kompleksowe - Plan Szkolenia - Booking
Platforma analityczna KNIME - szkolenie kompleksowe - Plan Szkolenia - Enquiry
Platforma analityczna KNIME - szkolenie kompleksowe - Zapytanie o Konsultacje
Zapytanie o Konsultacje
Opinie uczestników (4)
Szeroka wiedza prowadzącego przekazywana w sposób zrozumiały nawet dla początkujących uczestników.
Magda - Izba Administracji Skarbowej
Szkolenie - Platforma analityczna KNIME - szkolenie kompleksowe
Zaangażowanie i cierpliwość prowadzącego szkolenie
Anna - Izba Administracji Skarbowej
Szkolenie - Platforma analityczna KNIME - szkolenie kompleksowe
Przystępny sposób przekazania wiedzy, dobre tempo dostosowane do umiejętności grupy
Lukasz - Izba Administracji Skarbowej
Szkolenie - Platforma analityczna KNIME - szkolenie kompleksowe
Zajęcia praktyczne, ćwiczenia, możliwość zastosowania omawianych rozwiązań w praktyce.
Agnieszka - Izba Administracji Skarbowej
Szkolenie - Platforma analityczna KNIME - szkolenie kompleksowe
Propozycje terminów
Szkolenia Powiązane
Cluster Analysis with R and SAS
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla analityków danych, którzy chcą programować z R w SAS do analizy skupień.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Wykorzystanie analizy skupień do eksploracji danych
- Opanowanie składni języka R dla rozwiązań klastrowania.
- Wdrażanie hierarchicznego i niehierarchicznego klastrowania.
- Podejmowanie decyzji opartych na danych w celu usprawnienia operacji biznesowych.
From Data to Decision with Big Data and Predictive Analytics
21 godzinUczestnicy
Jeśli próbujesz nadać sens danym, do których masz dostęp lub chcesz analizować nieustrukturyzowane dane dostępne w sieci (takie jak Twitter, LinkedIn itp.), ten kurs jest dla Ciebie.
Jest on skierowany głównie do decydentów i osób, które muszą wybrać, jakie dane warto gromadzić i co warto analizować.
Nie jest on skierowany do osób konfigurujących rozwiązanie, jednak osoby te skorzystają z szerszej perspektywy.
Tryb dostawy
Podczas kursu delegaci zostaną zapoznani z działającymi przykładami głównie technologii open source.
Po krótkich wykładach odbędzie się prezentacja i proste ćwiczenia dla uczestników.
Używana zawartość i oprogramowanie
Całe używane oprogramowanie jest aktualizowane za każdym razem, gdy kurs jest uruchamiany, więc sprawdzamy najnowsze możliwe wersje.
Obejmuje proces pozyskiwania, formatowania, przetwarzania i analizowania danych, aby wyjaśnić, jak zautomatyzować proces podejmowania decyzji za pomocą uczenia maszynowego.
KNIME Analytics Platform for BI
21 godzinKNIME Analytics Platform to wiodąca opcja open source dla innowacji opartych na danych, pomagająca odkryć potencjał ukryty w danych, wydobywać nowe spostrzeżenia lub przewidywać nowe przyszłości. Dzięki ponad 1000 modułom, setkom gotowych do uruchomienia przykładów, szerokiej gamie zintegrowanych narzędzi i najszerszemu dostępnemu wyborowi zaawansowanych algorytmów, KNIME Analytics Platform jest idealnym zestawem narzędzi dla każdego analityka danych i analityka biznesowego.
Ten kurs dla KNIME Analytics Platform to idealna okazja dla początkujących, zaawansowanych użytkowników i ekspertów KNIME, aby zapoznać się z KNIME, dowiedzieć się, jak korzystać z niego bardziej efektywnie i jak tworzyć przejrzyste, kompleksowe raporty oparte na przepływach pracy KNIME
Data Science with KNIME Analytics Platform
21 godzinKNIME Analytics Platform to wiodąca opcja open source dla innowacji opartych na danych, pomagająca odkrywać potencjał ukryty w danych, wydobywać nowe spostrzeżenia lub przewidywać nowe przyszłości. Dzięki ponad 1000 modułom, setkom gotowych do uruchomienia przykładów, szerokiej gamie zintegrowanych narzędzi i najszerszemu dostępnemu wyborowi zaawansowanych algorytmów, KNIME Analytics Platform jest idealnym zestawem narzędzi dla każdego analityka danych i analityka biznesowego.
Ten kurs dla KNIME Analytics Platform jest idealną okazją dla początkujących, zaawansowanych użytkowników i KNIME ekspertów, aby zapoznać się z KNIME, dowiedzieć się, jak korzystać z niego bardziej efektywnie i jak tworzyć przejrzyste, kompleksowe raporty oparte na KNIME przepływy pracy
Szkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla specjalistów ds. danych, którzy chcą wykorzystać KNIME do rozwiązywania złożonych potrzeb biznesowych.
Jest skierowany do odbiorców, którzy nie znają programowania i zamierzają korzystać z najnowocześniejszych narzędzi do wdrażania scenariuszy analitycznych
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Instalacja i konfiguracja KNIME.
- Tworzenie scenariuszy Data Science
- Trenuj, testuj i waliduj modele
- Wdrażanie kompleksowego łańcucha wartości modeli Data Science
Format kursu
- Interaktywny wykład i dyskusja.
- Dużo ćwiczeń i praktyki.
- Praktyczne wdrożenie w środowisku live-lab.
Opcje dostosowywania kursu
- Aby poprosić o spersonalizowane szkolenie dla tego kursu lub dowiedzieć się więcej na temat tego programu, skontaktuj się z nami.
KNIME with Python and R for Machine Learning
14 godzinTo prowadzone przez instruktora szkolenie na żywo w Polsce (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi, którzy chcą programować w Python i R dla KNIME.
Pod koniec tego szkolenia uczestnicy będą mogli
- Planować, budować i wdrażać modele uczenia maszynowego w KNIME.
- Podejmować decyzje oparte na danych dla operacji.
- Wdrażać kompleksowe projekty nauki o danych.
Oracle GoldenGate
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla administratorów systemów i programistów, którzy chcą skonfigurować, wdrożyć i zarządzać Oracle GoldenGate w celu transformacji danych.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Instalacja i konfiguracja Oracle GoldenGate.
- Zrozumienie replikacji baz danych Oracle przy użyciu narzędzia Oracle GoldenGate.
- Zrozumienie architektury Oracle GoldenGate.
- Konfigurowanie i wykonywanie replikacji i migracji bazy danych.
- Optymalizacja wydajności Oracle GoldenGate i rozwiązywanie problemów.
Pentaho Open Source BI Suite Community Edition (CE)
28 godzinPentaho Open Source BI Suite Community Edition (CE) to pakiet do analityki biznesowej, który zapewnia integrację danych, raportowanie, pulpity nawigacyjne i możliwości ładowania.
W tym prowadzonym przez instruktora szkoleniu na żywo uczestnicy dowiedzą się, jak zmaksymalizować funkcje Pentaho Open Source BI Suite Community Edition (CE).
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Instalacja i konfiguracja Pentaho Open Source BI Suite Community Edition (CE)
- Zrozumienie podstaw narzędzi Pentaho CE i ich funkcji
- Tworzenie raportów przy użyciu Pentaho CE
- Integracja danych stron trzecich z Pentaho CE
- Praca z dużymi zbiorami danych i analityka w Pentaho CE
Uczestnicy
- Programiści
- Programiści BI
Format kursu
- Część wykładu, część dyskusji, ćwiczenia i ciężka praktyka praktyczna
Uwaga
- Aby zamówić niestandardowe szkolenie dla tego kursu, skontaktuj się z nami.
Pentaho Data Integration Fundamentals
21 godzinPentaho Data Integration jest narzędziem integracji danych typu open-source do definiowania zadań i transformacji danych.
W tym prowadzonym przez instruktora szkoleniu na żywo uczestnicy dowiedzą się, jak korzystać z potężnych możliwości ETL i bogatego graficznego interfejsu użytkownika, aby zarządzać całym cyklem życia dużych zbiorów danych i maksymalizować wartość danych w swojej organizacji.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Tworzenie, wyświetlanie podglądu i uruchamianie podstawowych transformacji danych zawierających kroki i przeskoki
- Konfigurowanie i zabezpieczanie repozytorium Pentaho Enterprise Repository
- Wykorzystanie różnych źródeł danych i wygenerowanie pojedynczej, ujednoliconej wersji prawdy w formacie gotowym do analizy.
- Dostarczanie wyników do aplikacji trzecich w celu dalszego przetwarzania
Uczestnicy
- Analityk danych
- Programiści ETL
Format kursu
- Część wykładu, część dyskusji, ćwiczenia i ciężka praktyka praktyczna
Sensor Fusion Algorithms
14 godzinFuzja czujników to połączenie i integracja danych z wielu czujników w celu zapewnienia dokładniejszego, bardziej wiarygodnego i kontekstowego obrazu danych.
[Wdrożenia wymagają algorytmów do filtrowania i integrowania różnych źródeł danych;
Uczestnicy
Ten kurs jest skierowany do inżynierów, programistów i architektów, którzy zajmują się implementacjami wielu czujników.
Talend Administration Center (TAC)
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla administratorów systemów, analityków danych i analityków biznesowych, którzy chcą skonfigurować Talend Administration Center do wdrażania i zarządzania rolami i zadaniami organizacji.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Instalacja i konfiguracja Talend Centrum administracyjnego.
- Zrozumienie i wdrożenie podstaw zarządzania Talend.
- Budowanie, wdrażanie i uruchamianie projektów biznesowych lub zadań w Talend.
- Monitorowanie bezpieczeństwa zbiorów danych i opracowywanie procedur biznesowych opartych na strukturze TAC.
- Uzyskanie szerszego zrozumienia aplikacji big data.
Talend Big Data Integration
28 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla osób technicznych, które chcą wdrożyć Talend Open Studio for Big Data w celu uproszczenia procesu odczytu i analizy Big Data.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Instalacja i konfiguracja Talend Open Studio for Big Data.
- Połącz się z systemami Big Data, takimi jak Cloudera, HortonWorks, MapR, Amazon EMR i Apache.
- Zrozumienie i skonfigurowanie komponentów i konektorów Big Data w Open Studio.
- Konfiguracja parametrów do automatycznego generowania kodu MapReduce.
- Używanie interfejsu "przeciągnij i upuść" Open Studio do uruchamiania zadań Hadoop.
- Tworzenie prototypów potoków dużych zbiorów danych.
- Automatyzuj projekty integracji dużych zbiorów danych.
Talend Cloud
7 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla administratorów danych i programistów, którzy chcą zarządzać, monitorować i obsługiwać procesy integracji danych przy użyciu usług Talend Cloud.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Przejście do konsoli zarządzania Talend w celu zarządzania użytkownikami i rolami na platformie.
- Ewaluacja danych w celu znalezienia i zrozumienia odpowiednich zestawów danych.
- Utwórz potok do przetwarzania i monitorowania danych w spoczynku lub w działaniu.
- Przygotowanie danych do analizy w celu wygenerowania spostrzeżeń istotnych dla firmy.
Talend Data Stewardship
14 godzinSzkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla początkujących i średnio zaawansowanych analityków danych, którzy chcą pogłębić swoją wiedzę i umiejętności w zakresie zarządzania i poprawy jakości danych przy użyciu Talend Data Stewardship.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
-
Uzyskanie kompleksowego zrozumienia roli zarządzania danymi w utrzymaniu jakości danych.
Używanie Talend Data Stewardship do zarządzania zadaniami związanymi z jakością danych.
Tworzenie, przypisywanie i zarządzanie zadaniami w Talend Data Stewardship, w tym dostosowywanie przepływu pracy.
Korzystanie z funkcji raportowania i monitorowania narzędzia w celu śledzenia jakości danych i wysiłków związanych z zarządzaniem danymi.
Talend Open Studio for ESB
21 godzinW tym instruktażowym szkoleniu na żywo w Polsce uczestnicy dowiedzą się, jak używać Talend Open Studio for ESB do tworzenia, łączenia, pośredniczenia i zarządzania usługami i ich interakcjami.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Integracja, ulepszanie i dostarczanie technologii ESB jako pojedynczych pakietów w różnych środowiskach wdrożeniowych.
- Zrozumienie i wykorzystanie Talend najczęściej używanych komponentów Open Studio.
- Integracja dowolnej aplikacji, bazy danych, API lub usług sieciowych.
- Bezproblemowa integracja heterogenicznych systemów i aplikacji.
- Wbudowanie istniejących bibliotek kodu Java w celu rozszerzenia projektów.
- Korzystanie z komponentów i kodu społeczności w celu rozszerzenia projektów.
- Szybka integracja systemów, aplikacji i źródeł danych w środowisku Eclipse metodą "przeciągnij i upuść".
- Skrócenie czasu rozwoju i kosztów utrzymania poprzez generowanie zoptymalizowanego kodu wielokrotnego użytku.