Plan Szkolenia

szybki przegląd

  • Źródła danych
  • Dane umysłu
  • Systemy rekomendujące
  • Cel Marketing

Typy danych

  • Strukturalne vs niestrukturalne
  • Statyczne vs przesyłane strumieniowo
  • Dane dotyczące postaw, zachowań i danych demograficznych
  • Analityka oparta na danych a analiza oparta na użytkownikach
  • ważność danych
  • Objętość, prędkość i różnorodność danych

Modele

  • Budowanie modeli
  • Modele statystyczne
  • Nauczanie maszynowe

Klasyfikacja danych

  • Grupowanie
  • kGrupy, k-średnie, najbliżsi sąsiedzi
  • Kolonie mrówek, stada ptaków

Modele predykcyjne

  • Drzewa decyzyjne
  • Maszyna wektorów nośnych
  • Naiwna klasyfikacja Bayesa
  • Sieci neuronowe
  • Model Markowa
  • Regresja
  • Metody zespołowe

Zwrot z inwestycji

  • Stosunek korzyści do kosztów
  • Koszt oprogramowania
  • Koszt rozwoju
  • Ewentualne zyski

Budowanie modeli

  • Przygotowanie danych (MapReduce)
  • Oczyszczanie danych
  • Wybór metod
  • Opracowywanie modelu
  • Model testowy
  • Ocena modelu
  • Wdrożenie i integracja modelu

Przegląd oprogramowania Open Source i oprogramowania komercyjnego

  • Wybór pakietu R-project
  • Python biblioteki
  • Hadoop i Mahout
  • Wybrane projekty Apache związane z Big Data i Analytics
  • Wybrane rozwiązanie komercyjne
  • Integracja z istniejącym oprogramowaniem i źródłami danych

Wymagania

Zrozumienie tradycyjnych metod zarządzania i analizy danych, takich jak SQL, hurtownie danych, analityka biznesowa, OLAP itp. Zrozumienie podstawowych statystyk i prawdopodobieństwa (średnia, wariancja, prawdopodobieństwo, prawdopodobieństwo warunkowe itp.)

 21 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (4)

Propozycje terminów

Powiązane Kategorie