Plan Szkolenia

Wprowadzenie do Data Analysis i Big Data

  • Co sprawia, że Big Data jest "duży"?
    • Szybkość, objętość, różnorodność, prawdziwość (VVVV)
  • Ograniczenia tradycyjnego przetwarzania danych
  • Przetwarzanie rozproszone
  • Analiza statystyczna
  • Rodzaje analizy Machine Learning
  • Data Visualization

Role i obowiązki Big Data

  • Administratorzy
  • Programiści
  • Analitycy danych

Languages Używany do Data Analysis

  • R Language
    • Dlaczego R dla Data Analysis?
    • Manipulacja danymi, obliczenia i wyświetlanie graficzne
  • Python
    • Dlaczego Python dla Data Analysis?
    • Manipulowanie, przetwarzanie, czyszczenie i przetwarzanie danych

Podejścia do Data Analysis

  • Analiza statystyczna
    • Analiza szeregów czasowych
    • Forecasting z modelami korelacji i regresji
    • Wnioskowanie Statistics (szacowanie)
    • Opisowa Statistics w zbiorach Big Data (np. obliczanie średniej)
  • Machine Learning
    • Uczenie nadzorowane a nienadzorowane
    • Klasyfikacja i grupowanie
    • Szacowanie kosztów określonych metod
    • Filtrowanie
  • Przetwarzanie języka naturalnego
    • Przetwarzanie tekstu
    • Rozumienie znaczenia tekstu
    • Automatyczne generowanie tekstu
    • Analiza nastrojów / analiza tematyczna
  • Computer Vision
    • Pozyskiwanie, przetwarzanie, analizowanie i rozumienie obrazów
    • Rekonstrukcja, interpretacja i zrozumienie scen 3D
    • Wykorzystywanie danych obrazu do podejmowania decyzji

Big Data Infrastruktura

  • Przechowywanie danych
    • Relacyjne bazy danych (SQL)
      • MySQL
      • Postgres
      • Oracle
    • Nierelacyjne bazy danych (NoSQL)
      • Cassandra
      • MongoDB
      • Neo4js
    • Zrozumienie niuansów
      • Hierarchiczne bazy danych
      • Obiektowe bazy danych
      • Bazy danych zorientowane na dokumenty
      • Graficzne bazy danych
      • Inne
  • Przetwarzanie rozproszone
    • Hadoop
      • HDFS jako rozproszony system plików
      • MapReduce dla przetwarzania rozproszonego
    • Spark
      • Kompleksowa struktura obliczeniowa klastra w pamięci do przetwarzania danych na dużą skalę
      • Strumieniowanie strukturalne
      • Spark SQL
      • Biblioteki Machine Learning: MLlib
      • Przetwarzanie grafów z GraphX
  • Scala bility
    • Chmura publiczna
      • AWS, Google, Aliyun itp.
    • Chmura prywatna
      • OpenStack, Cloud Foundry itp.
    • Automatyczna skalowalność

Wybór odpowiedniego rozwiązania dla danego problemu

Przyszłość Big Data

Podsumowanie i kolejne kroki

Wymagania

  • Ogólne zrozumienie matematyki
  • Ogólne zrozumienie programowania
  • Ogólne zrozumienie baz danych

Uczestnicy

  • Deweloperzy / programiści
  • Konsultanci IT
 35 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (7)

Propozycje terminów

Powiązane Kategorie