Plan Szkolenia

  1. Podstawy Big Data
    • Big Data i jego rola w świecie korporacyjnym
    • Fazy rozwoju strategii Big Data w firmie
    • Wyjaśnienie zasad stojących za holistycznym podejściem do Big Data
    • Komponenty potrzebne w platformie Big Data
    • Rozwiązania do przechowywania danych Big Data
    • Ograniczenia tradycyjnych technologii
    • Przegląd typów baz danych
    • Cztery wymiary Big Data
  2. Wpływ Big Data na biznes
    • Znaczenie Big Data dla biznesu
    • Wyzwania związane z ekstrakcją użytecznych danych
    • Integracja Big Data z danymi tradycyjnymi
  3. Technologie przechowywania Big Data
    • Przegląd technologii Big Data
      • Modele przechowywania danych
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Wybór odpowiedniej technologii Big Data
  4. Przetwarzanie Big Data
    • Łączenie i ekstrakcja danych z bazy danych
    • Przekształcanie i przygotowanie danych do przetwarzania
    • Wykorzystanie Hadoop MapReduce do przetwarzania danych rozproszonych
    • Monitorowanie i wykonywanie zadań Hadoop MapReduce
    • Bloki budulcowe rozproszonego systemu plików Hadoop
    • MapReduce i Yarn
    • Przetwarzanie danych strumieniowych za pomocą Spark
  5. Narzędzia i technologie analizy Big Data
    • Programowanie Hadoop z wykorzystaniem języka Pig Latin
    • Wykonywanie zapytań na dużych zbiorach danych za pomocą Hive
    • Eksploracja danych z wykorzystaniem Mahout
    • Narzędzia do wizualizacji i raportowania
  6. Big Data w biznesie
    • Zarządzanie i określanie potrzeb związanych z Big Data
    • Znaczenie Big Data dla biznesu
    • Wybór odpowiednich narzędzi Big Data do rozwiązania problemu

Pojęcia związane z hurtownią danych

  • Czym jest hurtownia danych?
  • Różnica między OLTP a hurtownią danych
  • Pozyskiwanie danych
  • Ekstrakcja danych
  • Przekształcanie danych.
  • Ładowanie danych
  • Magazyny danych (Data Marts)
  • Zależne vs niezależne magazyny danych
  • Projektowanie bazy danych

Pojęcia związane z testowaniem ETL:

  • Wprowadzenie.
  • Cykl życia rozwoju oprogramowania.
  • Metodologie testowania.
  • Proces przepływu pracy w testowaniu ETL.
  • Obowiązki związane z testowaniem ETL w Data Stage.       

Podstawy Big Data

  • Big Data i jego rola w świecie korporacyjnym
  • Fazy rozwoju strategii Big Data w firmie
  • Wyjaśnienie zasad stojących za holistycznym podejściem do Big Data
  • Komponenty potrzebne w platformie Big Data
  • Rozwiązania do przechowywania danych Big Data
  • Ograniczenia tradycyjnych technologii
  • Przegląd typów baz danych

Bazy danych NoSQL

Hadoop

Map Reduce

Apache Spark

Wymagania

Uczestnicy powinni posiadać podstawową wiedzę i doświadczenie w zakresie narzędzi do przechowywania danych oraz świadomość dotyczącą zarządzania dużymi zbiorami danych.

 14 godzin

Liczba uczestników


Cena za uczestnika (netto)

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie