Bądźmy w kontakcie

Plan Szkolenia

Wprowadzenie

  • Bazy danych i biblioteki grafowe

Zrozumienie danych graficznych

  • Graf jako struktura danych
  • Używanie wierzchołków (kropek) i krawędzi (linii) do modelowania rzeczywistych scenariuszy

Używanie baz danych grafowych do modelowania, przechowywania i przetwarzania danych graficznych

  • Lokalne algorytmy/przeglądy grafów
  • neo4j, OrientDB i Titan

Ćwiczenie: Modelowanie danych graficznych za pomocą neo4j

  • Modelowanie danych na tablicy

Poza bazami danych grafowymi: Przetwarzanie grafów

  • Zrozumienie grafu właściwości
  • Modelowanie grafów różnych scenariuszy (graf oprogramowania, graf dyskusji, graf koncepcji)

Rozwiązywanie rzeczywistych problemów za pomocą przeglądów

  • Algorytmiczne/kierowane przejście po grafie
  • Określanie cyklicznych zależności

Studium przypadku: Ranking uczestników dyskusji

  • Ranking według liczby i głębokości uczestnictwa w dyskusjach
  • Uwaga na temat analizy sentymentu i koncepcji

Przetwarzanie grafów: Lokalne, pamięciowe narzędzia do grafów

  • Analiza i wizualizacja grafów
  • JUNG, NetworkX i iGraph

Ćwiczenie: Modelowanie danych graficznych za pomocą NetworkX

  • Używanie NetworkX do modelowania złożonego systemu

Przetwarzanie grafów: Frameworki przetwarzania wsadowego grafów

  • Wykorzystanie Hadoop do przechowywania (HDFS) i przetwarzania (MapReduce)
  • Przegląd algorytmów iteracyjnych
  • Hama, Giraph i GraphLab

Przetwarzanie grafów: Obliczenia równoległe na grafach

  • Integracja ETL, analizy eksploracyjnej i iteracyjnych obliczeń grafowych w jednym systemie
  • GraphX

Konfiguracja i instalacja

  • Hadoop i Spark

Operatory GraphX

  • Właściwości, strukturalne, łączenie, agregacja sąsiedztwa, buforowanie i usuwanie z bufora

Iterowanie z API Pregel

  • Przekazywanie argumentów do wysyłania, odbierania i obliczania

Budowanie grafu

  • Używanie wierzchołków i krawędzi w RDD lub na dysku

Projektowanie skalowalnych algorytmów

  • Optymalizacja GraphX

Dostęp do dodatkowych algorytmów

  • PageRank, Connected Components, Triangle Counting

Ćwiczenie: Page Rank i Top Users

  • Budowanie i przetwarzanie danych graficznych przy użyciu plików tekstowych jako wejścia

Wdrażanie do produkcji

Zakończenie

Wymagania

  • Znajomość programowania w języku Java i frameworków
  • Ogólna znajomość Pythona jest pomocna, ale nie wymagana
  • Ogólne zrozumienie koncepcji baz danych

Grupa docelowa

  • Programiści
 28 godzin

Liczba uczestników


Cena za uczestnika (netto)

Opinie uczestników (3)

Propozycje terminów

Powiązane Kategorie