Bądźmy w kontakcie

Plan Szkolenia

Wprowadzenie

Zrozumienie podstaw metodologii obliczeń heterogenicznych

Dlaczego obliczenia równoległe? Zrozumienie potrzeby obliczeń równoległych

Procesory wielordzeniowe - architektura i projektowanie

Wprowadzenie do wątków, podstawy wątków i podstawowe koncepcje programowania równoległego

Zrozumienie podstaw procesów optymalizacji oprogramowania GPU

OpenMP - standard programowania równoległego oparty na dyrektywach

Praktyka / Demonstracja różnych programów na maszynach wielordzeniowych

Wprowadzenie do obliczeń GPU

GPU do obliczeń równoległych

Model programowania GPU

Praktyka / Demonstracja różnych programów na GPU

SDK, zestaw narzędzi i konfiguracja środowiska dla GPU

Praca z różnymi bibliotekami

Demonstracja GPU i narzędzi z przykładowymi programami i OpenACC

Zrozumienie modelu programowania CUDA

Poznanie architektury CUDA

Eksploracja i konfiguracja środowisk programistycznych CUDA

Praca z CUDA Runtime API

Zrozumienie modelu pamięci CUDA

Eksploracja dodatkowych funkcji CUDA API

Skuteczny dostęp do pamięci globalnej w CUDA: optymalizacja pamięci globalnej

Optymalizacja transferów danych w CUDA za pomocą strumieni CUDA

Korzystanie z pamięci współdzielonej w CUDA

Zrozumienie i stosowanie operacji i instrukcji atomowych w CUDA

Studium przypadku: podstawowe przetwarzanie obrazów cyfrowych z CUDA

Praca z programowaniem wielo-GPU

Zaawansowane profilowanie i próbkowanie sprzętowe na NVIDIA / CUDA

Korzystanie z CUDA Dynamic Parallelism API do dynamicznego uruchamiania jądra

Podsumowanie i zakończenie

Wymagania

  • Programowanie w C
  • Linux GCC
 21 godzin

Liczba uczestników


Cena za uczestnika (netto)

Opinie uczestników (7)

Propozycje terminów

Powiązane Kategorie