Plan Szkolenia

Wstęp

Zrozumienie podstaw heterogenicznej metodologii obliczeń

Dlaczego przetwarzanie równoległe? Zrozumienie potrzeby przetwarzania równoległego

Procesory wielordzeniowe - architektura i projektowanie

Wprowadzenie do wątków, podstaw wątków i podstawowych koncepcji równoległości Programming

Zrozumienie podstaw GPU procesów optymalizacji oprogramowania

OpenMP — standard komunikacji równoległej opartej na dyrektywach Programming

Praktyczne / demonstracja różnych programów na maszynach wielordzeniowych

Wprowadzenie do GPU Informatyki

GPU s dla obliczeń równoległych

Procesory graficzne Programming Model

Praktyczne / demonstracja różnych programów na GPU

SDK, zestaw narzędzi i instalacja środowiska dla GPU

Współpraca z różnymi bibliotekami

Demonstracja GPU i narzędzi z przykładowymi programami i OpenACC

Zrozumienie modelu CUDA Programming.

Nauka architektury CUDA

Eksplorowanie i konfigurowanie środowisk programistycznych CUDA

Praca z API Runtime CUDA

Zrozumienie modelu pamięci CUDA

Odkrywanie dodatkowych funkcji API CUDA

AccessEfektywne wykorzystanie pamięci globalnej w CUDA: Globalna optymalizacja pamięci

Optymalizacja transferu danych w CUDA przy użyciu strumieni CUDA

Korzystanie z pamięci współdzielonej w CUDA

Zrozumienie i wykorzystanie operacji i instrukcji atomowych w CUDA

Studium przypadku: Podstawowe cyfrowe przetwarzanie obrazu za pomocą CUDA

Praca z wieloma procesorami graficznymi Programming

Zaawansowane profilowanie sprzętu i próbkowanie na NVIDIA/CUDA

Używanie interfejsu API dynamicznej równoległości CUDA do dynamicznego uruchamiania jądra

Podsumowanie i wnioski

Wymagania

  • C Programming
  • Linux GCC
 21 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (7)

Propozycje terminów

Powiązane Kategorie