Rozszerzone programowanie GPU z NVIDIA

Opis

Trzydniowe zaawansowane szkolenie z programowania GPU, koncentrujące się na złożonych technikach optymalizacji i zaawansowanych wzorcach implementacyjnych w CUDA. Program obejmuje zaawansowane aspekty architektury GPU, techniki strojenia wydajności oraz implementację złożonych algorytmów równoległych. Uczestnicy pracują na rzeczywistych przypadkach użycia i rozwiązują praktyczne problemy optymalizacyjne.

Profil uczestnika

  • Doświadczeni programiści CUDA
  • Architekci rozwiązań HPC
  • Specjaliści ds. optymalizacji
  • Deweloperzy deep learning
  • Inżynierowie wydajności
  • Programiści aplikacji naukowych
  • Eksperci ds. obliczeń równoległych

Agenda

  1. Zaawansowana architektura GPU
    • Hierarchia pamięci
    • Modele wykonania
    • Planowanie wątków
    • Optymalizacja przepustowości
  2. Techniki programowania
    • Współbieżność strumieni
    • Dynamic parallelism
    • Unified Memory
    • Atomic operations
  3. Wzorce wydajnościowe
    • Cache optimization
    • Memory coalescing
    • Bank conflicts
    • Occupancy optimization
  4. Implementacje praktyczne
    • Deep learning inference
    • Graph algorithms
    • Scientific computing
    • Signal processing

Korzyści

Uczestnik rozwinie zaawansowane umiejętności w zakresie optymalizacji i strojenia wydajności aplikacji CUDA. Nabędzie głębokie zrozumienie architektury GPU i mechanizmów wykonania kodu. Zdobędzie praktyczną wiedzę o zaawansowanych technikach programowania równoległego. Nauczy się implementować złożone algorytmy z wykorzystaniem najnowszych funkcji CUDA. Pozna zaawansowane metody profilowania i analizy wydajności. Zyska umiejętności w zakresie projektowania i implementacji wysokowydajnych rozwiązań obliczeniowych.

Wymagane przygotowanie uczestników

  • Praktyczne doświadczenie w programowaniu CUDA
  • Zaawansowana znajomość C/C++
  • Doświadczenie w optymalizacji wydajności
  • Znajomość algorytmów równoległych

Zagadnienia

  • Zaawansowana architektura GPU
  • Optymalizacja pamięci
  • Współbieżność strumieni
  • Dynamic parallelism
  • Unified Memory
  • Bank conflicts
  • Memory coalescing
  • Occupancy optimization
  • Profilowanie wydajności
  • Debugowanie
  • Wzorce implementacyjne
  • Optymalizacja algorytmów

Poznaj naszą firmę

INFORMACJA CENOWA:
od 5250 zł netto za jedną osobę

CZAS TRWANIA (dni): 3

KOD SZKOLENIA: IT-SD-686

?
?
Zapoznałem/łam się i akceptuję politykę prywatności. *