DeepSpeed – optymalizacja wydajności deep learning

Opis

Szkolenie koncentruje się na wykorzystaniu frameworka DeepSpeed do optymalizacji modeli uczenia głębokiego. Podczas warsztatów praktycznych uczestnicy poznają zaawansowane techniki optymalizacji wydajności trenowania modeli głębokich sieci neuronowych. Zajęcia prowadzone są w formie interaktywnych warsztatów, gdzie teoria jest natychmiast weryfikowana w praktyce poprzez implementację rzeczywistych przypadków użycia.

Profil uczestnika

    Program szkolenia jest dedykowany dla:
  • Inżynierów uczenia maszynowego pracujących nad dużymi modelami AI
  • Deweloperów sztucznej inteligencji chcących poprawić wydajność swoich modeli
  • Specjalistów MLOps poszukujących rozwiązań optymalizacyjnych
  • Architektów rozwiązań AI odpowiedzialnych za skalowalność systemów
  • Programistów Python specjalizujących się w deep learning
  • Badaczy i naukowców pracujących z modelami uczenia głębokiego
  • Inżynierów DevOps zajmujących się infrastrukturą AI

Agenda

  1. Wprowadzenie do DeepSpeed
    • Architektura i podstawowe komponenty
    • Kluczowe funkcje i możliwości
    • Integracja z popularnymi frameworkami
    • Przygotowanie środowiska deweloperskiego
  2. Techniki optymalizacji pamięci
    • Zero Redundancy Optimizer (ZeRO)
    • Optymalizacja gradientów
    • Zarządzanie pamięcią GPU
    • Techniki compresji modeli
  3. Równoległe przetwarzanie
    • Trening rozproszony
    • Pipeline parallelism
    • Tensor parallelism
    • Optymalizacja komunikacji między węzłami
  4. Zaawansowane techniki optymalizacji
    • Adaptive gradient methods
    • Mixed precision training
    • Checkpoint optimization
    • Dynamic batch sizing

Korzyści

Po ukończeniu szkolenia uczestnik będzie potrafił efektywnie wykorzystywać DeepSpeed do optymalizacji procesu trenowania modeli deep learning. Zdobędzie umiejętność implementacji zaawansowanych technik optymalizacji pamięci i wydajności w projektach AI. Nauczy się konfigurować i zarządzać rozproszonymi systemami trenowania modeli. Będzie w stanie skutecznie redukować zużycie zasobów obliczeniowych przy zachowaniu wysokiej jakości modeli. Zyska praktyczną wiedzę z zakresu skalowania treningu deep learning na klastrach obliczeniowych. Opanuje techniki debugowania i rozwiązywania problemów wydajnościowych w dużych modelach AI.

Wymagane przygotowanie uczestników

  • Praktyczna znajomość Python na poziomie średniozaawansowanym
  • Podstawowa wiedza z zakresu deep learning i sieci neuronowych
  • Doświadczenie w pracy z frameworkami uczenia maszynowego (PyTorch, TensorFlow)
  • Znajomość zagadnień związanych z obliczeniami rozproszonymi

Zagadnienia

  • Architektura i komponenty DeepSpeed
  • Zero Redundancy Optimizer (ZeRO)
  • Distributed training strategies
  • Pipeline parallelism
  • Tensor parallelism
  • Mixed precision training
  • Gradient checkpointing
  • Memory optimization techniques
  • Model compression
  • Batch size optimization
  • Communication optimization
  • Performance debugging

Poznaj naszą firmę

INFORMACJA CENOWA:
od 3750 zł netto za jedną osobę

CZAS TRWANIA (dni): 3

KOD SZKOLENIA: IT-AI-137

?
?
Zapoznałem/łam się i akceptuję politykę prywatności. *