Plan Szkolenia

Wprowadzenie do optymalizacji dużych modeli

  • Przegląd architektur dużych modeli
  • Wyzwania w dostrajaniu dużych modeli
  • Znaczenie optymalizacji pod kąstem kosztów

Techniki szkolenia rozproszonego

  • Wprowadzenie do równoległości danych i modeli
  • Frameworki do szkolenia rozproszonego: PyTorch i TensorFlow
  • Skalowanie na wielu GPU i węzłach

Kwantyzacja i przycinanie modeli

  • Zrozumienie technik kwantyzacji
  • Stosowanie przycinania w celu zmniejszenia rozmiaru modelu
  • Kompromisy między dokładnością a efektywnością

Optymalizacja sprzętu

  • Wybór odpowiedniego sprzętu do zadań dostrajania
  • Optymalizacja wykorzystania GPU i TPU
  • Wykorzystanie specjalizowanych akceleratorów dla dużych modeli

Efektywne zarządzanie danymi

  • Strategie zarządzania dużymi zbiorami danych
  • Przetwarzanie wstępne i grupowanie dla poprawy wydajności
  • Techniki augmentacji danych

Wdrażanie zoptymalizowanych modeli

  • Techniki wdrażania dostrojonych modeli
  • Monitorowanie i utrzymywanie wydajności modelu
  • Przykłady rzeczywistego wdrożenia zoptymalizowanych modeli

Zaawansowane techniki optymalizacji

  • Eksploracja adaptacji niskiego rzędu (LoRA)
  • Wykorzystanie adapterów do modułowego dostrajania
  • Przyszłe trendy w optymalizacji modeli

Podsumowanie i kolejne kroki

Wymagania

  • Doświadczenie w korzystaniu z frameworków do uczenia głębokiego, takich jak PyTorch lub TensorFlow
  • Znajomość dużych modeli językowych i ich zastosowań
  • Zrozumienie koncepcji obliczeń rozproszonych

Grupa docelowa

  • Inżynierowie uczenia maszynowego
  • Specjaliści od sztucznej inteligencji w chmurze
 21 godzin

Liczba uczestników


Cena za uczestnika (netto)

Propozycje terminów

Powiązane Kategorie