Plan Szkolenia

Wprowadzenie do uczenia multimodalnego

  • Przegląd multimodalnej AI
  • Wyzwania w przetwarzaniu danych multimodalnych
  • Korzyści z multimodalnych LLM

Zrozumienie dużych modeli językowych

  • Architektura najnowocześniejszych LLM
  • Trenowanie LLM z danymi multimodalnymi
  • Studia przypadków: Udane aplikacje multimodalnych LLM

Przetwarzanie danych multimodalnych

  • Techniki wstępnego przetwarzania danych dla tekstu, obrazów i dźwięku
  • Ekstrakcja cech i uczenie reprezentacji
  • Integracja danych multimodalnych w LLM

Rozwijanie aplikacji multimodalnych LLM

  • Projektowanie interfejsów użytkownika dla interakcji multimodalnych
  • LLM w asystentach wirtualnych i chatbotach
  • Tworzenie immersyjnych doświadczeń z wykorzystaniem LLM

Ocena i optymalizacja systemów multimodalnych

  • Metryki wydajności dla multimodalnych LLM
  • Strategie optymalizacji dla lepszej dokładności i wydajności
  • Zarządzanie uprzedzeniami i uczciwością w systemach multimodalnych

Praktyczne laboratorium: Budowa projektu multimodalnego LLM

  • Przygotowanie multimodalnego zestawu danych
  • Implementacja multimodalnego LLM dla konkretnego przypadku użycia
  • Testowanie i udoskonalanie systemu

Podsumowanie i kolejne kroki

Wymagania

  • Zrozumienie uczenia maszynowego i sieci neuronowych
  • Doświadczenie w programowaniu w Pythonie
  • Znajomość wstępnego przetwarzania danych dla różnych typów danych (tekst, obraz, dźwięk)

Odbiorcy

  • Naukowcy zajmujący się danymi
  • Inżynierowie uczenia maszynowego
  • Programiści
  • Badacze zajmujący się AI i przetwarzaniem języka naturalnego
 14 godzin

Liczba uczestników


Cena za uczestnika (netto)

Propozycje terminów

Powiązane Kategorie