Plan Szkolenia

Wprowadzenie do uczenia multimodalnego

  • Przegląd multimodalnej sztucznej inteligencji
  • Wyzwania związane z multimodalnym przetwarzaniem danych
  • Korzyści płynące z multimodalnych modeli LLM

Zrozumienie dużych modeli językowych

  • Architektura najnowocześniejszych modeli LLM
  • Szkolenie LLM z wykorzystaniem danych multimodalnych
  • Studia przypadków: Udane multimodalne aplikacje LLM

Przetwarzanie danych multimodalnych

  • Techniki wstępnego przetwarzania danych dla tekstu, obrazu i dźwięku
  • Ekstrakcja cech i uczenie się reprezentacji
  • Integracja danych multimodalnych w LLM

Tworzenie multimodalnych aplikacji LLM

  • Projektowanie interfejsów użytkownika dla interakcji multimodalnej
  • LLM w wirtualnych asystentach i chatbotach
  • Tworzenie wciągających doświadczeń z LLM

Ocena i optymalizacja systemów multimodalnych

  • Wskaźniki wydajności dla multimodalnych systemów LLM
  • Strategie optymalizacji dla lepszej dokładności i wydajności
  • Uwzględnianie stronniczości i sprawiedliwości w systemach multimodalnych

Praktyczne laboratorium: Tworzenie multimodalnego projektu LLM

  • Konfiguracja multimodalnego zbioru danych
  • Wdrożenie multimodalnego LLM dla konkretnego przypadku użycia
  • Testowanie i udoskonalanie systemu

Podsumowanie i kolejne kroki

Wymagania

  • Zrozumienie uczenia maszynowego i sieci neuronowych
  • Doświadczenie w programowaniu Python
  • Znajomość wstępnego przetwarzania danych dla różnych typów danych (tekst, obraz, dźwięk)

Odbiorcy

  • Naukowcy zajmujący się danymi
  • Inżynierowie uczenia maszynowego
  • Programiści
  • Naukowcy zajmujący się sztuczną inteligencją i przetwarzaniem języka naturalnego
 14 godzin

Liczba uczestników


cena netto za uczestnika

Propozycje terminów

Powiązane Kategorie