Plan Szkolenia

Wprowadzenie do wielomodalności Gemini 3

  • Możliwości w zakresie tekstu, obrazów, dźwięku i video
  • Wybór modeli i omówienie punktów końcowych
  • Kluczowe koncepcje w wielomodalnym wnioskowaniu

Praca z tekstem i strukturalnymi wejściami

  • Strategie podpowiadania dla generowania tekstu
  • Metadane, kontekstowe okna i osadzenia
  • Tekstowa koordynacja zadań wielomodalnych

Zrozumienie obrazów i przepływy wizualne

  • Analiza i interpretacja obrazów za pomocą Gemini 3
  • Tworzenie narzędzi wyszukiwania i oznaczania wizualnych
  • Budowanie interakcji między obrazem a tekstem oraz tekstem a obrazem

Przetwarzanie wejść dźwiękowych

  • Rozpoznawanie mowy i przepływy transkrypcji
  • Wykrywanie i interpretacja zdarzeń dźwiękowych
  • Integracja dźwięku z tekstem i wejściami wizualnymi

Inteligencja wideo i analiza sceny

  • Rozumowanie klatka po klatce i ciągłe wnioskowanie na podstawie video
  • Tworzenie narzędzi do streszczenia i ekstrakcji najważniejszych momentów
  • Automatyzacja i przepływy zawartości oparte na video

Projektowanie architektur aplikacji wielomodalnych

  • Łączenie różnych typów wejść w jednym potoku
  • Rozważenia dotyczące opóźnień, kosztów i zasobów obliczeniowych
  • Najlepsze praktyki dla skalowalnych systemów wielomodalnych

Prototypowanie aplikacji wielomodalnych

  • Ręczne tworzenie prototypów wielomodalnych
  • Szybka iteracja przy użyciu inżynierii wyzwań
  • Testowanie i doskonalenie przepływów doświadczeń użytkownika

Wdrażanie rozwiązań wielomodalnych

  • Strategie wdrażania i konfiguracja środowiska
  • Monitorowanie rzeczywistej wydajności
  • Rozważenia dotyczące bezpieczeństwa i zgodności

Podsumowanie i kolejne kroki

Wymagania

  • Zrozumienie współczesnych koncepcji sztucznej inteligencji
  • Doświadczenie z Pythonem lub JavaScriptem
  • Znajomość REST API

Odbiorcy

  • Projektanci
  • Twórcy treści
  • Zespoły produkcyjne techniczne
 14 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (1)

Propozycje terminów

Powiązane Kategorie