Bądźmy w kontakcie

Plan Szkolenia

Podstawy bezpiecznej i uczciwej AI

  • Kluczowe koncepcje: bezpieczeństwo, uprzedzenia, uczciwość, przejrzystość
  • Typy uprzedzeń: w zbiorze danych, reprezentacji, algorytmiczne
  • Przegląd ram regulacyjnych (EU AI Act, GDPR itp.)

Uprzedzenia w dostrajanych modelach

  • Jak dostrajanie może wprowadzać lub wzmacniać uprzedzenia
  • Studia przypadków i rzeczywiste porażki
  • Identyfikowanie uprzedzeń w zbiorach danych i predykcjach modeli

Techniki ograniczania uprzedzeń

  • Strategie na poziomie danych (przywracanie równowagi, augmentacja)
  • Strategie podczas treningu (regularyzacja, de-biasing za pomocą przeciwnika)
  • Strategie post-processing (filtrowanie wyjść, kalibracja)

Bezpieczeństwo i odporność modeli

  • Wykrywanie niebezpiecznych lub szkodliwych wyjść
  • Obsługa przeciwnych danych wejściowych
  • Red teaming i testy obciążeniowe dostrajanych modeli

Audyt i monitorowanie systemów AI

  • Metryki oceny uprzedzeń i uczciwości (np. paritet demograficzny)
  • Narzędzia do wyjaśniania i ramy przejrzystości
  • Ciągłe monitorowanie i praktyki zarządzania

Zestawy narzędzi i praktyka

  • Korzystanie z bibliotek open-source (np. Fairlearn, Transformers, CheckList)
  • Praktyka: Wykrywanie i ograniczanie uprzedzeń w dostrajanych modelach
  • Generowanie bezpiecznych wyjść poprzez projektowanie promptów i ograniczeń

Przypadki użycia w przedsiębiorstwach i gotowość do zgodności

  • Najlepsze praktyki integracji bezpieczeństwa w przepływach pracy LLM
  • Dokumentacja i karty modeli na potrzeby zgodności
  • Przygotowanie do audytów i zewnętrznych przeglądów

Podsumowanie i kolejne kroki

Wymagania

  • Zrozumienie modeli uczenia maszynowego i procesów treningowych
  • Doświadczenie w pracy z dostrajaniem i dużymi modelami językowymi (LLM)
  • Znajomość Pythona i koncepcji NLP

Grupa docelowa

  • Zespoły ds. zgodności AI
  • Inżynierowie uczenia maszynowego
 14 godzin

Liczba uczestników


Cena za uczestnika (netto)

Propozycje terminów

Powiązane Kategorie