Plan Szkolenia

Zasady bezpiecznego i sprawiedliwego AI

  • Kluczowe pojęcia: bezpieczeństwo, uprzedzenia, sprawiedliwość, przejrzystość
  • Rodzaje uprzedzeń: zestaw danych, reprezentacja, algorytmiczna
  • Przegląd ram regulacyjnych (ustawa UE o AI, GDPR, itd.)

Uprzedzenia w modelach dopasowanych

  • Jak dopasowywanie może wprowadzać lub wzmagać uprzedzenia
  • Studia przypadków i rzeczywiste porażki
  • Wykrywanie uprzedzeń w zestawach danych i przewidywaniach modeli

Techniki łagodzenia uprzedzeń

  • Strategie na poziomie danych (ponowne zbalansowanie, powiększanie)
  • Strategie podczas uczenia (regularyzacja, przeciwdziałanie uprzedzeniom)
  • Strategie po przetwarzaniu (filtrowanie wyjść, kalibracja)

Bezpieczeństwo i odporność modeli

  • Wykrywanie niebezpiecznych lub szkodliwych wyjść
  • Obsługa przeciwdziałającego wejściu
  • Red teaming i testowanie pod wysokim obciążeniem modeli dopasowanych

Audytowanie i monitorowanie systemów AI

  • Wskaźniki oceny uprzedzeń i sprawiedliwości (np. równowaga demograficzna)
  • Narzędzia wyjaśniania i ramy przejrzystości
  • Praktyki monitorowania i zarządzania w ciągłości

Narzędzia i praktyczne ćwiczenia

  • Używanie bibliotek open-source (np. Fairlearn, Transformers, CheckList)
  • Praktyczne ćwiczenia: wykrywanie i łagodzenie uprzedzeń w dopasowanym modelu
  • Generowanie bezpiecznych wyjść za pomocą projektowania instrukcji i ograniczeń

Przykłady zastosowań w przedsiębiorstwach i przygotowanie do zgodności

  • Najlepsze praktyki dotyczące integracji bezpieczeństwa w procesach LLM
  • Dokumentacja i karty modeli dla zgodności
  • Przygotowanie do audytów i zewnętrznych recenzji

Podsumowanie i następne kroki

Wymagania

  • Zrozumienie modeli uczenia maszynowego i procesów trenowania
  • Doświadczenie w pracy z dostrajaniem i LLM
  • Znajomość Python i koncepcji NLP

Grupa docelowa

  • Zespoły ds. zgodności z wymaganiami AI
  • Inżynierowie ML
 14 godzin

Liczba uczestników


cena netto za uczestnika

Propozycje terminów

Powiązane Kategorie