Plan Szkolenia

Podstawy bezpiecznej i sprawiedliwej AI

  • Kluczowe pojęcia: bezpieczeństwo, uprzedzenia, sprawiedliwość, przejrzystość
  • Typy uprzedzeń: w zbiorach danych, reprezentacji, algorytmiczne
  • Przegląd ram regulacyjnych (np. AI Act UE, GDPR)

Uprzedzenia w dostosowanych modelach

  • Jak dostosowanie może wprowadzać lub wzmacniać uprzedzenia
  • Studia przypadków i rzeczywiste błędy
  • Identyfikowanie uprzedzeń w zbiorach danych i przewidywaniach modeli

Techniki redukcji uprzedzeń

  • Strategie na poziomie danych (równoważenie, augmentacja)
  • Strategie podczas treningu (regularyzacja, de-biasing przeciwnikowy)
  • Strategie post-processingu (filtrowanie wyników, kalibracja)

Bezpieczeństwo i odporność modeli

  • Wykrywanie niebezpiecznych lub szkodliwych wyników
  • Obsługa przeciwniczych danych wejściowych
  • Testowanie przeciwnikowe i testy obciążeniowe dostosowanych modeli

Audyt i monitorowanie systemów AI

  • Metryki oceny uprzedzeń i sprawiedliwości (np. parowanie demograficzne)
  • Narzędzia do wyjaśniania i ramy przejrzystości
  • Częste monitorowanie i praktyki zarządzania

Narzędzia i praktyka

  • Korzystanie z bibliotek open-source (np. Fairlearn, Transformers, CheckList)
  • Praktyka: Wykrywanie i redukcja uprzedzeń w dostosowanym modelu
  • Generowanie bezpiecznych wyników poprzez projektowanie promptów i ograniczenia

Przypadki użycia w przedsiębiorstwach i gotowość do zgodności

  • Najlepsze praktyki integracji bezpieczeństwa w przepływach pracy LLM
  • Dokumentacja i karty modeli na potrzeby zgodności
  • Przygotowanie do audytów i przeglądów zewnętrznych

Podsumowanie i kolejne kroki

Wymagania

  • Zrozumienie modeli uczenia maszynowego i procesów treningowych
  • Doświadczenie w pracy z dostosowywaniem i dużymi modelami językowymi (LLM)
  • Znajomość Pythona i koncepcji NLP

Grupa docelowa

  • Zespoły ds. zgodności AI
  • Inżynierowie uczenia maszynowego
 14 godzin

Liczba uczestników


Cena za uczestnika (netto)

Propozycje terminów

Powiązane Kategorie