Plan Szkolenia
Moduł I: Fundamenty dużych modeli językowych
1. Mechanizmy działania LLM – tokenizacja, okno kontekstowe, problematyka halucynacji
2. Techniki prompt engineeringu dla optymalnych rezultatów
3. Komunikacja z modelami poprzez OpenAI API
4. Framework LangChain w praktyce
5. Architektura systemu Retrieval Augmented Generation
Moduł II: Przygotowanie dokumentów tekstowych
1. Ekstrakcja treści z różnych formatów plików (PDF, DOCX, TXT)
2. Koncepcja dzielenia tekstu na fragmenty (chunking)
3. Strategie segmentacji dokumentów
4. Wpływ wielkości chunków na jakość systemu
Moduł III: Wektoryzacja i przechowywanie danych
1. Zasady reprezentacji wektorowej tekstu (embeddings)
2. Wyszukiwanie semantyczne oparte na podobieństwie wektorów
3. Baza wektorowa Qdrant – konfiguracja i zastosowanie w RAG
4. Indeksowanie i zarządzanie kolekcjami wektorów
Moduł IV: Retrieval dokumentów i ocena jakości
1. Proces retrievalu w systemach RAG
3. Konstrukcja kontekstu dla zapytań do LLM
4. Technika rerankingu wyników
5. Framework DeepEval do oceny systemów RAG
Moduł V: Aplikacja webowa dla systemu RAG
1. Podstawy biblioteki Streamlit
2. Implementacja interfejsu użytkownika
3. Integracja komponentów systemu RAG w aplikacji webowej