Bądźmy w kontakcie

Plan Szkolenia

Wprowadzenie

  • Czym są duże modele językowe (LLM)?
  • LLM a tradycyjne modele NLP
  • Przegląd funkcji i architektury LLM
  • Wyzwania i ograniczenia LLM

Zrozumienie LLM

  • Cykl życia LLM
  • Jak działają LLM
  • Główne komponenty LLM: enkoder, dekoder, mechanizm uwagi, osadzenia itp.

Rozpoczęcie pracy

  • Konfiguracja środowiska programistycznego
  • Instalacja LLM jako narzędzia programistycznego, np. Google Colab, Hugging Face

Praca z LLM

  • Przegląd dostępnych opcji LLM
  • Tworzenie i korzystanie z LLM
  • Dostrajanie LLM do niestandardowego zestawu danych

Podsumowywanie tekstu

  • Zrozumienie zadania podsumowywania tekstu i jego zastosowań
  • Korzystanie z LLM do ekstrakcyjnego i abstrakcyjnego podsumowywania tekstu
  • Ocena jakości generowanych podsumowań za pomocą metryk takich jak ROUGE, BLEU itp.

Odpowiadanie na pytania

  • Zrozumienie zadania odpowiadania na pytania i jego zastosowań
  • Korzystanie z LLM do odpowiadania na pytania w otwartych i zamkniętych domenach
  • Ocena dokładności generowanych odpowiedzi za pomocą metryk takich jak F1, EM itp.

Generowanie tekstu

  • Zrozumienie zadania generowania tekstu i jego zastosowań
  • Korzystanie z LLM do warunkowego i bezwarunkowego generowania tekstu
  • Kontrolowanie stylu, tonu i treści generowanych tekstów za pomocą parametrów takich jak temperatura, top-k, top-p itp.

Integracja LLM z innymi frameworkami i platformami

  • Korzystanie z LLM z PyTorch lub TensorFlow
  • Korzystanie z LLM z Flask lub Streamlit
  • Korzystanie z LLM z Google Cloud lub AWS

Rozwiązywanie problemów

  • Zrozumienie typowych błędów i problemów w LLM
  • Korzystanie z TensorBoard do monitorowania i wizualizacji procesu treningowego
  • Korzystanie z PyTorch Lightning do uproszczenia kodu treningowego i poprawy wydajności
  • Korzystanie z Hugging Face Datasets do ładowania i przetwarzania danych

Podsumowanie i kolejne kroki

Wymagania

  • Zrozumienie przetwarzania języka naturalnego i uczenia głębokiego
  • Doświadczenie w Pythonie oraz PyTorch lub TensorFlow
  • Podstawowe doświadczenie w programowaniu

Odbiorcy

  • Programiści
  • Entuzjaści NLP
  • Naukowcy zajmujący się danymi
 14 godzin

Liczba uczestników


Cena za uczestnika (netto)

Propozycje terminów

Powiązane Kategorie