Wprowadzenie do nauki o danych i sztucznej inteligencji za pomocą Pythona
Opis szkolenia
Charakterystyka
Czterodniowe szkolenie warsztatowe, które prowadzi uczestników od analizy i przygotowania danych w Pythonie (Pandas), przez budowę i ocenę modeli uczenia maszynowego (regresja i klasyfikacja), aż po praktyczne wprowadzenie do dużych modeli językowych (LLM) oraz ich zastosowań w pracy analitycznej i produktowej. Zajęcia łączą krótkie bloki teoretyczne z intensywnymi ćwiczeniami na danych, tak aby uczestnicy kończyli szkolenie z zestawem gotowych technik i dobrych praktyk do wdrożenia w codziennych zadaniach.
Cele szkolenia
Po szkoleniu uczestnicy będą potrafili:
- przygotować dane do analizy (czyszczenie, filtrowanie, agregacje, tworzenie cech) z wykorzystaniem Pandas
- zbudować, ocenić i porównać modele regresji i klasyfikacji w scikit-learn
- zastosować techniki poprawy jakości modeli: normalizacja, kodowanie zmiennych kategorycznych, walidacja krzyżowa i strojenie hiperparametrów
- rozpoznać typowe ryzyka (np. overfitting) oraz dobrać właściwe metryki oceny
- zrozumieć podstawy pracy z LLM (API, embeddingi, modele multimodalne) i bezpiecznie prototypować proste rozwiązania
Zarezerwuj szkolenie
- Format: Zdalne
- Język: Polski
- Typ: Szkolenie otwarte
- Data: 24-27.02.2026
- Czas trwania: 4 dni (7h/dzień)
- Trener: Patryk Palej
- Walidator: Bartosz Wójcik
Cena netto za uczestnika.
Grupa docelowa
Szkolenie jest przeznaczone dla osób, które chcą rozwijać kompetencje data/AI w praktyce, w szczególności:
- analityków danych, analityków biznesowych i specjalistów raportowania
- osób z działów finansów, sprzedaży, operacji i marketingu pracujących na danych
- programistów i inżynierów, którzy chcą uporządkować podstawy ML/LLM w Pythonie
- osób przygotowujących się do roli Data Scientist / ML Engineer na poziomie junior/regular
Wymagania wstępne
- podstawowa znajomość Pythona (zmienne, pętle, funkcje, praca w notebooku)
- podstawy pracy z danymi (tabele, typy danych, proste obliczenia)
- gotowość do pracy na własnym komputerze w środowisku zdalnym
Metody szkoleniowe
Dominują warsztaty praktyczne (ok. 75% czasu). W trakcie zajęć wykorzystywane są m.in.:
- ćwiczenia indywidualne i zespołowe w notebookach (Python)
- krótkie wprowadzenia teoretyczne poprzedzające laboratoria
- studia przypadków oparte o dane zbliżone do realnych zastosowań biznesowych
- mini-projekty podsumowujące każdy dzień oraz praca na pipeline’ach
- sesje Q&A i konsultacje problemów z pracy uczestników (jeśli zostaną dostarczone dane/przypadki)
Materiały szkoleniowe
Uczestnicy otrzymują komplet materiałów wykorzystywanych podczas szkolenia, w tym:
- notatniki (Jupyter) i pliki z ćwiczeniami
- zestawy danych do laboratoriów
- ściągi (cheat sheets) z kluczowymi funkcjami Pandas oraz elementami scikit-learn
- linki do rekomendowanych źródeł i dokumentacji
Warunki techniczne szkolenia zdalnego
Do udziału wymagane są:
- komputer z systemem Windows/macOS/Linux (min. 8 GB RAM, rekomendowane 16 GB)
- stabilne łącze internetowe (min. 10 Mb/s)
- słuchawki z mikrofonem oraz kamera (rekomendowane dla pracy warsztatowej)
- dostęp do komunikatora MS Teams lub Zoom
- opcjonalnie: dostęp do środowiska DaDesktop zapewnianego przez NobleProg (jeśli zostanie uruchomione dla grupy)
Walidacja i zaświadczenia
Walidacja efektów uczenia się odbywa się w oparciu o zadania praktyczne (notebooki), mini-projekty oraz checklisty jakości. Po ukończeniu szkolenia uczestnicy otrzymują certyfikat NobleProg w formie elektronicznej.
Dokument informacyjny
Program może zostać dopasowany do potrzeb grupy po analizie wymagań (PCQ).
Efekty uczenia się i kryteria weryfikacji
Analiza danych w Pandas
- Tworzy i modyfikuje obiekty Series/DataFrame, wykonuje operacje na tabelach i kolumnach
- Stosuje filtrowanie, sortowanie, grupowanie i agregacje do rozwiązywania problemów analitycznych
Kryterium weryfikacji: Weryfikacja: zadania praktyczne w notebooku (wyniki obliczeń i poprawność transformacji danych)
Modele regresyjne
- Dobiera i trenuje model regresji do zadanego problemu
- Ocenia model właściwymi metrykami oraz interpretuje wyniki
- Stosuje normalizację i przygotowanie danych, a także przeciwdziała overfittingowi
Kryterium weryfikacji: Weryfikacja: mini-projekt regresyjny + omówienie metryk i wniosków.
Modele klasyfikacyjne
- Buduje i porównuje modele klasyfikacji, dobierając metryki (np. accuracy, precision/recall, F1, ROC-AUC)
- Stosuje techniki ensemble do poprawy jakości predykcji
Kryterium weryfikacji: Weryfikacja: zadanie klasyfikacyjne + porównanie co najmniej 2 modeli i uzasadnienie wyboru.
Praca z LLM
- Rozumie podstawowe pojęcia: prompt, kontekst, embeddingi, tokenizacja, ograniczenia modeli
- Korzysta z API LLM do generowania i przetwarzania tekstu oraz tworzy embeddingi do wyszukiwania semantycznego
- Zna podstawowe zasady bezpieczeństwa i jakości (ochrona danych, testy, ograniczenia)
Kryterium weryfikacji: Weryfikacja: ćwiczenie integracyjne (prosty prototyp) + checklist bezpieczeństwa danych.
Program szkolenia
Dzień 1 - Analiza danych w Pandas
- Podstawowe typy danych: Series i DataFrame (tworzenie, indeksowanie, typy danych).
- Operacje na tabelach: wczytywanie danych, łączenie (merge/join), konkatenacja.
- Filtrowanie, sortowanie, grupowanie: groupby, agregacje, pivot table.
- Modyfikacja wartości: mapowanie, replace, brakujące dane (NaN) i strategie uzupełniania.
- Operacje na kolumnach: tworzenie i transformacja cech, funkcje apply/assign.
Dzień 2 - Machine Learning: algorytmy regresji
- Wprowadzenie do regresji: problem, dane, pipeline ML.
- Ewaluacja modelu: metryki (MAE, MSE/RMSE, R2), podział train/test.
- Normalizacja i standaryzacja danych: kiedy i dlaczego.
- Obsługa zmiennych kategorycznych: One-Hot Encoding i Label Encoding.
- Overfitting: diagnoza i metody ograniczania.
- Cross-validation: dobór strategii walidacji.
- Grid Search i optymalizacja hiperparametrów (w tym pipeline).
Dzień 3 - Machine Learning: algorytmy klasyfikacji
- Wprowadzenie do klasyfikacji: binarna i wieloklasowa.
- Ewaluacja klasyfikacji: macierz pomyłek, accuracy, precision/recall, F1, ROC-AUC.
- Przegląd algorytmów klasyfikacji (np. regresja logistyczna, drzewa, SVM, kNN).
- Ensemble: łączenie klasyfikatorów (bagging, boosting, stacking - przegląd i praktyka).
Dzień 4 - Duże modele językowe (LLM)
- Wprowadzenie do LLM: możliwości, ograniczenia, typowe przypadki użycia w biznesie.
- API OpenAI i innych modeli: podstawy integracji, koszty, limity, dobre praktyki.
- Modele multimodalne: praca z tekstem i obrazem - scenariusze i ograniczenia.
- Embeddingi: wyszukiwanie semantyczne, klastrowanie, proste rekomendacje, podstawy RAG.
Brak środków w budżecie? Zdobądź dofinansowanie!
Program dzięki któremu można w łatwy i szybki sposób pozyskać środki na szkolenia dla pojedynczych osób.
Dlaczego szkolenie gwarantowane?
- Gwarancja realizacji. Szkolenie odbędzie się niezależnie od liczby uczestników.
- Wymiana wiedzy i doświadczeń ze specjalistami z innych branż.
- Interaktywne, prowadzone na żywo zajęcia. Nie tylko teoria, ale także praktyczne ćwiczenia i dyskusje.
- Elastyczna formuła zdalna. Dołącz z dowolnego miejsca.
Potrzebujesz więcej informacji?
Napisz, zadzwoń lub uzupełnij formularz - wybierz formę kontaktu, która Ci najbardziej odpowiada i zostaw resztę nam. Nasi konsultanci odpowiedzą na Twoje pytania i pomogą dobrać optymalne rozwiązanie.
Bądźmy w kontakcie