Wprowadzenie do nauki o danych i sztucznej inteligencji za pomocą Pythona

Opis szkolenia

Charakterystyka

Czterodniowe szkolenie warsztatowe, które prowadzi uczestników od analizy i przygotowania danych w Pythonie (Pandas), przez budowę i ocenę modeli uczenia maszynowego (regresja i klasyfikacja), aż po praktyczne wprowadzenie do dużych modeli językowych (LLM) oraz ich zastosowań w pracy analitycznej i produktowej. Zajęcia łączą krótkie bloki teoretyczne z intensywnymi ćwiczeniami na danych, tak aby uczestnicy kończyli szkolenie z zestawem gotowych technik i dobrych praktyk do wdrożenia w codziennych zadaniach.

Cele szkolenia

Po szkoleniu uczestnicy będą potrafili:

przygotować dane do analizy (czyszczenie, filtrowanie, agregacje, tworzenie cech) z wykorzystaniem Pandas
zbudować, ocenić i porównać modele regresji i klasyfikacji w scikit-learn
zastosować techniki poprawy jakości modeli: normalizacja, kodowanie zmiennych kategorycznych, walidacja krzyżowa i strojenie hiperparametrów
rozpoznać typowe ryzyka (np. overfitting) oraz dobrać właściwe metryki oceny
zrozumieć podstawy pracy z LLM (API, embeddingi, modele multimodalne) i bezpiecznie prototypować proste rozwiązania

Zarezerwuj szkolenie

Format: Zdalne
Język: Polski
Typ: Szkolenie otwarte
Data: 24-27.02.2026
Czas trwania: 4 dni (7h/dzień)
Trener: Patryk Palej
Walidator: Bartosz Wójcik

ZAREZERWUJ - 5160 PLN

Cena netto za uczestnika.

Grupa docelowa

Szkolenie jest przeznaczone dla osób, które chcą rozwijać kompetencje data/AI w praktyce, w szczególności:

analityków danych, analityków biznesowych i specjalistów raportowania
osób z działów finansów, sprzedaży, operacji i marketingu pracujących na danych
programistów i inżynierów, którzy chcą uporządkować podstawy ML/LLM w Pythonie
osób przygotowujących się do roli Data Scientist / ML Engineer na poziomie junior/regular

Wymagania wstępne

podstawowa znajomość Pythona (zmienne, pętle, funkcje, praca w notebooku)
podstawy pracy z danymi (tabele, typy danych, proste obliczenia)
gotowość do pracy na własnym komputerze w środowisku zdalnym

Metody szkoleniowe

Dominują warsztaty praktyczne (ok. 75% czasu). W trakcie zajęć wykorzystywane są m.in.:

ćwiczenia indywidualne i zespołowe w notebookach (Python)
krótkie wprowadzenia teoretyczne poprzedzające laboratoria
studia przypadków oparte o dane zbliżone do realnych zastosowań biznesowych
mini-projekty podsumowujące każdy dzień oraz praca na pipeline’ach
sesje Q&A i konsultacje problemów z pracy uczestników (jeśli zostaną dostarczone dane/przypadki)

Materiały szkoleniowe

Uczestnicy otrzymują komplet materiałów wykorzystywanych podczas szkolenia, w tym:

notatniki (Jupyter) i pliki z ćwiczeniami
zestawy danych do laboratoriów
ściągi (cheat sheets) z kluczowymi funkcjami Pandas oraz elementami scikit-learn
linki do rekomendowanych źródeł i dokumentacji

Warunki techniczne szkolenia zdalnego

Do udziału wymagane są:

komputer z systemem Windows/macOS/Linux (min. 8 GB RAM, rekomendowane 16 GB)
stabilne łącze internetowe (min. 10 Mb/s)
słuchawki z mikrofonem oraz kamera (rekomendowane dla pracy warsztatowej)
dostęp do komunikatora MS Teams lub Zoom
opcjonalnie: dostęp do środowiska DaDesktop zapewnianego przez NobleProg (jeśli zostanie uruchomione dla grupy)

Walidacja i zaświadczenia

Walidacja efektów uczenia się odbywa się w oparciu o zadania praktyczne (notebooki), mini-projekty oraz checklisty jakości. Po ukończeniu szkolenia uczestnicy otrzymują certyfikat NobleProg w formie elektronicznej.

Dokument informacyjny

Program może zostać dopasowany do potrzeb grupy po analizie wymagań (PCQ).

Efekty uczenia się i kryteria weryfikacji

Analiza danych w Pandas

Tworzy i modyfikuje obiekty Series/DataFrame, wykonuje operacje na tabelach i kolumnach
Stosuje filtrowanie, sortowanie, grupowanie i agregacje do rozwiązywania problemów analitycznych

Kryterium weryfikacji: Weryfikacja: zadania praktyczne w notebooku (wyniki obliczeń i poprawność transformacji danych)

Modele regresyjne

Dobiera i trenuje model regresji do zadanego problemu
Ocenia model właściwymi metrykami oraz interpretuje wyniki
Stosuje normalizację i przygotowanie danych, a także przeciwdziała overfittingowi

Kryterium weryfikacji: Weryfikacja: mini-projekt regresyjny + omówienie metryk i wniosków.

Modele klasyfikacyjne

Buduje i porównuje modele klasyfikacji, dobierając metryki (np. accuracy, precision/recall, F1, ROC-AUC)
Stosuje techniki ensemble do poprawy jakości predykcji

Kryterium weryfikacji: Weryfikacja: zadanie klasyfikacyjne + porównanie co najmniej 2 modeli i uzasadnienie wyboru.

Praca z LLM

Rozumie podstawowe pojęcia: prompt, kontekst, embeddingi, tokenizacja, ograniczenia modeli
Korzysta z API LLM do generowania i przetwarzania tekstu oraz tworzy embeddingi do wyszukiwania semantycznego
Zna podstawowe zasady bezpieczeństwa i jakości (ochrona danych, testy, ograniczenia)

Kryterium weryfikacji: Weryfikacja: ćwiczenie integracyjne (prosty prototyp) + checklist bezpieczeństwa danych.

Program szkolenia

Dzień 1 - Analiza danych w Pandas

Podstawowe typy danych: Series i DataFrame (tworzenie, indeksowanie, typy danych).
Operacje na tabelach: wczytywanie danych, łączenie (merge/join), konkatenacja.
Filtrowanie, sortowanie, grupowanie: groupby, agregacje, pivot table.
Modyfikacja wartości: mapowanie, replace, brakujące dane (NaN) i strategie uzupełniania.
Operacje na kolumnach: tworzenie i transformacja cech, funkcje apply/assign.

Dzień 2 - Machine Learning: algorytmy regresji

Wprowadzenie do regresji: problem, dane, pipeline ML.
Ewaluacja modelu: metryki (MAE, MSE/RMSE, R2), podział train/test.
Normalizacja i standaryzacja danych: kiedy i dlaczego.
Obsługa zmiennych kategorycznych: One-Hot Encoding i Label Encoding.
Overfitting: diagnoza i metody ograniczania.
Cross-validation: dobór strategii walidacji.
Grid Search i optymalizacja hiperparametrów (w tym pipeline).

Dzień 3 - Machine Learning: algorytmy klasyfikacji

Wprowadzenie do klasyfikacji: binarna i wieloklasowa.
Ewaluacja klasyfikacji: macierz pomyłek, accuracy, precision/recall, F1, ROC-AUC.
Przegląd algorytmów klasyfikacji (np. regresja logistyczna, drzewa, SVM, kNN).
Ensemble: łączenie klasyfikatorów (bagging, boosting, stacking - przegląd i praktyka).

Dzień 4 - Duże modele językowe (LLM)

Wprowadzenie do LLM: możliwości, ograniczenia, typowe przypadki użycia w biznesie.
API OpenAI i innych modeli: podstawy integracji, koszty, limity, dobre praktyki.
Modele multimodalne: praca z tekstem i obrazem - scenariusze i ograniczenia.
Embeddingi: wyszukiwanie semantyczne, klastrowanie, proste rekomendacje, podstawy RAG.

Ludzie lecący na papierowych samolotach na szkolenie.

Brak środków w budżecie? Zdobądź dofinansowanie!

Program dzięki któremu można w łatwy i szybki sposób pozyskać środki na szkolenia dla pojedynczych osób.

Zobacz więcej

Oferta szkoleń otwartych z gwarantowanym terminem pokazana w formie piktogramów w śrubkach.

Dlaczego szkolenie gwarantowane?

Gwarancja realizacji. Szkolenie odbędzie się niezależnie od liczby uczestników.
Wymiana wiedzy i doświadczeń ze specjalistami z innych branż.
Interaktywne, prowadzone na żywo zajęcia. Nie tylko teoria, ale także praktyczne ćwiczenia i dyskusje.
Elastyczna formuła zdalna. Dołącz z dowolnego miejsca.