Wprowadzenie do nauki o danych i sztucznej inteligencji za pomocą Pythona

 

Opis szkolenia

Charakterystyka

Czterodniowe szkolenie warsztatowe, które prowadzi uczestników od analizy i przygotowania danych w Pythonie (Pandas), przez budowę i ocenę modeli uczenia maszynowego (regresja i klasyfikacja), aż po praktyczne wprowadzenie do dużych modeli językowych (LLM) oraz ich zastosowań w pracy analitycznej i produktowej. Zajęcia łączą krótkie bloki teoretyczne z intensywnymi ćwiczeniami na danych, tak aby uczestnicy kończyli szkolenie z zestawem gotowych technik i dobrych praktyk do wdrożenia w codziennych zadaniach.

Cele szkolenia

Po szkoleniu uczestnicy będą potrafili:

  • przygotować dane do analizy (czyszczenie, filtrowanie, agregacje, tworzenie cech) z wykorzystaniem Pandas
  • zbudować, ocenić i porównać modele regresji i klasyfikacji w scikit-learn
  • zastosować techniki poprawy jakości modeli: normalizacja, kodowanie zmiennych kategorycznych, walidacja krzyżowa i strojenie hiperparametrów
  • rozpoznać typowe ryzyka (np. overfitting) oraz dobrać właściwe metryki oceny
  • zrozumieć podstawy pracy z LLM (API, embeddingi, modele multimodalne) i bezpiecznie prototypować proste rozwiązania

Zarezerwuj szkolenie

  • Format: Zdalne
  • Język: Polski
  • Typ: Szkolenie otwarte
  • Data: 24-27.02.2026
  • Czas trwania: 4 dni (7h/dzień)
  • Trener: Patryk Palej
  • Walidator: Bartosz Wójcik

ZAREZERWUJ - 5160 PLN 

Cena netto za uczestnika.

Grupa docelowa

Szkolenie jest przeznaczone dla osób, które chcą rozwijać kompetencje data/AI w praktyce, w szczególności:

  • analityków danych, analityków biznesowych i specjalistów raportowania
  • osób z działów finansów, sprzedaży, operacji i marketingu pracujących na danych
  • programistów i inżynierów, którzy chcą uporządkować podstawy ML/LLM w Pythonie
  • osób przygotowujących się do roli Data Scientist / ML Engineer na poziomie junior/regular

Wymagania wstępne

  • podstawowa znajomość Pythona (zmienne, pętle, funkcje, praca w notebooku)
  • podstawy pracy z danymi (tabele, typy danych, proste obliczenia)
  • gotowość do pracy na własnym komputerze w środowisku zdalnym

Metody szkoleniowe

Dominują warsztaty praktyczne (ok. 75% czasu). W trakcie zajęć wykorzystywane są m.in.:

  • ćwiczenia indywidualne i zespołowe w notebookach (Python)
  • krótkie wprowadzenia teoretyczne poprzedzające laboratoria
  • studia przypadków oparte o dane zbliżone do realnych zastosowań biznesowych
  • mini-projekty podsumowujące każdy dzień oraz praca na pipeline’ach
  • sesje Q&A i konsultacje problemów z pracy uczestników (jeśli zostaną dostarczone dane/przypadki)

Materiały szkoleniowe

Uczestnicy otrzymują komplet materiałów wykorzystywanych podczas szkolenia, w tym:

  • notatniki (Jupyter) i pliki z ćwiczeniami
  • zestawy danych do laboratoriów
  • ściągi (cheat sheets) z kluczowymi funkcjami Pandas oraz elementami scikit-learn
  • linki do rekomendowanych źródeł i dokumentacji

Warunki techniczne szkolenia zdalnego

Do udziału wymagane są:

  • komputer z systemem Windows/macOS/Linux (min. 8 GB RAM, rekomendowane 16 GB)
  • stabilne łącze internetowe (min. 10 Mb/s)
  • słuchawki z mikrofonem oraz kamera (rekomendowane dla pracy warsztatowej)
  • dostęp do komunikatora MS Teams lub Zoom
  • opcjonalnie: dostęp do środowiska DaDesktop zapewnianego przez NobleProg (jeśli zostanie uruchomione dla grupy)

Walidacja i zaświadczenia

Walidacja efektów uczenia się odbywa się w oparciu o zadania praktyczne (notebooki), mini-projekty oraz checklisty jakości. Po ukończeniu szkolenia uczestnicy otrzymują certyfikat NobleProg w formie elektronicznej.

Dokument informacyjny

Program może zostać dopasowany do potrzeb grupy po analizie wymagań (PCQ).

Efekty uczenia się i kryteria weryfikacji

Analiza danych w Pandas

  • Tworzy i modyfikuje obiekty Series/DataFrame, wykonuje operacje na tabelach i kolumnach
  • Stosuje filtrowanie, sortowanie, grupowanie i agregacje do rozwiązywania problemów analitycznych

Kryterium weryfikacji: Weryfikacja: zadania praktyczne w notebooku (wyniki obliczeń i poprawność transformacji danych)

Modele regresyjne

  • Dobiera i trenuje model regresji do zadanego problemu
  • Ocenia model właściwymi metrykami oraz interpretuje wyniki
  • Stosuje normalizację i przygotowanie danych, a także przeciwdziała overfittingowi

Kryterium weryfikacji: Weryfikacja: mini-projekt regresyjny + omówienie metryk i wniosków.

Modele klasyfikacyjne

  • Buduje i porównuje modele klasyfikacji, dobierając metryki (np. accuracy, precision/recall, F1, ROC-AUC)
  • Stosuje techniki ensemble do poprawy jakości predykcji

Kryterium weryfikacji: Weryfikacja: zadanie klasyfikacyjne + porównanie co najmniej 2 modeli i uzasadnienie wyboru.

Praca z LLM

  • Rozumie podstawowe pojęcia: prompt, kontekst, embeddingi, tokenizacja, ograniczenia modeli
  • Korzysta z API LLM do generowania i przetwarzania tekstu oraz tworzy embeddingi do wyszukiwania semantycznego
  • Zna podstawowe zasady bezpieczeństwa i jakości (ochrona danych, testy, ograniczenia)

Kryterium weryfikacji: Weryfikacja: ćwiczenie integracyjne (prosty prototyp) + checklist bezpieczeństwa danych.

Program szkolenia

Dzień 1 - Analiza danych w Pandas

  • Podstawowe typy danych: Series i DataFrame (tworzenie, indeksowanie, typy danych).
  • Operacje na tabelach: wczytywanie danych, łączenie (merge/join), konkatenacja.
  • Filtrowanie, sortowanie, grupowanie: groupby, agregacje, pivot table.
  • Modyfikacja wartości: mapowanie, replace, brakujące dane (NaN) i strategie uzupełniania.
  • Operacje na kolumnach: tworzenie i transformacja cech, funkcje apply/assign.

Dzień 2 - Machine Learning: algorytmy regresji

  • Wprowadzenie do regresji: problem, dane, pipeline ML.
  • Ewaluacja modelu: metryki (MAE, MSE/RMSE, R2), podział train/test.
  • Normalizacja i standaryzacja danych: kiedy i dlaczego.
  • Obsługa zmiennych kategorycznych: One-Hot Encoding i Label Encoding.
  • Overfitting: diagnoza i metody ograniczania.
  • Cross-validation: dobór strategii walidacji.
  • Grid Search i optymalizacja hiperparametrów (w tym pipeline).

Dzień 3 - Machine Learning: algorytmy klasyfikacji

  • Wprowadzenie do klasyfikacji: binarna i wieloklasowa.
  • Ewaluacja klasyfikacji: macierz pomyłek, accuracy, precision/recall, F1, ROC-AUC.
  • Przegląd algorytmów klasyfikacji (np. regresja logistyczna, drzewa, SVM, kNN).
  • Ensemble: łączenie klasyfikatorów (bagging, boosting, stacking - przegląd i praktyka).

Dzień 4 - Duże modele językowe (LLM)

  • Wprowadzenie do LLM: możliwości, ograniczenia, typowe przypadki użycia w biznesie.
  • API OpenAI i innych modeli: podstawy integracji, koszty, limity, dobre praktyki.
  • Modele multimodalne: praca z tekstem i obrazem - scenariusze i ograniczenia.
  • Embeddingi: wyszukiwanie semantyczne, klastrowanie, proste rekomendacje, podstawy RAG.
Ludzie lecący na papierowych samolotach na szkolenie.

Brak środków w budżecie? Zdobądź dofinansowanie!

Podmiotowy System Finansowania dla osób dorosłych logo

Program dzięki któremu można w łatwy i szybki sposób pozyskać środki na szkolenia dla pojedynczych osób.

Zobacz więcej

Oferta szkoleń otwartych z gwarantowanym terminem pokazana w formie piktogramów w śrubkach.

Dlaczego szkolenie gwarantowane?

  • Gwarancja realizacji. Szkolenie odbędzie się niezależnie od liczby uczestników.
  • Wymiana wiedzy i doświadczeń ze specjalistami z innych branż.
  • Interaktywne, prowadzone na żywo zajęcia. Nie tylko teoria, ale także praktyczne ćwiczenia i dyskusje.
  • Elastyczna formuła zdalna. Dołącz z dowolnego miejsca.

Zobacz więcej

Two persons looking at a tablet

Potrzebujesz więcej informacji?

Napisz, zadzwoń lub uzupełnij formularz - wybierz formę kontaktu, która Ci najbardziej odpowiada i zostaw resztę nam. Nasi konsultanci odpowiedzą na Twoje pytania i pomogą dobrać optymalne rozwiązanie.

Bądźmy w kontakcie