Plan Szkolenia
Podstawy Pythona do zadań danych
- Instalacja Pythona i konfiguracja środowiska deweloperskiego
- Podstawy języka: zmienne, typy danych, struktury sterujące
- Pisanie i uruchamianie prostych skryptów Pythona
Obsługa plików: CSV i Excel
- Odczytywanie i zapisywanie plików CSV za pomocą modułu csv i Pandas
- Praca z plikami Excel przy użyciu openpyxl/xlrd i Pandas
- Ćwiczenia praktyczne: automatyzacja konwersji plików
Wprowadzenie do Pandas
- Podstawy DataFrame: tworzenie, indeksowanie, wybór i filtrowanie
- Operacje agregacji i grupowania
- Typowe operacje czyszczenia: brakujące wartości, duplikaty i konwersje typów
Wprowadzenie do Polars
- Koncepcje Polars i charakterystyka wydajności w porównaniu z Pandas
- Podstawowe operacje na DataFrame w Polars
- Przykład użycia: kiedy wybrać Polars zamiast Pandas
Zaawansowana transformacja danych (poziom średniozaawansowany)
- Złożone łączenia, funkcje okienkowe i operacje pivot w Pandas
- Wzorce efektywnego przetwarzania danych w Polars
- Łańcuchowanie operacji i optymalizacja użycia pamięci
Automatyzacja procesów z Pythonem
- Pisanie skryptów do automatyzacji powtarzalnych zadań danych i kroków ETL
- Planowanie skryptów za pomocą harmonogramów systemowych
- Logowanie, obsługa błędów i powiadomienia
Pakowanie skryptów i najlepsze praktyki
- Tworzenie plików wykonywalnych za pomocą PyInstaller lub podobnych narzędzi
- Struktura projektu, środowiska wirtualne i zarządzanie zależnościami
- Podstawy kontroli wersji i dokumentowanie przepływów pracy
Praktyczny miniprojekt
- Zadanie end-to-end: odczyt surowych plików, czyszczenie i transformacja danych, generowanie wyników
- Automatyzacja przepływu pracy i pakowanie jako skrypt lub plik wykonywalny
- Przegląd i poprawki na podstawie opinii uczestników
Podsumowanie i kolejne kroki
Wymagania
- Podstawowa znajomość koncepcji programowania lub chęć nauki
- Umiejętność korzystania z wiersza poleceń lub terminala do instalacji pakietów
- Doświadczenie w pracy z arkuszami kalkulacyjnymi (CSV/Excel)
Grupa docelowa
- Analitycy danych i pracownicy operacyjni automatyzujący zadania danych
- Inżynierowie analityczni poszukujący lekkich skryptów ETL
- Profesjonaliści zainteresowani praktycznymi przepływami pracy opartymi na Pythonie
Opinie uczestników (2)
Zajeczia praktyczne związane z treścią naprawdę pomagają lepiej zrozumieć każdy temat. Ponadto, styl rozpoczęcia zajęć od wykładu i kontynuowania praktycznymi ćwiczeniami jest dobry i pomocny do połączenia się z wcześniejszym wykładem.
Nazeera Mohamad - Ministry of Science, Technology and Innovation
Szkolenie - Introduction to Data Science and AI using Python
Przetłumaczone przez sztuczną inteligencję
Przykłady/ćwiczenia doskonale dostosowane do naszej dziedziny
Luc - CS Group
Szkolenie - Scaling Data Analysis with Python and Dask
Przetłumaczone przez sztuczną inteligencję