Plan Szkolenia

Moduł I: NumPy – praca na danych tablicowych

1. Tworzenie wektorów i macierzy za pomocą `numpy.array`  
2. Kształt tablic, zmiana wymiarów, rozmiar danych  
3. Podstawowe operacje na tablicach – indeksowanie, slicing, broadcast  
4. Funkcje matematyczne – operacje element-po-elemencie  
5. Agregacje i statystyki (sum, mean, std itp.)  

Moduł II: Pandas – dane tabelaryczne i ich przetwarzanie

1. Podstawowe struktury danych: `Series` i `DataFrame`  
2. Wczytywanie danych z plików `.csv`
3. Eksploracja DataFrame’a – head, describe, info  
4. Filtrowanie rekordów i wybieranie kolumn  
5. Modyfikacja danych: dodawanie, usuwanie i przekształcanie kolumn  
6. Tworzenie nowych kolumn na podstawie istniejących danych  
7. Sortowanie i porządkowanie danych  
8. Grupowanie i agregacje  
9. Praca z dużymi zbiorami danych – chunking, optymalizacja typu danych  

Moduł III: Wizualizacja danych – Matplotlib i Seaborn

1. Różnice między matplotlib a seaborn – kiedy używać której biblioteki  
2. Najważniejsze typy wykresów
3. Konfiguracja i stylowanie wykresów – osi, legendy, kolory, rozmiary  
4. Tworzenie wykresów z użyciem danych z Pandas  

Moduł IV: Eksploracyjna analiza danych (EDA)

1. Wprowadzenie do EDA – cele i proces analizy  
2. Przykładowa analiza na rzeczywistym zbiorze danych
3. Projekt praktyczny

 

 21 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (4)

Propozycje terminów

Powiązane Kategorie