Course Outline

 Moduł I: Fundamenty pozyskiwania danych oraz protokół HTTP

1. Mechanizmy komunikacji HTTP
2. Struktura dokumentów HTML
3. Narzędzia deweloperskie przeglądarki i inspekcja elementów
5. Konfiguracja nagłówków żądań

 Moduł II: Ekstrakcja danych za pomocą BeautifulSoup
1. Wysyłanie żądań HTTP w języku Python
2. Analiza struktury HTML z wykorzystaniem BeautifulSoup
3. Lokalizowanie elementów po tagach, klasach i atrybutach
4. Pobieranie zawartości tekstowej i wartości atrybutów

Moduł III: Komunikacja z interfejsami API
1. Struktura i reguły formatu JSON
2. Przegląd popularnych otwartych API
3. Realizacja zapytań i przetwarzanie zwracanych danych

Moduł IV: Automatyzacja przeglądarki z Selenium
1. Obsługa stron z dynamiczną zawartością JavaScript
2. Identyfikacja elementów po tagach i klasach CSS (CSS_SELECTOR, XPATH)
3. Poruszanie się po stronie www (kliknięcia, przewijanie, odświeżanie strony)
4. Wypełnianie pól formularzy i logowanie do serwisów

Moduł V: Praktyczne zastosowania pozyskiwania danych
1. Tworzenie skryptów do masowego zbierania danych

 14 Hours

Number of participants


Price Per Participant (Exc. Tax)

Testimonials (5)

Provisional Courses

Related Categories