Lokalne, prowadzone przez instruktora kursy szkoleniowe na żywo dotyczące uczenia się ze wzmocnieniem demonstrują poprzez interaktywną praktyczną praktykę tworzenia i wdrażania systemu uczenia się ze wzmocnieniem. Szkolenie Reinforcement Learning jest dostępne jako "szkolenie online na żywo" lub "szkolenie na żywo na miejscu". Szkolenie na żywo online (inaczej "zdalne szkolenie na żywo") odbywa się za pomocą interaktywnego, zdalnego pulpitu . Szkolenie na żywo na miejscu może odbywać się lokalnie w siedzibie klienta w dolnośląskie lub w korporacyjnych centrach szkoleniowych NobleProg w dolnośląskie. NobleProg — Twój lokalny dostawca szkoleń
Wrocław
NobleProg, Ludwika Rydygiera 2a/22, Wroclaw, Polska, 50-249
Lokal znajduje się w samym centrum miasta (vis-à-vis hotelu HP Park Plaza), zaledwie 10 minut spacerem od Rynku, tuż przy skrzyżowaniu ulic Drobnera i Rydygiera.
Wejście do budynku zlokalizowane jest od strony ulicy Śrutowej, tuż przy skrzyżowaniu z Bolesława Drobnera. Idąc od strony pl. Bema, mijamy po prawej stronie Rossmann i tuż za nim skręcamy w Śrutową - wejście będzie po prawej. Kierując się od pl. Dubois, mijamy po lewej aptekę Ziko oraz Carrefour Express i dochodzimy aż do skrzyżowania z ul. Śrutową - skręcamy w nią, wejście do budynku będzie po prawej stronie.
Sala szkoleniowa znajduje się na drugim piętrze.
Parking
W pobliżu sali szkoleniowej liczba miejsc parkingowych jest ograniczona, nie obowiązuje strefa płatnego parkowania (wzdłuż ulic Rydygiera, Śrutowej i Henryka Brodatego, Bolesława Drobnera). Ul. Ludwika Rydygiera jest jednokierunkowa, wjazd od ul. Bolesława Drobnera. Ul. Śrutowa także jest jednokierunkowa, wjazd od ul. Henryka Brodatego.
Dojazd komunikacją miejską
To szkolenie prowadzone przez instruktora w dolnośląskie (online lub stacjonarnie) jest skierowane do data scientistów średniego poziomu, którzy chcą zdobyć wszechstronne zrozumienie i praktyczne umiejętności w dziedzinie zarówno Wielkich Modeli Językowych (LLMs), jak i Uczącego się przez Wzmocnienie (RL).
Po ukończeniu tego szkolenia uczestnicy będą mogli:
Zrozumieć składniki i funkcjonalności modeli transformer.
Optymalizować i dostosowywać LLMs do konkretnych zadań i aplikacji.
Zrozumieć podstawowe zasady i metodyki uczenia się przez wzmocnienie.
Nauczyć się, jak techniki uczenia się przez wzmocnienie mogą poprawiać wydajność LLMs.
To szkolenie prowadzone przez instruktora w trybie dolnośląskie (online lub stacjonarnym) jest przeznaczone dla zaawansowanych inżynierów uczenia maszynowego i badaczy sztucznej inteligencji, którzy chcą zastosować RLHF do doszlifowania dużych modeli AI w celu uzyskania lepszej wydajności, bezpieczeństwa i zgodności.
Po zakończeniu tego szkolenia uczestnicy będą w stanie:
Zrozumieć teoretyczne podstawy RLHF i dlaczego jest ono kluczowe w współczesnym rozwoju sztucznej inteligencji.
Wdrożyć modele nagród opartych na opinii człowieka, aby kierować procesami uczenia wzmocnionego.
Doszkolić duże modele językowe za pomocą technik RLHF, aby dostosować wyniki do preferencji człowieka.
Zastosować najlepsze praktyki w zakresie skalowania procesów RLHF dla systemów sztucznej inteligencji przeznaczonych do produkcji.
Trening prowadzony przez instruktora (online lub na miejscu) jest skierowany do profesjonalistów zaawansowanego poziomu, którzy chcą pogłębić swoją wiedzę na temat uczenia z wzmocnieniem i jego praktycznych zastosowań w rozwoju sztucznej inteligencji za pomocą Google Colab.
Na koniec tego szkolenia uczestnicy będą w stanie:
Zrozumieć podstawowe koncepcje algorytmów uczenia z wzmocnieniem.
Implementować modele uczenia z wzmocnieniem za pomocą TensorFlow i OpenAI Gym.
Tworzyć inteligentnych agentów, którzy uczą się przez próbę i błąd.
Optymalizować wydajność agentów za pomocą zaawansowanych technik, takich jak Q-learning i głębokie sieci Q (DQNs).
Trenować agentów w symulowanych środowiskach za pomocą OpenAI Gym.
Wdrażać modele uczenia z wzmocnieniem w zastosowaniach rzeczywistych.
Deep Reinforcement Learning (DRL) łączy zasady uczenia przez wzmocnienie z architekturami deep learning, aby umożliwić agentom podejmowanie decyzji przez interakcję z ich otoczeniem. Jest fundamentem wielu współczesnych osiągnięć w dziedzinie sztucznej inteligencji, takich jak samochody bez kierowcy, kontrola robotów, handlowanie algorytmiczne i adaptacyjne systemy rekomendacji. DRL pozwala sztucznemu agentowi uczyć się strategii, optymalizować polityki i podejmować autonomiczne decyzje na podstawie prób i błędów przy użyciu uczenia opierającego się na nagrodach.
To szkolenie prowadzone przez instruktora (online lub na miejscu) jest przeznaczone dla developerów i naukowców danych na poziomie średniozaawansowanym, którzy chcą nauczyć się i zastosować techniki Deep Reinforcement Learning w celu budowy inteligentnych agentów zdolnych do autonomicznego podejmowania decyzji w złożonych środowiskach.
Na zakończenie tego szkolenia uczestnicy będą w stanie:
Zrozumieć teoretyczne podstawy i matematyczne zasady uczenia przez wzmocnienie.
Wdrożyć kluczowe algorytmy RL, w tym Q-Learning, gradienty polityki i metody Actor-Critic.
Budować i trenować agenty Deep Reinforcement Learning przy użyciu TensorFlow lub PyTorch.
Zastosować DRL w realnych aplikacjach, takich jak gry, robotyka i optymalizacja decyzji.
Diagnostykować, wizualizować i optymalizować wydajność treningu przy użyciu nowoczesnych narzędzi.
Format kursu
Interaktywne wykłady i prowadzone dyskusje.
Ćwiczenia praktyczne i implementacje.
Żywe demonstracje kodowania i aplikacje oparte na projektach.
Opcje dostosowania kursu
Aby złożyć wniosek o dostosowaną wersję tego kursu (np. używając PyTorch zamiast TensorFlow), skontaktuj się z nami w celu umówienia.
To prowadzone przez instruktora szkolenie na żywo w dolnośląskie (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi, którzy chcą wyjść poza tradycyjne podejście do uczenia maszynowego, aby nauczyć program komputerowy rozwiązywania problemów bez użycia oznaczonych danych i dużych zbiorów danych.
Pod koniec tego szkolenia uczestnicy będą w stanie
Zainstalować i zastosować biblioteki i język programowania potrzebne do wdrożenia Reinforcement Learning.
Stworzyć agenta oprogramowania, który jest w stanie uczyć się poprzez informacje zwrotne zamiast poprzez nadzorowane uczenie się.
Zaprogramować agenta do rozwiązywania problemów, w których podejmowanie decyzji jest sekwencyjne i skończone.
Zastosować wiedzę do zaprojektowania oprogramowania, które może uczyć się w sposób podobny do tego, w jaki uczą się ludzie.
Więcej...
Ostatnia aktualizacja:
Opinie uczestników (1)
Poziom szkolenia był na wysokim poziomie. Prowadzący nie bał się używać matematycznych formalizmów.
Mateusz Soczewka - Santander Bank Polska S.A.
Szkolenie - Fundamentals of Reinforcement Learning