Przejdź do treści

Алгоритмы обучения с подкреплением на Python

Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов. В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены...

Szczegółowa specyfikacja

Zapisane w:
Opis bibliograficzny
1. autor: Лонца, А. (070)
Format: Книга
Hasła przedmiotowe:
Dostęp online:Перейти к просмотру издания
Etykiety: Dodaj etykietę
Nie ma etykietki, Dołącz pierwszą etykiete!
LEADER 03425nam0a2200445 4500
001 RU/IPR SMART/126211
856 4 |u https://www.iprbookshop.ru/126211.html  |z Перейти к просмотру издания 
801 1 |a RU  |b IPR SMART  |c 20250903  |g RCR 
010 |a 978-5-97060-855-5 
205 |a Алгоритмы обучения с подкреплением на Python  |b 2029-12-31 
333 |a Лицензия до 31.12.2029 
100 |a 20250903d2020 k y0rusy01020304ca 
105 |a y j 000zy 
101 0 |a rus 
102 |a RU 
200 1 |a Алгоритмы обучения с подкреплением на Python  |f А. Лонца  |g перевод А. А. Слинкин 
700 1 |a Лонца,   |b А.  |4 070 
702 1 |a Слинкин,   |b А. А.  |4 730 
330 |a Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов. В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и метаалгоритмом ESBAS. Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне. 
210 |a Москва  |c ДМК Пресс  |d 2020 
610 1 |a алгоритм 
610 1 |a обучение 
610 1 |a Python 
610 1 |a язык программирования 
610 1 |a нейронная сеть 
610 1 |a TRPO 
610 1 |a PPO 
610 1 |a DDPG 
610 1 |a TD3 
610 1 |a метаалгоритм ESBAS 
610 1 |a программирование 
675 |a 004.85 
686 |a 32.971  |2 rubbk 
300 |a Книга не входит в премиум-версию IPR SMART. 
106 |a s 
230 |a Электрон. дан. (1 файл) 
336 |a Текст 
337 |a электронный 
503 0 |a Доступна эл. версия. IPR SMART 
215 |a 286 с.