Алгоритмы обучения с подкреплением на Python
Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов. В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены...
Сохранить в:
| Главный автор: | |
|---|---|
| Формат: | Книга |
| Темы: | |
| Online-ссылка: | Перейти к просмотру издания |
| Метки: |
Добавить метку
Нет меток, Требуется 1-ая метка записи!
|
| LEADER | 03425nam0a2200445 4500 | ||
|---|---|---|---|
| 001 | RU/IPR SMART/126211 | ||
| 856 | 4 | |u https://www.iprbookshop.ru/126211.html |z Перейти к просмотру издания | |
| 801 | 1 | |a RU |b IPR SMART |c 20250903 |g RCR | |
| 010 | |a 978-5-97060-855-5 | ||
| 205 | |a Алгоритмы обучения с подкреплением на Python |b 2029-12-31 | ||
| 333 | |a Лицензия до 31.12.2029 | ||
| 100 | |a 20250903d2020 k y0rusy01020304ca | ||
| 105 | |a y j 000zy | ||
| 101 | 0 | |a rus | |
| 102 | |a RU | ||
| 200 | 1 | |a Алгоритмы обучения с подкреплением на Python |f А. Лонца |g перевод А. А. Слинкин | |
| 700 | 1 | |a Лонца, |b А. |4 070 | |
| 702 | 1 | |a Слинкин, |b А. А. |4 730 | |
| 330 | |a Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов. В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и метаалгоритмом ESBAS. Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне. | ||
| 210 | |a Москва |c ДМК Пресс |d 2020 | ||
| 610 | 1 | |a алгоритм | |
| 610 | 1 | |a обучение | |
| 610 | 1 | |a Python | |
| 610 | 1 | |a язык программирования | |
| 610 | 1 | |a нейронная сеть | |
| 610 | 1 | |a TRPO | |
| 610 | 1 | |a PPO | |
| 610 | 1 | |a DDPG | |
| 610 | 1 | |a TD3 | |
| 610 | 1 | |a метаалгоритм ESBAS | |
| 610 | 1 | |a программирование | |
| 675 | |a 004.85 | ||
| 686 | |a 32.971 |2 rubbk | ||
| 300 | |a Книга не входит в премиум-версию IPR SMART. | ||
| 106 | |a s | ||
| 230 | |a Электрон. дан. (1 файл) | ||
| 336 | |a Текст | ||
| 337 | |a электронный | ||
| 503 | 0 | |a Доступна эл. версия. IPR SMART | |
| 215 | |a 286 с. | ||