Алгоритмы обучения с подкреплением на Python
Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов. В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены...
Tallennettuna:
Päätekijä: | |
---|---|
Aineistotyyppi: | Книга |
Aiheet: | |
Linkit: | Перейти к просмотру издания |
Tagit: |
Lisää tagi
Ei tageja, Lisää ensimmäinen tagi!
|
LEADER | 03425nam0a2200445 4500 | ||
---|---|---|---|
001 | RU/IPR SMART/126211 | ||
856 | 4 | |u https://www.iprbookshop.ru/126211.html |z Перейти к просмотру издания | |
801 | 1 | |a RU |b IPR SMART |c 20250903 |g RCR | |
010 | |a 978-5-97060-855-5 | ||
205 | |a Алгоритмы обучения с подкреплением на Python |b 2029-12-31 | ||
333 | |a Лицензия до 31.12.2029 | ||
100 | |a 20250903d2020 k y0rusy01020304ca | ||
105 | |a y j 000zy | ||
101 | 0 | |a rus | |
102 | |a RU | ||
200 | 1 | |a Алгоритмы обучения с подкреплением на Python |f А. Лонца |g перевод А. А. Слинкин | |
700 | 1 | |a Лонца, |b А. |4 070 | |
702 | 1 | |a Слинкин, |b А. А. |4 730 | |
330 | |a Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов. В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и метаалгоритмом ESBAS. Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне. | ||
210 | |a Москва |c ДМК Пресс |d 2020 | ||
610 | 1 | |a алгоритм | |
610 | 1 | |a обучение | |
610 | 1 | |a Python | |
610 | 1 | |a язык программирования | |
610 | 1 | |a нейронная сеть | |
610 | 1 | |a TRPO | |
610 | 1 | |a PPO | |
610 | 1 | |a DDPG | |
610 | 1 | |a TD3 | |
610 | 1 | |a метаалгоритм ESBAS | |
610 | 1 | |a программирование | |
675 | |a 004.85 | ||
686 | |a 32.971 |2 rubbk | ||
300 | |a Книга не входит в премиум-версию IPR SMART. | ||
106 | |a s | ||
230 | |a Электрон. дан. (1 файл) | ||
336 | |a Текст | ||
337 | |a электронный | ||
503 | 0 | |a Доступна эл. версия. IPR SMART | |
215 | |a 286 с. |