MARC状态:订购 文献类型:中文图书 浏览次数:12
- 题名/责任者:
- 策略前展、策略迭代与分布式强化学习:英文/(美)德梅萃·P.博赛卡斯著
- 出版发行项:
- 北京:清华大学出版社,2022.01
- ISBN及定价:
- 978-7-302-59938-8/CNY139.00
- 载体形态项:
- 316页;26cm
- 个人责任者:
- (美) 德梅萃·P.博赛卡斯 著
- 学科主题:
- 机器学习-高等学校-教材-英文
- 中图法分类号:
- TP181
- 一般附注:
- 国际知名大学原版教材 信息技术学科与电气工程学科系列
- 提要文摘附注:
- 强化学习,也称为近似动态规划、神经元动态规划。本书的内容围绕强化学习中的策略迭代这一核心概念展开。策略迭代指从某个策略出发,不断产生改进策略的过程。如果仅仅生成一步改进策略,就称为Rollout(策略前展)。大量经验表明,Rollout是当前用得最广、最为可靠的强化学习方法之一。主要内容包括:第一章、动态规划原理;第二章、Rollout与策略改进;第三章、专用Rollout算法;第四章、值和策略的学习;第五章、无限时间分布式和多智能体算法。
- 使用对象附注:
- 高校学生
全部MARC细节信息>>