广东职业技术学院图书馆书目检索系统

| 暂存书架(0) | 登录

MARC状态:订购 文献类型:中文图书 浏览次数:11

题名/责任者:
策略前展、策略迭代与分布式强化学习:英文/(美)德梅萃·P.博赛卡斯著
出版发行项:
北京:清华大学出版社,2022.01
ISBN及定价:
978-7-302-59938-8/CNY139.00
载体形态项:
316页;26cm
个人责任者:
(美) 德梅萃·P.博赛卡斯
学科主题:
机器学习-高等学校-教材-英文
中图法分类号:
TP181
一般附注:
国际知名大学原版教材 信息技术学科与电气工程学科系列
提要文摘附注:
强化学习,也称为近似动态规划、神经元动态规划。本书的内容围绕强化学习中的策略迭代这一核心概念展开。策略迭代指从某个策略出发,不断产生改进策略的过程。如果仅仅生成一步改进策略,就称为Rollout(策略前展)。大量经验表明,Rollout是当前用得最广、最为可靠的强化学习方法之一。主要内容包括:第一章、动态规划原理;第二章、Rollout与策略改进;第三章、专用Rollout算法;第四章、值和策略的学习;第五章、无限时间分布式和多智能体算法。
使用对象附注:
高校学生
全部MARC细节信息>>
此书刊没有复本
此书刊可能正在订购中或者处理中
显示全部馆藏信息
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架