广东职业技术学院图书馆书目检索系统

广东职业技术学院图书馆书目检索系统

Online Public Access Catalogue

| 暂存书架(0) | 登录

馆藏检索简单检索多字段检索

借阅关系图

相关资源

把本书分享到

EverNote
麦库
豆瓣
腾讯微博
新浪微博
人人网
网易微博
开心网

使用说明二维码

收藏此书的书架

MARC状态：订购文献类型：中文图书浏览次数：12

题名/责任者:: 策略前展、策略迭代与分布式强化学习:英文/(美)德梅萃·P.博赛卡斯著

出版发行项:: 北京:清华大学出版社,2022.01

ISBN及定价:: 978-7-302-59938-8/CNY139.00

载体形态项:: 316页;26cm

个人责任者:: (美) 德梅萃·P.博赛卡斯著

学科主题:: 机器学习-高等学校-教材-英文

中图法分类号:: TP181

一般附注:: 国际知名大学原版教材信息技术学科与电气工程学科系列

提要文摘附注:: 强化学习，也称为近似动态规划、神经元动态规划。本书的内容围绕强化学习中的策略迭代这一核心概念展开。策略迭代指从某个策略出发，不断产生改进策略的过程。如果仅仅生成一步改进策略，就称为Rollout(策略前展)。大量经验表明，Rollout是当前用得最广、最为可靠的强化学习方法之一。主要内容包括：第一章、动态规划原理；第二章、Rollout与策略改进；第三章、专用Rollout算法；第四章、值和策略的学习；第五章、无限时间分布式和多智能体算法。

使用对象附注:: 高校学生

全部MARC细节信息>>

此书刊没有复本

此书刊可能正在订购中或者处理中

显示全部馆藏信息

借阅趋势

同名作者的其他著作(点击查看)

收藏到：管理书架