广东职业技术学院图书馆书目检索系统

| 暂存书架(0) | 登录

MARC状态:审校 文献类型:中文图书 浏览次数:1

题名/责任者:
异策略安全约束强化学习/杨奇松[等]著
出版发行项:
北京:国防工业出版社,2025
ISBN及定价:
978-7-118-13707-1/CNY88.00
载体形态项:
13,117页;24cm
并列正题名:
Off-policy safety constrained reinforcement learning
个人责任者:
杨奇松
学科主题:
机器学习
中图法分类号:
TP181
题名责任附注:
著者还有:常燕、武健、李邦杰、王顺宏、赵久奋
相关题名附注:
封面英文题名:Off-policy safety constrained reinforcement learning
提要文摘附注:
本书探讨了如何在强化学习框架内实现安全风险控制和训练过程的安全性。首先,介绍Worst-Case Soft Actor Critic(WCSAC)算法,该算法通过分析累积安全成本的分布,引入条件风险值作为安全约束,并自适应实现奖励与安全之间的平衡。其次,介绍两种估计安全成本分布的方法:高斯近似法和分位数回归算法,并通过仿真实验展示它们在风险控制中的效果。再次,进一步地针对目标奖励未知的情况,介绍Constrained Entropy Maximization(CEM)算法,旨在学习一个在安全前提下能够均匀访问所有状态的探索策略。最后,为了实现安全策略的快速迁移学习,介绍Safe Guide(SaGui)框架。
全部MARC细节信息>>
索书号 条码号 年卷期 馆藏地 书刊状态 还书位置
TP181/435 00824451   书库 (图书定位请点击这里)    在编 书库
TP181/435 00824452   书库 (图书定位请点击这里)    在编 书库
显示全部馆藏信息
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架