机读格式显示(MARC)

000 01670nam 2200289 450

001 0000365333

005 20240218153059.9

010 __ |a 978-7-111-72891-7 |d CNY129.00

100 __ |a 20230817d2023 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a ak z 000yy

106 __ |a r

200 1_ |a 强化学习 |A qiang hua xue xi |e 原理与Python实战 |d = Reinforcement learning |e theory and python implementation |f 肖智清著 |z eng

210 __ |a 北京 |c 机械工业出版社 |d 2023.7

215 __ |a xiii, 490页 |c 图 |d 24cm

225 2_ |a 智能系统与技术丛书 |A zhi neng xi tong yu ji shu cong shu

314 __ |a 肖智清, 强化学习一线研发人员, 清华大学工学博士。在国内外出版多本人工智能专著, 在知名期刊和会议上发表多篇第一作者论文。他是开源项目Gym的源码贡献者, 并在国内外多项程序设计和数据科学竞赛上获得冠军。

330 __ |a 本书介绍强化学习理论及其Python实现。第1章: 从零开始介绍强化学习的背景知识, 介绍环境库Gym的使用。第2-15章: 基于折扣奖励离散时间Markov决策过程模型, 介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论, 进而在理论的基础上讲解算法。Python实现和算法讲解一一对应, 针对深度强化学习算法还给出了基于TensorFlow 2和PyTorch 1的对照实现。第16章: 介绍其他强化学习模型, 包括平均奖励模型、连续时间模型、非齐次模型, 半Markov模型、部分可观测模型等, 以便更好了解强化学习研究的全貌。

333 __ |a 本书适用于AI与大数据算法工程师、爱好者

410 _0 |1 2001 |a 智能系统与技术丛书

510 1_ |a Reinforcement learning |e theory and python implementation |z eng

517 1_ |a 原理与Python实战 |A yuan li yu Python shi zhan

606 0_ |a 软件工具 |A ruan jian gong ju |x 程序设计

690 __ |a TP311.561 |v 5

701 _0 |a 肖智清 |A xiao zhi qing |4 著

801 _0 |a CN |b 湖北三新 |c 20230817