机读格式显示(MARC)

000 01509nam 2200289 450

001 0000311485

005 20231201131300.0

010 __ |a 978-7-302-62554-4 |d CNY89.00

100 __ |a 20230330d2023 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a ak a 000yy

106 __ |a r

200 1_ |a 深度强化学习理论与实践 |A shen du qiang hua xue xi li lun yu shi jian |f 龙强, 章胜编著

210 __ |a 北京 |c 清华大学出版社 |d 2023

215 __ |a 355页 |c 图 |d 24cm

225 2_ |a 计算机技术开发与应用丛书 |A ji suan ji ji shu kai fa yu ying yong cong shu

314 __ |a 龙强, 博士、副教授、硕士研究生导师; 就职于西南科技大学数理学院数据科学系, 中国运筹学会终生会员; 主要从事最优化理论与算法、机器学习算法研究。章胜, 博士、副研究员、硕士研究生导师; 就职于中国空气动力研究与发展中心, 中国空气动力学学会会员; 主要从事飞行器轨迹优化、非线性控制与智能控制研究。

320 __ |a 有书目

330 __ |a 本书核心内容可以分为3部分, 第一部分为经典强化学习, 包括第2、3、4章, 主要内容有动态规划法, 蒙特卡洛法、时序差分法; 第二部分为深度强化学习, 包括第6、7、8章, 主要内容有值函数近似法、策略梯度法、策略梯度法进阶; 第三部分重点介绍了深度强化学习的经典应用--AlphaGo系列算法。另外, 作为理论和算法的辅助, 第1章介绍了强化学习的模型, 第5章简单介绍了深度学习和PyTorch编程框架。

410 _0 |1 2001 |a 计算机技术开发与应用丛书

606 0_ |a 机器学习 |A ji qi xue xi |x 研究

690 __ |a TP181 |v 5

701 _0 |a 龙强 |A long qiang |4 编著

701 _0 |a 章胜 |A zhang sheng |4 编著

801 _0 |a CN |b 湖北三新 |c 20230330

905 __ |a GDPTC |d TP181/255