机读格式显示(MARC)
- 010 __ |a 978-7-302-62554-4 |d CNY89.00
- 100 __ |a 20230330d2023 em y0chiy50 ea
- 200 1_ |a 深度强化学习理论与实践 |A shen du qiang hua xue xi li lun yu shi jian |f 龙强, 章胜编著
- 210 __ |a 北京 |c 清华大学出版社 |d 2023
- 215 __ |a 355页 |c 图 |d 24cm
- 225 2_ |a 计算机技术开发与应用丛书 |A ji suan ji ji shu kai fa yu ying yong cong shu
- 314 __ |a 龙强, 博士、副教授、硕士研究生导师; 就职于西南科技大学数理学院数据科学系, 中国运筹学会终生会员; 主要从事最优化理论与算法、机器学习算法研究。章胜, 博士、副研究员、硕士研究生导师; 就职于中国空气动力研究与发展中心, 中国空气动力学学会会员; 主要从事飞行器轨迹优化、非线性控制与智能控制研究。
- 330 __ |a 本书核心内容可以分为3部分, 第一部分为经典强化学习, 包括第2、3、4章, 主要内容有动态规划法, 蒙特卡洛法、时序差分法; 第二部分为深度强化学习, 包括第6、7、8章, 主要内容有值函数近似法、策略梯度法、策略梯度法进阶; 第三部分重点介绍了深度强化学习的经典应用--AlphaGo系列算法。另外, 作为理论和算法的辅助, 第1章介绍了强化学习的模型, 第5章简单介绍了深度学习和PyTorch编程框架。
- 410 _0 |1 2001 |a 计算机技术开发与应用丛书
- 606 0_ |a 机器学习 |A ji qi xue xi |x 研究
- 701 _0 |a 龙强 |A long qiang |4 编著
- 701 _0 |a 章胜 |A zhang sheng |4 编著
- 801 _0 |a CN |b 湖北三新 |c 20230330
- 905 __ |a GDPTC |d TP181/255