机读格式显示(MARC)
- 000 01508nam0 2200289 450
- 010 __ |a 978-7-115-50532-3 |d CNY99.00
- 100 __ |a 20190702d2019 em y0chiy50 ea
- 200 1_ |a 深度强化学习原理与实践 |9 shen du qiang hua xue xi yuan li yu shi jian |b 专著 |d Deep Reinforcement learning: principles and practices |f 陈仲铭,何明著 |z eng
- 210 __ |a 北京 |c 人民邮电出版社 |d 2019
- 215 __ |a 341页 |c 图 |d 24cm
- 314 __ |a 陈仲铭,西安电子科技大学硕士,OPPO研究院人工智能算法研究员。主要研究方向为强化学习与深度学习、数据挖掘、图像算法及其应用。
- 314 __ |a 何明,重庆大学学士,中国科学技术大学博士,现为上海交通大学电子科学与技术方向博士后研究人员、OPPO研究院人工智能算法研究员。主要研究方向为深度强化学习、数据挖掘与知识发现、机器学习方法及其应用,侧重于移动端用户行为分析与建模。
- 330 __ |a 本书构建了一个完整的深度强化学习理论和实践体系:从马尔可夫决策过程开始,根据价值函数、策略函数求解贝尔曼方程,到利用深度学习模拟价值网络和策略网络。书中详细介绍了深度强化学习相关最新算法,如Rainbow、Ape-X算法等,并阐述了相关算法的具体实现方式和代表性应用(如AlphaGo)。
- 510 1_ |a Deep Reinforcement learning: principles and practices |z eng
- 701 _0 |a 陈仲铭 |9 chen zhong ming |c (计算机技术) |4 著
- 701 _0 |a 何明 |9 he ming |c (计算机技术) |4 著
- 801 _0 |a CN |b GDPTC |c 20210630
- 905 __ |a GDPTC |d TP181/93