机读格式显示(MARC)
- 000 00981nam0 2200253 450
- 010 __ |a 978-7-302-65852-8 |d CNY118.00
- 100 __ |a 20241012d2024 em y0chiy50 ea
- 200 1_ |a 强化学习的数学原理 |A qiang hua xue xi de shu xue yuan li |f 赵世钰著
- 210 __ |a 北京 |c 清华大学出版社 |d 2024
- 215 __ |a 301页 |c 彩图 |d 26cm
- 330 __ |a 本书从强化学习最基本的概念开始介绍,将介绍基础的分析工具,包括贝尔曼公式和贝尔曼最优公式,然后推广到基于模型的和无模型的强化学习算法,最后推广到基于函数逼近的强化学法;强调从数学的角度引入概念、分析问题、分析算法,可以帮助读者理解一些问题并提供新的视角。
- 510 1_ |a Mathematical foundations of reinforcement learning |z eng
- 606 0_ |a 机器学习 |A ji qi xue xi |j 英文
- 701 _0 |a 赵世钰 |A zhao shi yu |4 著
- 801 _2 |a CN |b GDXHCF |c 20241014