机读格式显示(MARC)

000 00981nam0 2200253 450

001 0000377570

005 20241014092855.48

010 __ |a 978-7-302-65852-8 |d CNY118.00

100 __ |a 20241012d2024 em y0chiy50 ea

101 0_ |a eng

102 __ |a CN |b 110000

105 __ |a a a 001yy

106 __ |a r

200 1_ |a 强化学习的数学原理 |A qiang hua xue xi de shu xue yuan li |f 赵世钰著

205 __ |a 英文版

210 __ |a 北京 |c 清华大学出版社 |d 2024

215 __ |a 301页 |c 彩图 |d 26cm

312 __ |a 英文并列题名取自封面

330 __ |a 本书从强化学习最基本的概念开始介绍，将介绍基础的分析工具，包括贝尔曼公式和贝尔曼最优公式，然后推广到基于模型的和无模型的强化学习算法，最后推广到基于函数逼近的强化学法；强调从数学的角度引入概念、分析问题、分析算法，可以帮助读者理解一些问题并提供新的视角。

510 1_ |a Mathematical foundations of reinforcement learning |z eng

606 0_ |a 机器学习 |A ji qi xue xi |j 英文

690 __ |a TP181 |v 5

701 _0 |a 赵世钰 |A zhao shi yu |4 著

801 _2 |a CN |b GDXHCF |c 20241014