机读格式显示(MARC)
- 000 01513nam0 2200325 450
- 010 __ |a 978-7-5198-6961-8 |d CNY128.00
- 100 __ |a 20230419d2023 em y0chiy50 ea
- 200 1_ |a 强化学习 |A qiang hua xue xi |f (英) 菲尔·温德尔博士著 |g 邹伟, 康俊鹏, 王伟译
- 210 __ |a 北京 |c 中国电力出版社 |d 2023
- 215 __ |a xx, 427页 |c 图 |d 24cm
- 306 __ |a O'Reilly Media, Inc.授权中国电力出版社出版 英文原版由O'Reilly Media, Inc.出版2021。简体中文版由中国电力出版社出版2023。英文原版的翻译得到0'Reilly Media, Inc.的授权
- 314 __ |a Phil Winder博士是一名多学科交叉的软件工程师、作家和科技顾问, 同时也是温德研究所的CEO。
- 330 __ |a 本书的主要内容有: 学习强化学习是什么, 以及算法如何解决具体问题。掌握强化学习的基础知识, 包括马尔可夫决策过程、动态规划和时间差分算法。深入研究一系列基于值函数和政策梯度的算法。应用先进的强化学习解决方案, 如元学习、分层学习、多智能体、模仿学习等。了解最前沿的深度强化学习算法, 包括Rainbow、PPO、TD3、SAC等。通过本书专门的配套网站获得实践代码和案例。
- 500 10 |a Reinforcement learning |m Chinese
- 606 0_ |a 机器学习 |A ji qi xue xi
- 701 _1 |a 温德尔博士 |A wen de er bo shi |g (Winder, Phil) |4 著
- 702 _0 |a 邹伟 |A zou wei |4 译
- 702 _0 |a 康俊鹏 |A kang jun peng |4 译
- 702 _0 |a 王伟 |A wang wei |4 译
- 801 _0 |a CN |b 湖北三新 |c 20230419
- 905 __ |a GDPTC |d TP181/254