机读格式显示(MARC)
- 000 01582nam0 2200277 450
- 010 __ |a 978-7-5198-7037-9 |d CNY88.00
- 100 __ |a 20230206d2023 em y0chiy50 ea
- 200 1_ |a 基于Python的强化学习 |A ji yu Python de qiang hua xue xi |f (美) 安德里亚·隆萨著 |d = Reinforcement learning algorithms with Python |f Andrea Lonza |g 刘继红, 王瑞文译 |z eng
- 210 __ |a 北京 |c 中国电力出版社 |d 2023
- 215 __ |a 265页 |c 图 |d 24cm
- 314 __ |a 安德里亚·隆萨, 是一名深度学习工程师, 对人工智能怀有极大的热情, 渴望创造出具有智能行为的机器。他通过理论性的和工业应用性的机器学习项目获得了强化学习、自然语言处理和计算机视觉方面的专业知识。
- 330 __ |a 本书涵盖的内容有: 强化学习概貌。强化学习过程与OpenAI Gym。基于动态规划的问题求解。Q-Llearning与SARSA的应用。深度Q神经网络。随机策略梯度优化。信赖域策略优化和近端策略优化。确定性策略梯度方法。基于模型的强化学习。模仿学习与DAgger算法。黑盒优化算法。开发ESBAS算法。应对强化学习挑战的实践。如果您你是人工智能研究者、深度学习用户, 或者希望从头开始学习强化学习的人, 那么这本书就很适合你您。如果您想了解该领域的进展, 也会发现这本书很有帮助。当然, Python的基础知识是必需的。
- 500 10 |a Reinforcement learning algorithms with Python |m Chinese
- 606 0_ |a 软件工具 |A ruan jian gong ju |x 程序设计
- 701 _1 |a 隆萨 |A long sa |g (Lonza, Andrea) |4 著
- 702 _0 |a 刘继红 |A liu ji hong |4 译
- 702 _0 |a 王瑞文 |A wang rui wen |4 译
- 801 _0 |a CN |b 湖北三新 |c 20230206
- 905 __ |a GDPTC |d TP311.561/511