机读格式显示(MARC)
- 000 01265nam0 2200277 450
- 010 __ |a 978-7-118-13179-6 |b 精装 |d CNY89.00
- 100 __ |a 20240805d2024 em y0chiy0110 ea
- 200 1_ |a 深度强化学习 |A shen du qiang hua xue xi |b 专著 |d Deep reinforcement learning |f (印度)莫希特·塞瓦克(Mohit Sewak)著 |g 尹大伟,吴敏杰译 |z eng
- 210 __ |a 北京 |c 国防工业出版社 |d 2024
- 215 __ |a 165页 |c 图 |d 25cm
- 330 __ |a 本书主要内容包括:介绍了强化学习的基本概念,如智能体、环境、状态、奖励、动作等;介绍了强化学习的数学和算法原理,如马尔可夫决策过程和贝尔曼方程,并在此基础上讨论了动态规划、值迭代和策略迭代方法;介绍了强化学习的估计与控制问题,并通过实例展示了Q学习的编程;深入探讨了深度学习的概念、架构机制,通过介绍激活函数、损失函数、优化器、卷积层、池化层、全连接层等概念,为后续章节与强化学习算法相结合作铺垫。
- 510 1_ |a Deep reinforcement learning |z eng
- 701 _0 |c (印) |a 塞瓦克 |A sai wa ke |c (Sewak, Mohit) |4 著
- 702 _0 |a 尹大伟 |A yin da wei |4 译
- 702 _0 |a 吴敏杰 |A wu min jie |4 译
- 801 _2 |a CN |b 58marc.cn |c 20240824