广东职业技术学院图书馆书目检索系统

| 暂存书架(0) | 登录

MARC状态:订购 文献类型:中文图书 浏览次数:9

题名/责任者:
深度剖析DeepSeek大模型:原理、开发与优化部署/丁小晶, 崔远编著
出版发行项:
北京:机械工业出版社,2025
ISBN及定价:
978-7-111-77922-3/CNY119.00
载体形态项:
xii, 312页:图;24cm
丛编项:
AIGC与大模型技术丛书
个人责任者:
丁小晶 编著
个人责任者:
崔远 编著
学科主题:
人工智能
中图法分类号:
TP18
提要文摘附注:
本书共分为12章,首先介绍大模型的基础知识与发展历程,从神经网络的起源到大规模预训练模型的演化,再到Transformer、BERT与GPT等模型架构的剖析。其次解析了DeepSeek-R1及其Zero版本在强化学习与模型架构上的核心技术,包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践,介绍API调用、上下文拼接、多轮对话管理、模型微调、知识蒸馏等关键技术,并结合DeepSeek实际案例展示其在数学推理、代码生成等领域的应用。最后探讨了大模型在商业化落地场景中的高级应用,如FIM补全、多轮对话、业务代码自动化生成以及基于云部署的智能推荐搜索系统等。
全部MARC细节信息>>
此书刊没有复本
此书刊可能正在订购中或者处理中
显示全部馆藏信息
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架