MARC状态:审校 文献类型:中文图书 浏览次数:11
- 题名/责任者:
- Spark快速大数据分析/(美) 朱尔斯·S. 达米吉 ... [等] 著 王道远译
- 出版发行项:
- 北京:人民邮电出版社,2021
- ISBN及定价:
- 978-7-115-57601-9/CNY119.80
- 载体形态项:
- xxiv, 314页:图;24cm
- 统一题名:
- Learning spark
- 丛编项:
- 图灵程序设计丛书
- 个人责任者:
- 达米吉 (Damji, Jules S.) 著
- 个人责任者:
- 韦尼希 (Wenig, Brooke) 著
- 个人责任者:
- 达斯 (Das, Tathagata) 著
- 个人责任者:
- 李 (Lee, Denny) 著
- 个人次要责任者:
- 王道远 译
- 学科主题:
- 数据处理软件
- 非控制主题词:
- Spark
- 中图法分类号:
- TP274
- 题名责任附注:
- 题名页题其余责任者: 布鲁克·韦尼希, 泰瑟加塔·达斯, 丹尼·李
- 版本附注:
- 据原书第2版译出
- 出版发行附注:
- O'Reilly Media, Inc.授权出版
- 责任者附注:
- 朱尔斯·S. 达米吉, Databricks的高级开发人员, 也是MLflow的贡献者。布鲁克·韦尼希, Databricks的机器学习专家。泰瑟加塔·达斯, Databricks的软件工程师, 也是Apache Spark PMC成员。丹尼·李, Databricks的软件工程师。王道远, 目前就职于阿里云开源大数据平台数据湖存储团队, 花名“健身”。
- 提要文摘附注:
- 本书的主角是在大数据时代应运而生的数据处理与分析利器 —— Spark。你将通过丰富的示例学习如何使用Spark的结构化数据API, 利用Spark SQL进行交互式查询, 掌握Spark应用的优化之道, 用Spark和Delta Lake等开源工具构建可靠的数据湖, 并用MLlib库实现机器学习流水线。随着Spark从2.x版本升级到3.0版本, 本书第2版做了全面的更新, 以体现Spark生态系统在机器学习、流处理技术等方面的发展, 另新增一章详解Spark 3.0引入的新特性。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP274/337 | 00669397 | 南海校区书库 (图书定位请点击这里) | 可借 | 南海校区书库 | |
TP274/337 | 00669395 | 书库 (图书定位请点击这里) | 可借 | 书库 | |
TP274/337 | 00669396 | 书库 (图书定位请点击这里) | 可借 | 书库 |
显示全部馆藏信息