MARC状态:审校 文献类型:中文图书 浏览次数:11
- 题名/责任者:
- Apache Spark大数据分析:基于Azure Databricks云平台/(瑞典)罗伯特·伊利杰森(Robert Ilijason)著 袁国忠译
- 出版发行项:
- 北京:人民邮电出版社,2023.06
- ISBN及定价:
- 978-7-115-61456-8/CNY79.80
- 载体形态项:
- 236页;23cm
- 并列正题名:
- Beginning Apache Spark using Azure Databricks:unleashing large cluster analytics in the cloud
- 个人责任者:
- (瑞典) 伊利杰森 (Ilijason, Robert) 著
- 个人次要责任者:
- 袁国忠 译
- 学科主题:
- 数据处理软件-机器学习
- 中图法分类号:
- TP274
- 一般附注:
- Apress
- 版本附注:
- Apress Media, LLC授权出版
- 提要文摘附注:
- 本书总计11章,首先介绍大规模数据分析相关的概念;然后介绍受管的Spark及其与Databricks的关系,以及Databricks的版本差异和使用方法(涵盖工作区、集群、笔记本、Databricks文件系统、数据导入/导出等内容);接着介绍使用SQL和Python分别实现数据分析的过程,数据提取、变换、加载、存储、优化技巧等高阶数据处理方法以及外部连接工具、生产环境集成等内容;最后探讨了运行机器学习算法、合并数据更新以及通过API运行Databricks、Delta流处理等高阶主题。
- 使用对象附注:
- 本书适用于数据工程师、数据分析师和决策分析人员
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP274/559 | 00796693 | 书库 (图书定位请点击这里) | 可借 | 书库 | |
TP274/559 | 00796694 | 书库 (图书定位请点击这里) | 可借 | 书库 |
显示全部馆藏信息