广东职业技术学院图书馆书目检索系统

广东职业技术学院图书馆书目检索系统

Online Public Access Catalogue

| 暂存书架(0) | 登录

馆藏检索简单检索多字段检索

借阅关系图

相关资源

把本书分享到

EverNote
麦库
豆瓣
腾讯微博
新浪微博
人人网
网易微博
开心网

使用说明二维码

收藏此书的书架

MARC状态：审校文献类型：中文图书浏览次数：15

题名/责任者:: 深入大型数据集:并行与分布化Python代码/(美) John T. Wolohan著张若飞译

出版发行项:: 北京:电子工业出版社,2021.2

ISBN及定价:: 978-7-121-40368-2/CNY99.00

载体形态项:: xx, 300页:图;24cm

统一题名:: Mastering large datasets with python : parallelize and distribute your python code

其它题名:: 并行与分布化Python代码

个人责任者:: 沃勒翰 (Wolohan, John T.) 著

个人次要责任者:: 张若飞译

学科主题:: 软件工具-程序设计

中图法分类号:: TP311.561

责任者附注:: 责任者规范汉译姓: 沃勒翰

提要文摘附注:: 本书共分3部分, 主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格, 以及Python中基础的map和reduce函数, 并介绍如何将对象持久化, 通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架, 以及如何使用mrjob库来编写Hadoop作业, 如何实现PageRank算法, 如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识, 包括如何通过boto3的Python库将文件上传到AWS S3服务, 以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。

使用对象附注:: 本书适合有一定Python编程基础, 且希望掌握大型数据集处理能力的开发人员和数据科学家阅读

全部MARC细节信息>>

索书号	条码号	年卷期	馆藏地	书刊状态	还书位置
TP311.561/440	00713251		南海校区书库 (图书定位请点击这里)	可借	南海校区书库
TP311.561/440	00713252		书库 (图书定位请点击这里)	可借	书库
TP311.561/440	00713253		书库 (图书定位请点击这里)	可借	书库

显示全部馆藏信息

借阅趋势

同名作者的其他著作(点击查看)

收藏到：管理书架