机读格式显示(MARC)
- 000 01578nam0 2200289 450
- 010 __ |a 978-7-5606-7602-9 |d CNY49.00
- 049 __ |a O340111XHG |b UCS01013128329 |c 013128329
- 100 __ |a 20250331d2025 em y0chiy50 ea
- 200 1_ |a Spark大数据技术项目实战 |9 Spark da shu ju ji shu xiang mu shi zhan |b 专著 |f 邓永生,李丽,张俊豪主编
- 210 __ |a 西安 |c 西安电子科技大学出版社 |d 2025
- 215 __ |a 209页 |c 图 |d 26cm
- 330 __ |a 本书主要围绕大数据处理技术Spark展开讲解,主要介绍大数据分析处理的全流程,并剖析每个环节中所使用的关键技术及其原理。全书共分为八个实战项目:项目一介绍如何搭建一个稳定且高效的Spark集群环境,并深入探讨Spark的基本概念、特点及应用场景,同时与Hadoop进行对比分析;项目二通过实现一个完整的人事管理系统,介绍Scala语言的基础语法与面向对象及函数式编程理念;项目三至项目七分别针对电商用户行为数据、电影数据、银行客户数据、设备故障数据以及社交媒体评论数据,运用Spark进行深入的数据分析与处理,涵盖从数据预处理到高级统计分析的全过程;项目八通过一个综合性的案例——基于SparkMLlib的广告点击率预测,将书中所讲知识融会贯通,完成大数据开发的核心流程,包括数据预处理、特征工程、模型训练与评估等步骤。
- 606 0_ |a 数据处理软件 |9 Shu Ju Chu Li Ruan Jian |j 教材
- 701 _0 |a 邓永生 |9 deng yong sheng |4 主编
- 701 _0 |a 李丽 |9 li li |4 主编
- 701 _0 |a 张俊豪 |9 zhang jun hao |4 主编
- 801 _0 |a CN |b 安徽新华 |c 20250331
- 801 _2 |a CN |b O340111XHG |c 20250402
- 905 __ |a GDPTC |d TP274/637