机读格式显示(MARC)
- 000 01510nam0 2200301 450
- 010 __ |a 978-7-5218-4565-5 |d CNY65.00
- 100 __ |a 20231024d2023 em y0chiy50 ea
- 200 1_ |a Hadoop大数据分布式计算框架 |A Hadoop da shu ju fen bu shi ji suan kuang jia |e 原理与应用 |d = Hadoop big data distributed computing framework |e principle and application |f 杨成伟, 祝翠玲, 刘位龙编著 |z eng
- 210 __ |a 北京 |c 经济科学出版社 |d 2023.9
- 215 __ |a 352页 |c 图 |d 24cm
- 330 __ |a 本书主要包括数据采集、存储、分析和结果呈现等环节。数据无处不在, 互联网网站、政务系统、零售系统、办公系统、自动化生产系统、监控摄像头、传感器等, 每时每刻都在不断产生数据。这些分散在各处的数据, 需要采用相应的设备或软件进行采集。采集到的数据通常无法直接用于后续的数据分析, 因为对于来源众多、类型多样的数据而言, 数据缺失和语义模糊等问题是不可避免的, 因而必须采取相应的措施有效解决这些问题, 这就需要一个被称为“数据预处理”的过程, 把数据变成一个可用的状态。
- 510 1_ |a Hadoop big data distributed computing framework |e principle and application |z eng
- 517 1_ |a 原理与应用 |A yuan li yu ying yong
- 606 0_ |a 数据处理 |A shu ju chu li
- 701 _0 |a 杨成伟 |A yang cheng wei |4 编著
- 701 _0 |a 祝翠玲 |A zhu cui ling |4 编著
- 701 _0 |a 刘位龙 |A liu wei long |4 编著
- 801 _0 |a CN |b 湖北三新 |c 20231024
- 905 __ |a GDPTC |d TP274/509