机读格式显示(MARC)

000 01510nam0 2200301 450

001 0000361499

005 20240926132400.0

010 __ |a 978-7-5218-4565-5 |d CNY65.00

100 __ |a 20231024d2023 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a ak a 000yy

106 __ |a r

200 1_ |a Hadoop大数据分布式计算框架 |A Hadoop da shu ju fen bu shi ji suan kuang jia |e 原理与应用 |d = Hadoop big data distributed computing framework |e principle and application |f 杨成伟, 祝翠玲, 刘位龙编著 |z eng

210 __ |a 北京 |c 经济科学出版社 |d 2023.9

215 __ |a 352页 |c 图 |d 24cm

320 __ |a 有书目

330 __ |a 本书主要包括数据采集、存储、分析和结果呈现等环节。数据无处不在, 互联网网站、政务系统、零售系统、办公系统、自动化生产系统、监控摄像头、传感器等, 每时每刻都在不断产生数据。这些分散在各处的数据, 需要采用相应的设备或软件进行采集。采集到的数据通常无法直接用于后续的数据分析, 因为对于来源众多、类型多样的数据而言, 数据缺失和语义模糊等问题是不可避免的, 因而必须采取相应的措施有效解决这些问题, 这就需要一个被称为“数据预处理”的过程, 把数据变成一个可用的状态。

333 __ |a 本书适用于计算机相关专业人员

510 1_ |a Hadoop big data distributed computing framework |e principle and application |z eng

517 1_ |a 原理与应用 |A yuan li yu ying yong

606 0_ |a 数据处理 |A shu ju chu li

690 __ |a TP274 |v 5

701 _0 |a 杨成伟 |A yang cheng wei |4 编著

701 _0 |a 祝翠玲 |A zhu cui ling |4 编著

701 _0 |a 刘位龙 |A liu wei long |4 编著

801 _0 |a CN |b 湖北三新 |c 20231024

905 __ |a GDPTC |d TP274/509