机读格式显示(MARC)
- 000 01301nam0 22002651 450
- 010 __ |a 978-7-302-46980-3 |d CNY89.00
- 100 __ |a 20170622d2017 em y0chiy50 ea
- 200 1_ |a Hadoop构建数据仓库实践 |9 Hadoop gou jian shu ju cang ku shi jian |b 专著 |f 王雪迎著
- 210 __ |a 北京 |c 清华大学出版社 |d 2017
- 312 __ |a 封面英文题名:Practice of Hadoop data warehouse
- 330 __ |a 本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。
- 510 1_ |a Practice of Hadoop data warehouse |z eng
- 606 0_ |a 数据处理软件 |9 shu ju chu li ruan jian
- 701 _0 |a 王雪迎 |9 wang xue ying |4 著
- 801 _0 |a CN |b GDPTC |c 20201124
- 905 __ |a GDPTC |d TP274/163