机读格式显示(MARC)
- 000 01296nam0 2200253 450
- 010 __ |a 978-7-302-49327-3 |d CNY58.00
- 049 __ |a A330000ZJL |b UCS01009144420 |c 3371243
- 100 __ |a 20180704d2018 em y0chiy50 ea
- 200 1_ |a 数据清洗 |9 shu ju qing xi |b 专著 |f 李法平主编
- 210 __ |a 北京 |c 清华大学出版社 |d 2018
- 215 __ |a 12,238页 |c 图 |d 26cm
- 330 __ |a 本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验、数据错误处理、数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集等;第8章介绍RDBMS的数据清洗方法和数据脱敏处理技术等。
- 606 0_ |a 数据处理 |9 shu ju chu li |x 技术培训 |j 教材
- 701 _0 |a 李法平 |9 li fa ping |4 主编
- 801 _0 |a CN |b GDPTC |c 20190410
- 905 __ |a GDPTC |d TP274/108