机读格式显示(MARC)
- 000 01642nam0 2200313 450
- 010 __ |a 978-7-302-67825-0 |d CNY59.80
- 092 __ |a CN |b 人天1167-2776
- 100 __ |a 20250319d2025 em y0chiy50 ea
- 200 1_ |a Python爬虫大数据采集与挖掘 |b 专著 |f 曾剑平编著
- 210 __ |a 北京 |c 清华大学出版社 |d 2025.01
- 215 __ |a 10,286页 |c 图 |d 26cm
- 330 __ |a 本书共分为四大部分,即概述、基础篇、技术与实现篇、大数据挖掘与应用篇。第一部分是概述,指出了利用Python采集互联网大数据的重要性,介绍了相关技术研究、技术体系、Python爬虫采集技术的合规性及应用现状等;第二部分是基础篇,包括Web服务器的应用架构以及HTTP、Robots、HTML、页面编码等相关协议和规范;第三部分是技术与实现篇,全面介绍了普通网络爬虫技术、动态页面采集方法、主题爬虫技术、DeepWeb爬虫、微博信息采集、Web信息提取以及反爬虫技术等,内容涵盖了各种爬虫技术实现方法及Python例子;第四部分是大数据挖掘与应用篇,介绍了文本、情感、社交网络和时间序列等典型大数据处理与挖掘技术及应用模式,并以新闻采集与分析、Web自动化测试、酒店评估文本挖掘为例介绍了Python爬虫应用构建方法,将本书介绍的一些关键技术、模型和工具贯穿在一起。
- 333 __ |a 本书可以作为高等院校大数据、计算机、信息以及经管、金融等相关专业的教材,也可以作为大数据、计算机、信息以及经管、金融等领域研究人员和专业技术人员的参考书
- 801 _0 |a CN |b 人天书店 |c 20250313