MARC状态:审校 文献类型:中文图书 浏览次数:19
- 题名/责任者:
- 网络数据采集技术:Java网络爬虫实战/钱洋, 姜元春著
- 出版发行项:
- 北京:电子工业出版社,2020.1
- ISBN及定价:
- 978-7-121-37607-8/CNY79.00
- 载体形态项:
- xii, 368页:图;24cm
- 其它题名:
- Java网络爬虫实战
- 个人责任者:
- 钱洋 著
- 个人责任者:
- 姜元春 著
- 学科主题:
- JAVA语言设计-程序设计
- 中图法分类号:
- TP312JA
- 中图法分类号:
- TP312
- 责任者附注:
- 钱洋, 合肥工业大学管理科学与工程系博士、CSDN博客专家。曾作为技术人员参与多个横向、纵向学术课题, 负责数据采集系统的设计与开发工作。姜元春, 合肥工业大学教授、博士生导师。长期从事电子商务、商务智能、数据采集与挖掘等方面的理论研究与教学工作。
- 提要文摘附注:
- 本书以Java为开发语言, 系统地介绍了网络爬虫的理论知识和基础工具, 包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站, 采用案例讲解的方式介绍网络爬虫中涉及的问题, 以增强读者的动手实践能力。同时, 本书还介绍了3种Java网络爬虫开源框架, 即Crawler4j、WebCollector和WebMagic。
- 使用对象附注:
- 本书适用于Java网络爬虫开发的初学者和进阶者; 也可作为网络爬虫课程教学的参考书, 供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的大学生和研究生参考使用; 也可供企业网络爬虫开发人员参考使用
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP312/294 | 00555300 | 书库 (图书定位请点击这里) | 可借 | 书库 | |
TP312/294 | 00555301 | 书库 (图书定位请点击这里) | 可借 | 书库 | |
TP312/294 | A00023394 | 书库 (图书定位请点击这里) | 借出-应还日期: | 书库 | |
TP312/294 | A00235158 | 书库 (图书定位请点击这里) | 借出-应还日期: | 书库 |
显示全部馆藏信息