机读格式显示(MARC)
- 000 01598nam0 2200289 450
- 010 __ |a 978-7-121-37607-8 |d CNY79.00
- 100 __ |a 20191202d2020 em y0chiy50 ea
- 200 1_ |a 网络数据采集技术 |A wang luo shu ju cai ji ji shu |e Java网络爬虫实战 |f 钱洋, 姜元春著
- 210 __ |a 北京 |c 电子工业出版社 |d 2020.1
- 215 __ |a xii, 368页 |c 图 |d 24cm
- 314 __ |a 钱洋, 合肥工业大学管理科学与工程系博士、CSDN博客专家。曾作为技术人员参与多个横向、纵向学术课题, 负责数据采集系统的设计与开发工作。姜元春, 合肥工业大学教授、博士生导师。长期从事电子商务、商务智能、数据采集与挖掘等方面的理论研究与教学工作。
- 330 __ |a 本书以Java为开发语言, 系统地介绍了网络爬虫的理论知识和基础工具, 包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站, 采用案例讲解的方式介绍网络爬虫中涉及的问题, 以增强读者的动手实践能力。同时, 本书还介绍了3种Java网络爬虫开源框架, 即Crawler4j、WebCollector和WebMagic。
- 333 __ |a 本书适用于Java网络爬虫开发的初学者和进阶者; 也可作为网络爬虫课程教学的参考书, 供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的大学生和研究生参考使用; 也可供企业网络爬虫开发人员参考使用
- 517 1_ |a Java网络爬虫实战 |A Javawang luo pa chong shi zhan
- 606 0_ |a JAVA语言设计 |A JAVAyu yan she ji |x 程序设计
- 701 _0 |a 钱洋 |A qian yang |4 著
- 701 _0 |a 姜元春 |A jiang yuan chun |4 著
- 801 _0 |a CN |b 湖北三新 |c 20191202
- 905 __ |a GDPTC |d TP312/294