期刊专题

10.19850/j.cnki.2096-4706.2020.14.021

基于Python的爬虫技术的网站设计与实现

引用
随着爬虫技术的不断完善,其功能越来越强大,也导致数据窃取问题越来越严重.很多网站都采用了反爬虫技术,因此为了正常获取数据,需要一些反爬虫策略.文章设计和实现面向定向网站的网络爬虫程序,使其能满足不同的性能要求,并阐述了定向网站爬虫的细节和应用环节.爬虫可以针对不同的主题网站分析构造URL并去重,多线程技术让爬虫具备更强大的抓取能力.

Python、爬虫、数据、豆瓣读书网

4

TP391.3;TP391.1(计算技术、计算机技术)

广东省高职高专云计算与大数据专业委员会2019年度课题;中国职业技术教育学会教学工作委员会2019—2020年度职业教育教学改革课题研究1910110;广东环境保护工程职业学院质量工程项目;校企合作项目"环保管家"大数据服务平台建设

2020-10-13(万方平台首次上网日期,不代表论文的发表时间)

共4页

73-75,78

暂无封面信息
查看本期封面目录

现代信息科技

2096-4706

44-1736/TN

4

2020,4(14)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn