DOI：10.19850/j.cnki.2096-4706.2020.14.029

基于Scrapy的信息采集与分析

引用

摘要：

针对携号转网服务背景下电信企业的客户维系和客户精细化服务需求,以及电信运营商对网上不良信息监测和清理的需要,以国内主流社交媒体为主要研究对象,进行网络爬虫策略的研究与实现.文章对基于Python的Scrapy爬虫框架技术进行了分析,设计和实现了基于Scrapy的微博信息采集与分析爬虫,其能按照关键词进行爬取和分析;爬虫使用非关系型数据库MongoDB存储数据、利用Selenium实现模拟登陆、结合Redis数据库存储爬取队列.

关键词：Scrapy、爬虫、微博、MongoDB

所属期刊栏目：4

分类号：TP315;TP393.1(计算技术、计算机技术)

在线出版日期：2020-10-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：96-98

英文信息展示

期刊专题