10.16157/j.issn.0258-7998.200748
基于爬虫和TFIDF-NB算法的微博情感分析
针对微博网络舆情信息量大、无规则、随机变化的特点,提出TFIDF-NB(Term Frequency Inverse Document Frequency-Naive Bayes)用于微博情感分析,设计与实现了一个基于Scrapy框架的微博评论爬虫,将某热点事件的若干条微博评论进行爬取并存进数据库,然后进行文本分割、LDA(Latent Dirichlet Allocation)主题聚类,最后使用TFIDF-NB算法进行情感分类.实验结果表明,TFIDF-NB算法平均准确率高于线性支持向量机算法和K近邻算法,在精确率和召回率方面高于K近邻算法,具有较好的情感分类效果.
微博舆情、网络爬虫、情感分类
47
TN011;TP391.41(一般性问题)
广东高校省级重大科研项目;广东省学科建设专项;智能多媒体技术重点实验室;北京师范大学珠海分校2019校级"质量工程"课程思政项目
2021-04-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
59-62,66