期刊专题

基于微博的细粒度情感分析

引用
[目的]对微博进行细粒度情感分析,将情感分为8类,并计算其情感强度值,从而尽可能还原微博用户情感.[方法]通过微博语料分析构建疑问词词表,在大连理工大学情感词汇本体DUTIR的7类情感基础上,丰富一类情感“疑”,并利用点互信息法构建表情符号词典,还综合考虑否定词和程度副词对情感表达的影响,利用Python从新浪微博上获取数据,并用R语言的jiebaR包进行分词,对情感进行分类并计算其强度.[结果]得到微博用户对于糖尿病7类常用药物的8类情感占比及情感强度,并通过正确率、召回率、F值对结果进行验证,其中“怒”和“哀”的正确率最高,分别为85.73%和83.05%,而“乐”和“好”的召回率与F值均最高,为81%以上.本文新增情感“疑”的正确率、召回率、F值分别为77.33%、78.58%、77.95%,均值在8类情感中排名前列,说明其情感识别较好.[局限]由于本文依赖于情感词典进行情感分析,因此为了更好的分析结果,情感词典仍需进一步完善.[结论]本方法具有较高的识别率和可靠性,能够更好地对微博上的情感分类进行细粒度分析.

微博、细粒度情感分析、药物

TP393(计算技术、计算机技术)

2017-10-30(万方平台首次上网日期,不代表论文的发表时间)

共12页

61-72

相关文献
评论
暂无封面信息
查看本期封面目录

数据分析与知识发现

1003-3513

11-2856/G2

2017,(7)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn