基于微博的细粒度情感分析
[目的]对微博进行细粒度情感分析,将情感分为8类,并计算其情感强度值,从而尽可能还原微博用户情感.[方法]通过微博语料分析构建疑问词词表,在大连理工大学情感词汇本体DUTIR的7类情感基础上,丰富一类情感“疑”,并利用点互信息法构建表情符号词典,还综合考虑否定词和程度副词对情感表达的影响,利用Python从新浪微博上获取数据,并用R语言的jiebaR包进行分词,对情感进行分类并计算其强度.[结果]得到微博用户对于糖尿病7类常用药物的8类情感占比及情感强度,并通过正确率、召回率、F值对结果进行验证,其中“怒”和“哀”的正确率最高,分别为85.73%和83.05%,而“乐”和“好”的召回率与F值均最高,为81%以上.本文新增情感“疑”的正确率、召回率、F值分别为77.33%、78.58%、77.95%,均值在8类情感中排名前列,说明其情感识别较好.[局限]由于本文依赖于情感词典进行情感分析,因此为了更好的分析结果,情感词典仍需进一步完善.[结论]本方法具有较高的识别率和可靠性,能够更好地对微博上的情感分类进行细粒度分析.
微博、细粒度情感分析、药物
TP393(计算技术、计算机技术)
2017-10-30(万方平台首次上网日期,不代表论文的发表时间)
共12页
61-72