10.3969/j.issn.1002-1965.2016.10.032
情感词典扩充的微博文本多元情感分类研究
[目的/意义]传统的微博文本情感分类大多注重判别情感的二元或三元倾向,这不能很好地贴近人类真实情感的描述。对微博文本的多元情感分类问题进行研究,有助于探明微博用户对某事件的真实看法,帮助相关部门对事件走向做出正确的判断和引导。[方法/过程]结合卡方检验方法,对含有众多口语化词汇和表情符号的微博文本进行处理,从含有特定表情符号的微博句子中识别属于某类情感的情感词,并结合《同义词词林》,实现对已有多元情感本体库的扩充。综合考虑扩充的情感词典、Bi-gram特征、否定词特征、表情符号和特殊符号以及句子长度等特征,利用SVM实现对微博文本句子级情感的多元分类,并以2014年“袁隆平事件”为例,实现对该事件的多元情感分析。[结果/结论]实验结果表明,相对于未进行情感词典扩充的情感分类而言,基于情感词典扩充的多元情感分类方法在分类性能上提升了3.6%,取得了比较好的分类效果。
微博、多元情感分类、情感词典、卡方检验
35
TP391(计算技术、计算机技术)
中央高校基本科研业务费专项资金项目“基于社会网络特征提取的群体性突发事件预警方法研究”2572014DB05;国家自然科学基金“群体性突发事件预警的超网络方法研究”71473034。
2016-11-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
185-189