10.3969/j.issn.1002-137X.2012.z3.041
基于表情图片与情感词的中文微博情感分析
微博是Web 2.0时代新生的社会化媒体平台,网民通过微博抒发自己的情感,表达自己的喜怒哀乐与爱恶,从而产生了海量的情感文本信息.通过对情感信息的分析,可以得到网民的情绪状况、对某个社会现象的观点、某个产品的喜好等信息,其不仅有一定的商业价值,还对社会的稳定有所帮助.利用微博中的表情图片,并结合情感词语的方法来构建中文微博情感语料库,既保证了语料库的规模与准确性,又省去了人工的负担;在情感语料库的基础上,构建贝叶斯分类器;最后利用熵的概念对语料库进行优化,提高了分类的准确性,并比较了使用不同n-gram特征项的性能.最终发现,使用UniGram特征项并用熵进行优化之后,分类的效果最好,召回率和准确率都可以达到85%以上,F值甚至可以达到89%以上.
情感分析、表情图片、情感词、微博
39
TP391(计算技术、计算机技术)
国家十二五科技支撑计划课题"面向群体的网络热点传播分析与监测技术研究"2011BAK08B04
2013-01-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
146-148,176