10.3969/j.issn.1002-1965.2014.02.026
中文微博的情绪识别与分类研究
利用微博平台的API数据端口爬取微文数据,通过分词技术、去停用词等对原微文进行数据预处理,并基于TF-IDF计算文本特征权重后构建向量空间模型,使用文档频率和信息增量相结合的方法对特征向量进行降维,最后基于多种文本分类方法的对比研究构建最优情绪分类器。研究表明:基于机器学习的文本分类技术适用于较大语料库的微博研究。在进行细粒度情绪分类时,支持向量机的分类效果较好。
微博、情绪识别、情绪分类、机器学习、支持向量机
G202(信息与传播理论)
2014-03-12(万方平台首次上网日期,不代表论文的发表时间)
共5页
136-139,85