基于LSTM和多特征组合的电影评论专业程度分类
社交网络上的电影评论通常既有专业评论家写的专业评论,也有普通观众写的非专业评论,区分网络电影评论是否为专业评论对于电影质量评估有着重要的价值.由于电影评论属于短文本,用词不规范,特征稀疏,因此传统的文本特征选择方法以及传统的分类模型并不能完全适用于电影评论专业程度的分类.为此,文中主要研究基于神经网络模型电影评论的专业程度分类,即判断其是专业评论还是非专业评论.首先通过基于神经网络的LSTM模型学习不同特征的表示,包括基于词的表示、基于词性的表示,以及基于依存关系的表示,然后通过融合不同特征表示来学习和捕捉有效的文本特征,从而帮助评论专业程度分类.该方法在美国著名的影评网站烂番茄网(Rotten Toma-toes)数据集上进行实验,实验结果表明,在融合了词性和依存关系特征的模型的分类正确率达到了88.30%,比仅使用词特征的基准模型提高了3.66%.这说明在模型中引入词性特征、依存关系特征能够有效提升评论专业程度分类的效果.
多特征组合、评论专业程度分类、神经网络、LSTM、SVM
46
TP391(计算技术、计算机技术)
国家自然科学基金61331011 ,61672366
2019-07-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
74-79