基于文本内容特征选择的评论质量检测
[目的]在有效提取多维特征基础上,考察评论内容特征对评论质量检测的影响.[方法]基于评论文本的信息特征度量和情感倾向的混合性,量化并抽取评论内容特征,采用GBDT模型评估特征集合分类效果,结合贪婪式特征选择算法识别有效内容特征,分析其对评论质量检测的影响.[结果]将评论内容特征应用于评论质量检测任务中能取得较好的效果,明显提升了实验准确率和召回率.[局限]实验对象主要是搜索型产品的评论数据,未对其他享受型产品(如电影、音乐)等进行验证和比较.[结论]评论内容的信息增益、产品特征词的信息增益、评论客观情感倾向度、内容差异性对评论质量检测有明显作用.
评论质量、信息特征、情感倾向、内容特征、贪婪式特征选择
G350(情报学、情报工作)
本文系国家自然科学基金项目“中文语境下基于模糊本体的用户在线评论的情感分析”项目编号:70971099和国家自然科学基金项目“在线评论对商家业绩的影响研究:情感分析的视角”项目编号:71371144的研究成果之一.
2016-06-16(万方平台首次上网日期,不代表论文的发表时间)
40-47