中文评论产品特征与观点抽取方法研究
[目的]针对中文在线评论产品特征与观点抽取问题,提出一种基于置信度排序模型的抽取方法.[方法]在改进HITS算法基础上,综合考虑候选特征观点词的关联关系和语义关系构建置信度排序模型,提取并过滤特征观点词.[结果]和基准模型相比,本文方法对中文语料的产品特征和观点抽取能达到较高准确率和召回率.[局限]仅针对产品显性特征抽取,没有考虑隐性特征的识别与抽取.[结论]利用特征词和观点词的双向增强关系和语义关系,可以有效抽取产品特征观点;情感极性过滤对提升观点词抽取准确率有较大作用.
置信度排序、HITS、关联关系、语义关系、双向增强关系、特征观点抽取
G350(情报学、情报工作)
本文系国家自然科学基金项目“中文语境下基于模糊本体的用户在线评论的情感分析”项目编号:70971099和国家自然科学基金项目“在线评论对商家业绩的影响研究:情感分析的视角”项目编号:71371144的研究成果之一.
2016-04-14(万方平台首次上网日期,不代表论文的发表时间)
16-24