10.11925/infotech.2096-3467.2017.0717
基于大规模评论数据的产品特征词典构建方法研究
[目的]基于大规模评论数据,提出一种产品特征词典的构建方法,以提升识别产品特征的查准率和查全率.[方法]在人工标注的基础上,基于同义词林的扩展,以及大规模评论文本的词向量训练,计算词语的语义相似度和相关性,进行特征的识别与归并,进而形成产品特征词典.[结果]本文选取手机、相机、图书三类产品的评论数据进行实验,平均查准率和平均查全率分别为0.774和0.855.结果显示,该方法具有一定的普适性.[局限]标注及验证需大量人工参与,自动化程度不够;没有考虑评论中的隐含特征.[结论]通过与已有研究比较,验证了本文提出方法的有效性,特别在查全率上具有显著的提升.
产品评论、特征词典、特征提取、观点挖掘
2
TP393;G35(计算技术、计算机技术)
国家自然科学基金项目“基于屏幕视觉热区的网络用户偏好提取及交互式个性化推荐研究”71571084;国家自然科学基金项目“基于用户偏好感知的SaaS服务选择优化研究”项目71271099的研究成果之一
2018-03-29(万方平台首次上网日期,不代表论文的发表时间)
共10页
41-50