10.16652/j.issn.1004-373x.2017.14.023
基于CBC-LIKE算法的产品特征词聚类的研究
用户评论中存在产品特征表达多样性问题,在细粒度观点挖掘任务中需要对产品特征词聚类.首先,结合不同的语义相似度计算的特点,提出基于语义知识和上下文熵模型的语义相似度混合计算方法,计算抽取得到的特征词语义相似度;然后改进了传统CBC算法,提出适用于产品特征词聚类的CBC-LIKE方法实现聚类.最后在三个领域的真实评论语料上进行实验,对提出的语义相似度计算方法和聚类算法的性能进行了分析.实验结果表明,所提方法是有效的,与另外两种基线方法相比性能较优,取得了较好效果.
产品特征、语义相似度、聚类算法、观点挖掘
40
TN911-34
国家自然科学基金资助项目61173050;中央高校基础研究经费资助项目2662015QC040
2017-10-20(万方平台首次上网日期,不代表论文的发表时间)
共4页
81-84