10.11896/j.issn.1002-137X.2019.08.008
基于主题分析的用户评论聚类方法
在社会化商务中对用户评论进行合理的聚类分析有利于商家提供精准服务或推荐信息,文中提出了一种基于主题分析的用户评论聚类方法.根据主题词在用户评论中的互信息强度以及主题词之间的相似度计算主题词权重,并依此构建用户评论主题向量.在此基础上,提出了一种基于用户评论相似度自动选择canopy聚类算法初始阈值的自适应canopy+kmeans聚类算法,对主题向量进行聚类分析.在亚马逊的评论数据上进行测试,结果表明:该方法充分描述了用户评论中不同主题词对用户观点的突出程度不同,并改善了K-means聚类算法易陷入局部最优的缺点,与传统的LDA+K-means算法相比,取得了更好的效果.
用户评论、主题分析、主题向量、自适应聚类
46
TP399(计算技术、计算机技术)
国家自然科学基金项目61662013,U1501252,U1711263,61662015,61562014;广西科技重大专项AA17202024;广西自然科学基金项目2017GXNSFAA198372,2016GXNSFAA380149;广西师范大学教育发展基金会第四批"教师成长基金"项目EDF2015005
2019-09-05(万方平台首次上网日期,不代表论文的发表时间)
共6页
50-55