10.16652/j.issn.1004-373x.2019.07.037
基于全覆盖粒计算的K-medoids文本聚类算法
传统K-me doids聚类算法随机选取初始聚类中心,存在迭代次数增加、聚类结果波动较大的问题,因此提出基于全覆盖粒计算的K-medoids文本聚类算法.该算法定义了全覆盖平均粒度重要性的概念.首先对文本进行Single-Pass粗聚类,利用全覆盖粒度重要性和平均粒度重要性从粗聚类结果中产生初始聚类中心候选集,再基于密度和最大最小距离法则从候选集中选出初始聚类中心.通过实验验证,该算法的聚类迭代次数明显减小,聚类质量明显提高.
文本聚类、K.medoids、全覆盖粒计算、Single.Pass、聚类中心、最大最小距离、密度
42
TN911.1-34;TP391.1
山西省回国留学人员科研项目2015-045,2013-033
2019-05-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
162-166