10.16442/j.cnki.qlgydxxb.2019.02.010
一种非独立同分布下针对数值型数据的PAM改进算法
PAM算法是K-中心点算法中最具代表性的算法.在此算法中,相似性度量的计算方法仅假设数据对象属性之间是独立同分布,采用欧几里得距离公式来进行计算.但现实数据集中,数据对象属性之间是非独立同分布的,即它们之间都是相关联的.因此,本文针对数值型数据,在P AM算法中引入了数值型数据非独立同分布计算公式,将原本的皮尔森相关系数替换为斯皮尔曼等级相关系数,并进行了实验验证.结果显示,数值型数据非独立同分布计算公式的引入很好地提高了P AM算法的聚类精度.
聚类、PAM算法、相似性、非独立同分布
33
TP301.6(计算技术、计算机技术)
国家自然科学青年基金项目 61502259
2019-05-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
56-61