10.3969/j.issn.1671-1815.2020.02.033
面向稀疏数据集的聚类算法
在聚类过程中数据可能呈现稀疏性,如果仍用传统的欧式距离作为聚类指标,则聚类的质量和效率将会受到严重的影响.受到信息论中KL(Kullback-Leibler)散度的启发,采用基于KL散度的相似性度量方法,先描述数据的整体分布,进而对数据进行聚类.研究结果表明,最后通过实验验证本算法的有效性.这种方法可以利用簇中元素提供的信息来度量不同簇之间的相互关系,克传统欧式距离的缺点,提升算法准确度.
数据挖掘、聚类、KL(Kullback-Leibler)、散度、欧式距离
20
TP301.6(计算技术、计算机技术)
四川省科技厅科技支撑项目;四川省教育厅科研资助项目
2020-04-29(万方平台首次上网日期,不代表论文的发表时间)
共5页
659-663