10.3969/j.issn.1002-137X.2011.07.053
基于EMD距离的多示例聚类
多示例学习中,包由多个示例组成,有明确标记,而示例标记却不确定.已有聚类研究都针对单示例、单标记,因而无法直接应用于多示例问题.基于推土机距离(earth mover's distance,EMD)提出了一种新的多示例聚类算法ECMIL.该方法首先利用欧式距离计算包内示例相似度,将相似示例合并;然后将需要度量距离相似性的包内示例分别看作供货者和消费者,计算货物拥有量和货物需求量;对推土机距离无法供货问题,通过增大满足条件供货者的权值加以解决;最后使用k-medoids算法进行聚类.在基准数据集MUSK,Corel和SIVAL上进行实验,表明ECMIL算法是有效的.
多示例聚类、推土机距离、k-medoids
38
TP3;TP2
教育部新世纪优秀人才支持计划项目NCET-07-0693;陕西省教育厅科研项目10JK852
2012-01-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
235-239