高维数据中有效的相似性计算方法
相似性的计算是CBR和k-NN等Lazy Learning研究中十分关键的问题.研究了降低相似性计算代价的方法,并以k-NN为例,介绍了基于部分特征的相似性算法和基于投影的相似性算法,它们能够通过减少计算距离过程中所涉及的特征数目来提高算法的效率.实验表明效率的提高是明显的,其中基于部分特征的k-NN算法效率提高26%~28%,基于投影的 k-NN算法效率提高48%~83%.作者已将该算法应用到工程中.
相似性、数据约简、近邻算法、Lazy Learning、数据采掘、KDD
37
TP311.13(计算技术、计算机技术)
中国科学院资助项目69803010;国家科技攻关项目863-511-946,863-818-07
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
1166-1172