基于语义距离的K-最近邻分类方法
最近邻分类方法中对距离机制的研究大都集中在根据何种计算方法将不同属性取值的差异集中起来,而未考虑到同一属性间取值的语义差异所带来的影响;而且传统算法的分类准确率对于不同抽象层次描述的数据集带来的数据不完整性相当敏感.针对这两个问题,提出一种基于语义距离的最近邻分类方法SDkNN(semantic distance based k-nearest neighbor).该方法分析了同一属性内取值的语义差异,说明了如何基于领域本体计算语义距离,并将其应用到kNN算法中.经过在UCI数据集以及实际应用数据集中验证,SDkNN的整体性能要优于传统方法,在数据不完整的情况下效果更为明显,实践证明,SDkNN有较好的应用价值.
本体、语义距离、最近邻、分类
16
TP18(自动化基础理论)
国家科技攻关项目2003AA112050;科技部专项基金2001BA102A05-02
2006-01-12(万方平台首次上网日期,不代表论文的发表时间)
共9页
2054-2062