10.3969/j.issn.1006-2475.2008.11.020
kNN在文本分类中的应用研究
随着网络技术与数字图书馆的迅猛发展,在线文档迅速增加,自动文本分类已成为处理和组织大量文档数据的关键技术.kNN方法作为一种简单、有效、非参数的分类方法,在文本分类中得到广泛的应用.本文介绍了kNN分类算法的思想以及两种不同的决策规则,并通过实现的文本分类系统对基于离散值规则的kNN方法和基于相似度加权的kNN方法进行实验比较.实验结果表明,基于相似度加权的kNN方法的分类性能要优于基于离散值规则的kNN方法.
文本分类、kNN、特征选择
TP391;TP18(计算技术、计算机技术)
唐山市重点实验室资助项目06360301A-6
2009-01-14(万方平台首次上网日期,不代表论文的发表时间)
共4页
69-72