10.3969/j.issn.1003-3513.2004.07.006
基于支持向量机的文本自动分类试验研究
提出了将支持向量机应用于文本自动分类的研究,与常用的K-最邻近法相比,无论是对训练数据集还是测试数据集均具有一定的优势,而且不同特征选择方法对支持向量机的影响要比K-最邻近法小.此外,从研究中的不同特征选择的评价函数来看,它们对分类有一定的影响,应用X2统计进行特征选择的分类正确率最高,其次是文本证据权,而期望交叉熵的效果最差,说明特征选择在文本自动分类中也是相当重要的.
文本自动分类、支持向量机、K-最邻近法、特征选择
G254.361(图书馆学、图书馆事业)
2005-11-03(万方平台首次上网日期,不代表论文的发表时间)
共4页
27-29,67