多项式核支持向量机文本分类器泛化性能分析
VC维理论和结构风险最小化准则是统计学习理论中的重要内容,基于这一理论的支持向量机算法由于具有好的泛化性能受到重视,并被研究用于文本分类问题.基于多项式核的研究工作认为SVM的泛化能力不受多项式阶数的影响,并且能够处理很高维的分类问题,用于文本分类无需进行特征选择.研究发现,随着多项式核阶数的升高,SVM文本分类器会出现过学习现象,并且特征数越多越明显,特征选择是必需的.通过估计函数集的VC维,基于结构风险最小化理论对此问题进行分析,得出的结论跟实验结果相符.
支持向量机、文本分类、结构风险最小化
41
TP18(自动化基础理论)
国家自然科学基金79990580;国家重点基础研究发展计划973计划G1998030414
2004-09-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
1321-1326