10.3772/j.issn.1000-0135.2010.05.012
一种基于核的正交化最大散度差文本特征抽取
核方法是解决非线性可分性问题的一个重要途径.针对文本自动分类中的特征降维问题,在核最大散度差鉴别分析基础上,提出一种正交化核最大散度差鉴别准则,论证了鉴别向量集在正交化和非正交化的条件下鉴别准则的一致性.在最低限度减少信息损失的前提下实现了文本特征维数的大幅度减缩,改善了最大散度差线性鉴别准则在用于文本分类上的性能.分类试验表明,这种正交化核最大散度差鉴别向量集抽取模型,与线性最大散度差方法相比,具有明显的效率上的优势.
文本分类、特征抽取、散度差、核变换
29
TP3;O21
国家自然科学基金资助项目7571087
2010-11-30(万方平台首次上网日期,不代表论文的发表时间)
共6页
847-852