超球支持向量机文本分类方法改进
[目的]针对文本分类中类别特征向量改变和重叠等问题,对超球支持向量机(HS-SVM)分类算法进行改进.[方法]基于增量学习和密度决策函数对原始HS-SVM进行改进,实现超球类支持向量的动态改变,准确计算构造超球支持向量机的决策函数,从而达到提高文本分类效果的目的.[结果]与原始超球支持向量机的文本分类实验对比表明,本文所提方法在准确率和召回率方面优于其他方案,建模时间减少且对预测精确度的影响不大.[局限]应进行多种类型数据集上的实验验证,推广方法改进的适用性;其次对分类算法的底层改进欠缺,需继续探索.[结论]本研究有利于提高大规模文本分类的准确性和减少训练时间,从而提升文本分类效果.
LDA主题模型、超球支持向量机、增量学习、密度决策函数
TP391(计算技术、计算机技术)
本文系教育部人文社会科学青年基金项目“社会网络环境下信息内容主题挖掘与语义分类研究”项目编号:13YJC870008和国家自然科学基金青年基金项目“社会网络环境下基于用户-资源关联的信息推荐研究项目编号:71303178的研究成果之一.
2014-10-16(万方平台首次上网日期,不代表论文的发表时间)
74-80