基于降噪自动编码器的中文新闻文本分类方法研究-期刊-万方数据知识服务平台

搜索

基于降噪自动编码器的中文新闻文本分类方法研究

1.江苏大学科技信息研究所镇江2120132.江苏大学科技信息研究所镇江2120133.江苏大学科技信息研究所镇江212013

引用

打印

摘要：[目的]借助深度学习理论,解决传统特征选择方法容易导致特征项不明确、分类精度下降的问题.[方法]对中文新闻文本进行分类时,使用降噪自动编码器构建一个深层网络来学习对文本的压缩及分布式的表示,并在网络最后一层采用SVM算法将其分类到具体的类别中去.[结果]随着样本数目的增大,分类准确率、召回率和F值都在上升,且比KNN算法、BP算法和SVM算法取得了更优的分类效果,平均分类准确率达到95％以上.[局限]数据量依然较小,且并没有完全发挥深度学习并行处理大容量数据的优势.[结论]该方法能提高特征项提取的准确性,并能提高分类效果.

关键词：

降噪自动编码器支持向量机特征提取文本分类

分类号：

G350(科学、科学研究)

资助基金：

教育部人文社会科学研究项目 ( 14YJC870014 )

在线出版日期：

2016-08-10 （万方平台首次上网日期，不代表论文的发表时间）

英文信息

同项目论文

14YJC870014:教育部人文社会科学研究项目