10.16442/j.cnki.qlgydxxb.2017.03.012
基于改进的TFIDF和压缩自动编码器文本分类研究
为了提高文本分类的分类效果和降低分类的错误率,本文将深度学习中的压缩自动编码器逐层叠加,提出基于改进的TFIDF和堆叠的压缩自动编码器SCAE(Stack Contractive Auto-Encoder)的文本分类思想,将SCAE构成深度神经网络,无监督的训练学习文本,提高特征提取的鲁棒性,并使用反向传播算法优化网络中的参数,在计算特征词的权重时,采用本文改进的TFIDF方法.通过实验将CAE和SAE(稀疏自动编码器)进行比较,采用支持向量机(SVM)分类.实验表明,单层的CAE比单层的SAE的分类性能更好,堆叠压缩编码器学习比堆叠的稀疏编码器的分类性能同样要好.
特征提取、压缩自动编码器、稀疏自动编码器、堆叠压缩自动编码器、SVM、文本分类
31
TP301(计算技术、计算机技术)
2017-09-05(万方平台首次上网日期,不代表论文的发表时间)
共6页
61-66