10.3969/j.issn.2096-4706.2018.02.004
一种基于卷积自编码器的文档聚类模型
文档聚类是将文档集自动归成若干类别的过程,是对文本信息进行分类的有效方式.为了解决半结构化的文本数据转化为结构化数据时出现的数据高维性问题,本文提出了一种卷积自编码器的文档聚类模型CASC,利用卷积神经网络和自编码器的特征提取能力,在尽可能保留原始数据内部结构的同时,将其嵌入到低维潜在空间,然后使用谱聚类算法进行聚类.实验表明,CASC模型在保证聚类准确率不降低的前提下减少了算法运行时间,同时也降低了算法时间复杂度.
聚类、卷积神经网络、自编码器、无监督模型
2
TP391;TN911.2(计算技术、计算机技术)
天津市科技计划项目17KPXMSF00140,17ZLZXZF00470;天津市科技项目KJCX-KFQ-CXY-2016-003
2018-05-23(万方平台首次上网日期,不代表论文的发表时间)
共4页
12-15