10.3778/j.issn.1002-8331.1305-0146
基于潜在语义索引的科技文献主题挖掘
提出了一种基于潜在语义的科技文献主题挖掘方法,描述了科技文献的主题挖掘模型。对科技文献集进行预处理,计算特征词权重,构造出词汇-文献矩阵。用改进的LSI算法对稀疏矩阵进行降维得到固定的主题-文献矩阵。取权重最高的主题作为该文献的主题。该方法利用Frobenius范数来规范矩阵,对稀疏矩阵进行降维,可以快速精确地挖掘出科技文献的主题。
潜在语义索引、主题挖掘、科技文献
TP311(计算技术、计算机技术)
国家自然科学基金No.71203164。
2015-01-04(万方平台首次上网日期,不代表论文的发表时间)
共6页
113-117,150