10.3321/j.issn:1000-436x.2007.12.020
基于短文本的独立语义特征抽取算法
提出了一种基于短文本的独立语义特征抽取算法,旨在降低文本向量的稀疏性并提其高语义表示能力.该算法首先采用潜在语义分析降低文本的维数并去除噪声,然后运用独立成份分析方法在潜在语义特征中提取出最能表达语义且相互统计独立的特征.实验表明此算法优于潜在语义索引算法.
特征、语义、独立成份
28
TP391.1(计算技术、计算机技术)
国家自然科学基金60475007;60675001
2008-04-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
121-124