共词分析中的词语贡献度特征选择研究
从数据降维的角度来看,传统共词分析中以高频词构建共词矩阵的方法有较大的改进空间.将共词分析与文本分类、聚类、检索等方法进行对比归一,引入词语贡献度作为新的特征词选择方法,并给出算法描述.从聚类效果层面将新方法与传统方法进行对比,通过实证验证基于词语贡献度的特征选择方法对共词分析有改进作用.
共词分析、聚类、词语贡献度、特征选择、数字图书馆
TP391(计算技术、计算机技术)
国家自然科学基金资助项目"数字图书馆社区的知识聚合与服务研究"项目71273197的研究成果之一
2013-09-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
89-93