10.3969/j.issn.1002-1965.2012.05.035
基于概念语义场的文本聚类算法研究
传统的基于关键词的文本聚类算法,由于难以充分利用文本的语义特征,聚类效果差强人意.笔者提出一种概念语义场的概念,并给出了基于知网构建概念语义场的算法.即首先利用知网构造义原屏蔽层,将描述能力弱的义原屏蔽,然后在分析知网结构的基础上给出抽取相关概念的规则,以及简单概念语义场和复杂概念语义场的构造方法.最后给出一种基于概念语义场的文本聚类算法.该算法可充分利用特征词的语义关系,对不规则形状的聚类也有较好效果.实验表明,该算法可以有效提高聚类的质量.
知网、概念语义场、文本聚类
31
TP391.1(计算技术、计算机技术)
2012-07-31(万方平台首次上网日期,不代表论文的发表时间)
共6页
180-184,191