一种基于本体的文本聚类方法
基于本体的文本聚类方法,在文本表示上引入WordNet,并定义了关键概念集,使用WordNet中的概念节点及概念间的语义关系减少文本特征向量维数,提高聚类效果. 聚类过程中,算法使用文本的关键概念集和概念特征向量计算文本相似度,利用文本的关键概念集标注聚簇为聚类结果中的各个簇提供解释. 实验结果表明,该方法有效地减少了文本特征向量的维数,提高了文本聚类效果以及聚类结果的可解释性.
本体、WordNet、关键概念集、概念特征向量
48
TP391(计算技术、计算机技术)
国家自然科学基金60973040,60903098;教育部高等学校博士学科点专项科研基金200801830021;吉林省自然科学基金20070533;吉林大学基本科研业务费交叉学科与创新项目基金200810025
2010-05-17(万方平台首次上网日期,不代表论文的发表时间)
共7页
277-283