10.3969/j.issn.1002-137X.2010.03.048
基于多个领域本体的文本层次被定义聚类方法
传统的聚类方法常常将文本中不够准确且计算量大.提出了一种基于多个领域本体的文本层次聚类方法,利用多个领域本体将用关键词表示的文本特征向量表示为与之匹配的概念向量集,定义文本相似度的计算公式,设计并实现基于多个领域本体的文本凝聚聚类算法.实验结果表明,该方法从概念层次上表示和处理文本,降低了聚类对象空间的维度,减少了计算量,提高了文本聚类的精确度和聚类效率.
领域本体、相似度计算、凝聚层次聚类
37
TP391(计算技术、计算机技术)
国家自然科学基金60373099,60603031;国家教育部高等学校博士学科点专项科研基金20060183044,200801830021;吉林省自然科学基金20070533;吉林大学基本科研业务费交叉学科与创新项目200810025
2010-05-10(万方平台首次上网日期,不代表论文的发表时间)
共6页
199-204