基于领域本体的文本资料聚类算法改进研究
针对由领域本体匹配产生的文本特征矩阵,描述了一种基于改进相似度计算公式的文本资料聚类算法.实验证明,当我们以生物医药领域的文本作为实验样本时,不管是从熵值还是从纯度来考虑,基于领域本体改进的聚类算法都要优于K-means算法和凝聚层次聚类算法.
文本挖掘、相似度、聚类、语义
31
G254(图书馆学、图书馆事业)
国家自然科学基金71201052;湖南大学青年教师基金
2013-09-05(万方平台首次上网日期,不代表论文的发表时间)
共6页
129-134