利用本体关联度改进的TF-IDF特征词提取方法
针对传统TF-IDF方法提取文本特征词时未考虑词语间关系的不足,提出一种利用本体关联度改进的文本特征词提取方法.该方法首先利用传统的TF-IDF方法构建候选特征词集合和非候选特征词集合,然后根据领域本体知识在非候选特征词集合中提取候选特征词的本体关联词,利用候选特征词与其本体关联词之间的本体关联度以及本体关联词本身的权重调整候选特征词的权重,得到新的候选特征词权重排序.实验证明,该方法能够有效提高文本特征词提取的准确度.
文本特征词提取、TF-IDF、本体关联词、本体关联度
29
G350(情报学、情报工作)
中国博士后科学基金20070420700
2011-05-04(万方平台首次上网日期,不代表论文的发表时间)
279-283