基于SUMO和WordNet本体集成的文本分类模型研究
针对传统文本分类方法和目前语义分类方法中存在的问题,提出基于SUMO和WordNet本体集成的文本分类模型,该模型利用WordNet同义词集与SUMO本体概念之间的映射关系,将文档一词向量空间中的词条映射成本体中相应的概念,形成文档-概念向量空间进行文本自动分类.实验表明,该方法能够极大降低向量空间维度,提高文本分类性能.
SUMO本体、WordNet、本体集成、文本分类模型、词向量空间、概念向量空间
G250;TP391(图书馆学、图书馆事业)
国家社会科学基金一般项目10BTQ047;教育部人文社会科学研究规划一般项目09YJA870019
2011-05-04(万方平台首次上网日期,不代表论文的发表时间)
31-38