基于领域本体的知识库多层次文本聚类研究——以中华烹饪文化知识库为例
基于领域本体提出一种适用于知识库树状结构的多层次文本聚类方法.该方法利用领域本体将词映射为各层级的概念,先以高层级的概念实现粗粒度聚类,以识别不同题材的文本,形成知识库的主体分类框架;再结合各层级的概念与未能映射的非概念特征词实现细粒度聚类,以揭示不同深度的文本主题信息,从而实现从粗粒度到细粒度的多层次聚类.
领域本体、文本聚类、知识库、中华烹饪文化
G250.7(图书馆学、图书馆事业)
2011年度国家社会科学基金青年项目“联合虚拟参考咨询系统的知识库研究”项目11CTQ003的研究成果之一
2014-02-14(万方平台首次上网日期,不代表论文的发表时间)
共8页
19-26