10.3772/j.issn.1000-0135.2011.09.008
基于领域本体的语义向量空间模型
经典向量空间模型中关键词相互独立的基本假设,造成了检索性能的限制.针对这一问题,本文介绍并分析了国内外学者对经典向量空间模型提出的改进研究.针对其研究的不足,通过分析经典向量空间模型的特点,构建领域本体以建立向量空间模型中关键词之间的语义联系,通过计算关键词之间的语义相似度,提出语义增量的概念,对关键词之间的语义联系进行量化分析.结合语义增量,对TF-IDF算法进行了改进,提出了STF-IDF算法,据此建立了语义向量空间模型,以期待提高经典向量空间模型在语义检索方面的性能.最后用实例验证了该模型在查全率和查准率方面均要优于原模型.
领域本体、语义相似度、向量空间模型、TF-IDF、语义增量
30
TP3;G25
苏州市科技局资助项目"创新驿站的管理机制和网络信息平台研究"2010524712
2011-11-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
951-955