基于关系向量模型的句子相似度计算

引用

摘要：

句子相似度的计算在自然语言处理的各个领域占有很重要的地位，一些传统的计算方法只考虑句子的词形、句长、词序等表面信息，并没有考虑句子更深层次的语义信息，另一些考虑句子语义的方法在实用性上的表现不太理想。在空间向量模型的基础上提出了一种同时考虑句子结构和语义信息的关系向量模型，这种模型考虑了组成句子的关键词之间的搭配关系和关键词的同义信息，这些信息反应了句子的局部结构成分以及各局部之间的关联关系，因此更能体现句子的结构和语义信息。以关系向量模型为核心，提出了基于关系向量模型的句子相似度计算方法。同时将该算法应用到网络热点新闻自动生成算法中，排除文摘中意思相近的句子从而避免文摘的冗余。实验结果表明，在考虑网络新闻中的句子相似度时，与考虑词序与语义的算法相比，关系向量模型算法不但提高了句子相似度计算的准确率，计算的时间复杂度也得到了降低。

关键词：句子相似度、关系向量模型、句子语法、句子语义

分类号：TP391(计算技术、计算机技术)

在线出版日期：2014-01-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：198-203

英文信息展示

期刊专题