分阶段融合的文本语义相似度计算方法

引用

摘要：

面向中文文本的信息检索,提出一种从句子、段落到文本整体分阶段进行的文本相似度计算方法.该方法结合文档的主题与应用范围,用语义加强的权重计算方法对特征词赋予相应的权重,并根据每个计算阶段的特点,分别融入对文本语义的计算因素,力求使中文文本的相似度计算结果更为准确.最后建立文本相似度计算系统,通过与传统算法的实验结果进行对比,证明改进后的算法可以取得更好的效果.

关键词：文本相似度、信息检索、语义相似度、权重

分类号：TP391(计算技术、计算机技术)

资助基金：陕西省教育厅科学研究计划项目"基于实时嵌入式安全的双向序列加密方法研究"项目2013JK1146的研究成果之一

在线出版日期：2013-11-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：20-26

英文信息展示

期刊专题