分阶段融合的文本语义相似度计算方法
面向中文文本的信息检索,提出一种从句子、段落到文本整体分阶段进行的文本相似度计算方法.该方法结合文档的主题与应用范围,用语义加强的权重计算方法对特征词赋予相应的权重,并根据每个计算阶段的特点,分别融入对文本语义的计算因素,力求使中文文本的相似度计算结果更为准确.最后建立文本相似度计算系统,通过与传统算法的实验结果进行对比,证明改进后的算法可以取得更好的效果.
文本相似度、信息检索、语义相似度、权重
TP391(计算技术、计算机技术)
陕西省教育厅科学研究计划项目"基于实时嵌入式安全的双向序列加密方法研究"项目2013JK1146的研究成果之一
2013-11-26(万方平台首次上网日期,不代表论文的发表时间)
共7页
20-26