10.3778/j.issn.1002-8331.1203-0223
一种融合词语位置特征的Lucene相似度评分算法
相似度评分算法是Lucene引擎中的核心部分之一。对Lucene内部的相似度评分算法进行研究分析后,针对Lucene只关心查询词出现的频率,而不关心它们所在的位置这一缺陷提出了一种改进的算法。改进的算法将词语位置关系特征融合到Lucene原始相似度评分算法中。在TREC数据集上的实验结果表明:改进后的算法与Lucene原始算法相比,在MAP和P@n指标上都有一定程度的提高。
Lucene、相似度、全文检索
TP311(计算技术、计算机技术)
中央高校基本科研业务费科研专项No.CDJZR11090001。
2014-01-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
129-132,161