10.3778/j.issn.1002-8331.2011.33.037
用于网页相关性判断的聚焦查询文摘算法研究
为了进一步提高网页相关性判断的速度和准确率,提出了一种新的用于聚焦文摘的句子权重计算方法.在查询返回的结果集的基础上,通过计算关键词间的互信息,对输入的查询语句进行短语识别;利用网页文本中的标签信息,对网页结构进行分析,并将关键词短语和网页结构等信息融入句子权重计算.实验结果表明,基于该算法生成的查询摘要在相关性判断的速度和准确率等方面均优于现有方法.
信息检索、聚焦查询文摘、相关性判断、短语识别
47
TP391(计算技术、计算机技术)
北京市优秀人才培养资助专项科研基金2009D005001000005
2012-03-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
126-128,133