10.3772/j.issn.1000-0135.2010.04.003
基于聚类和词组抽取的XML查询扩展
查询扩展技术通过向初始查询请求加入相似或相关的词,组成更为准确的扩展查询表达式,来减少查询请求与相关文献在表达上的不匹配现象,改善检索性能.与传统的查询扩展不同,XML查询扩展不仅要对文档内容进行有效扩展,而且还要考虑结构扩展.本文提出了一种基于伪反馈的XML查询扩展方法,将初始检索结果聚类,获得与查询请求最为相关的文档簇,然后在文档簇中抽取词组,找到符合用户查询意图的扩展查询词组,并在扩展查询词组的基础上进行结构扩展,最终形成完整的"内容+结构"的查询扩展表达式.相关实验结果表明,相对没有扩展的查询,所提方法具有更好的精度.
XML、伪反馈、聚类、扩展查询词组、结构查询扩展
29
TP3;G35
国家自然科学基金项目60763001,60803105;国家社会科学基金项目07BTQ025
2010-09-07(万方平台首次上网日期,不代表论文的发表时间)
共8页
597-604