10.3772/j.issn.1002-0470.2014.06.003
Web搜索引擎的一种检索结构优化方法
为了提升Web引擎的检索服务性能和扩展性,提出了一种索引划分方法,依据该方法改进了检索结构,避免了冗余查询,并加速了内部并行化查询过程.按照文档主题和相似URL对索引文档分类,而索引节点内则按照词项划分,实现了索引节点查询间和查询内的并行.根据索引分类的结构,改进了系统内部查询逻辑,设计了Aggregator(简称Agg)进程队列,实现了异步处理高并发查询.实验结果表明,优化的Web引擎结构总体上能够降低查询开销,提高系统吞吐量,相对于传统Web搜索模型,其查询速度和吞吐量分别提高了20%和25%.
Web搜索引擎、分布式搜索、检索结构、吞吐量、分类索引
24
TP3;U2
国家自然科学基金61173024
2014-09-11(万方平台首次上网日期,不代表论文的发表时间)
共8页
565-572