10.3969/j.issn.1002-137X.2004.08.029
一种基于RPUC的Web文档索引库的更新算法
为提高搜索引擎文档索引库有效性验证的效率,本文提出了一种综合考虑网页更新频度、用户兴趣度及其内容重要程度诸因素相结合以确定文档索引库更新队列的算法.算法将用户的检索率、点击率、网页的Page Rank值和更新频度作为一个特征向量,与不同种类的网页的特征权值组成的矩阵相乘,求得网页的类型向量,依据类型向量实现对文档索引库更新队列的优化,算法改进了统一更新策略周期长、单一更新策略可能产生改变频繁而非常重要的网站长期又得不到更新的问题.
搜索引擎、索引数据库、检索率、Page Rank、更新频度、点击率
31
TP3;G35
国家自然科学基金40731061;重庆市教委资助项目
2004-09-23(万方平台首次上网日期,不代表论文的发表时间)
共3页
95-96,200