10.3969/j.issn.1000-0135.2005.04.002
Web网页信息变化的时间局部性规律及其验证
掌握Web网页信息变化的时间规律可以更有针对性的指导搜索引擎等Web应用系统更有效地进行搜集.本文旨在研究中国范围内Web网页变化的时间规律,针对网页变化的频率和间隔两项指标,随机选取数百万网页作为样本,设计试验在一个月内对上述两项指标进行考察.从结论中,我们发现网页变化的若干规律,并发现其中可能存在时间局部性规律.因此,我们引入了堆栈距离模型,在针对Web网页的变化特性和具体实验方法对其修正之后,再次设计实验对网页变化的时间局部性规律进行考察.结果表明,网页的变化存在明显的时间局部性.最后,介绍了这种时间局部性规律在网页搜集中的实际应用.
Web网页、时间局部性、堆栈距离模型、变化次数、变化间隔
24
TP3(计算技术、计算机技术)
国家自然科学基金60435020;国家重点基础研究发展计划973计划G1999032706;高等学校博士学科点专项科研项目20030001076
2005-09-15(万方平台首次上网日期,不代表论文的发表时间)
共9页
398-406