10.3969/j.issn.1000-0135.2006.02.002
搜索引擎用户点击行为分析
基于大规模分布式搜索引擎系统--北大"天网"的用户点击记录,本文研究发现:用户点击不同URL的数量遵从Heaps定律,点击URL的频度频级服从类Zipf分布, 点击URL与页面大小相关,点击URL具有时间局部性,其顺序具有自相似性特征等一些具有普适性的规律.提出了利用点击日志确定相近查询词的一个新的有效算法.这些研究结果对于掌握用户的搜索行为,完善搜索引擎系统的设计,提高检索服务的效率和质量具有重要的意义.
搜索引擎、点击日志、用户行为、分布特征、相似查询
25
G35(情报学、情报工作)
国家高技术研究发展计划863计划60435020;高等学校博士学科点专项科研项目20030001076;中国博士后科学基金2004036182
2006-05-22(万方平台首次上网日期,不代表论文的发表时间)
共9页
154-162