10.3321/j.issn:1671-5489.2007.06.018
基于网页分块技术主题爬行器的实现
针对目前通用搜索引擎搜索到的结果过多、与主题相关性不强的现状,提出一种基于网页分块技术的主题爬行器实现方法,并实现了一个原型系统Crawler1.实验结果表明,本系统性能较好,所爬网页的相关度在55%以上.
主题搜索、主题爬行、相关度分析、网页分块
45
TP311(计算技术、计算机技术)
国家自然科学基金60373099
2008-01-21(万方平台首次上网日期,不代表论文的发表时间)
共7页
959-965