10.3969/j.issn.1009-4970.2011.11.019
基于多个分类器的分布式主题爬虫研究
随着网络信息资源的爆发式增长,现有的搜索引擎已经无法满足迅速获取准确信息的需要,为搜索引擎引入搜索内容更为精确、搜索信息量更大的爬虫显得十分迫切.本文实现了一种基于多个分类器的分布式主题爬虫方法.实验结果表明,该爬虫的速度和精度均较为良好,特别适合于对大数据量的特定主题信息的抓取.
主题提取、分类器、主题爬虫
30
TP301(计算技术、计算机技术)
河南省科技攻关计划基金资助项目08210221007102300410198
2012-04-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
51-53,57