基于Nutch的开放存取搜索引擎构建研究
研究当前主要的开放存取搜索系统的实现机制,选择基于网络爬虫的搜索引擎技术,利用开源软件Nutch构建分布式DSearch实验系统,为开放存取资源出版和信息服务机构提供一种高效、灵活、可定制的检索工具.重点介绍DSearch系统核心技术-分布式集群配置、中文分词模块修改和索引设置,并通过设定的种子列表实验对DSearch系统实现的功能和效果进行评价.
开放存取、搜索引擎、Nutch、中文学术资源
TP39(计算技术、计算机技术)
北京理工大学校基础研究基金20061442003
2011-02-28(万方平台首次上网日期,不代表论文的发表时间)
82-86