机构知识库自动存储系统研究
介绍一种从网络文献数据库中自动采集机构学术成果并存储到DSpace平台的实验系统(DAAS),并实现信息过滤、元数据提取、版权验证、元数据映射和数据存储的半自动化流程.详细描述基于Nutch核心组件,DAAS针对不同的期刊数据库,采用基于规则的方法设置过滤器来提取非结构化网页上书目信息,并指出计算机学习算法是下一步研究重点.
机构知识库、自动存储、信息提取、Nutch、DSpace
TP39(计算技术、计算机技术)
北京理工大学基础研究基金20061442003
2011-04-06(万方平台首次上网日期,不代表论文的发表时间)
76-80