期刊专题

10.11925/infotech.2096-3467.2018.1371

基于分布式技术的科技文献大数据平台的建设研究

引用
[目的]解决海量篇级文献的存储与在线访问、大规模数据治理和服务性能低的问题,建设科技文献大数据平台.[方法]以分布式技术为基础,分析科技大数据特点及服务导向,结合服务器、网络等硬件资源条件,采用共租部署策略,设计了“5+2”整体架构的科技文献大数据平台.[结果]建成PB级科技文献大数据平台,数据存储量达到200TB,文献实体量达3.2亿条,实体关系量达60亿条,基于MapReduce的元数据处理性能提高3倍,形成了基于微服务的知识服务架构.[局限]该平台未设计完整的流式处理流程,不能满足增量数据即时响应的需求.[结论]本文建设的科技文献大数据平台已支撑中国科学院文献情报中心知识发现平台、慧科研等产品体系,取得较好的线上服务效果,提升了对科技文献数据的处理计算与服务能力.

大数据技术、分布式存储、分布式计算、共租部署、数据仓库

5

TP311;G250(计算技术、计算机技术)

2021-05-27(万方平台首次上网日期,不代表论文的发表时间)

共9页

69-77

相关文献
评论
暂无封面信息
查看本期封面目录

数据分析与知识发现

2096-3467

10-1478/G2

5

2021,5(3)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn