10.11925/infotech.2096-3467.2022.0328
一种面向海量科技文献数据的大规模知识图谱构建方法
[目的]解决传统三元组式知识图谱表示方法面对科技文献数据变动导致的数据一致性问题,构建满足科技信息服务需求的大规模科研知识图谱.[方法]提出隐式知识图谱构建方法,通过实体特征字段和隐式关系概念配合实体特征字段的识别工具和隐式关系的发现工具,实现对实体的持续更新和对实体关系的自动关联发现.[结果]本文方法已在PB级科技文献大数据平台实践应用,处理由于实体数据变化引起的修改时,隐式知识图谱只需更改实体数据而无需对关系数据进行修改;检索性能优越,通过预定义的接口检索机构所有学者的平均耗时缩减至三元组式知识图谱的百分之一.[局限]对于不符合隐式关系数据结构的情况很难固化,实体数据必须存储在具有搜索引擎的技术集群中.[结论]本文提出的隐式知识图谱构建方法很好地解决了由于实体信息变动引发的数据一致性问题,适用于大规模科研知识图谱的构建,有助于科技知识的高效管理和传播利用.
知识图谱、数据一致性、科技大数据
7
TP391;G350(计算技术、计算机技术)
中国科学院文献情报能力建设专项Y9100901
2023-05-12(万方平台首次上网日期,不代表论文的发表时间)
共10页
141-150