10.3969/j.issn.2096-4706.2019.05.004
知识图谱系统研发
本工程要实现一个关于"动物"的知识图谱系统,用来描述"动物"的各种实体和概念,以及它们之间的强关系,我们用SPO三元组(Subject-Predicate-Object)去描述两个实体间的关联,简单理解就是"实体-实体关系-实体",例如,猫和猫科动物之间的关系是科,用"猫-科-猫科"来表示,把实体看作结点,实体关系看作一条边,那么就可以构建一个庞大的关于"动物"的知识图.构建"动物"知识图谱需要动物的实体和实体间关系,这些数据需要通过网络爬虫技术从网上获取,但网上获取的数据是文本形式,不能直接使用,所以需要用到知识抽取技术,本文使用基于句法依存关系的方法,实现了提取文本中的实体及实体间关系,然后以三元组的形式将这种关系表现出来,最后将生成的SPO三元组存入Neo4j图数据库,形成一个"动物"知识图谱.
知识图谱、网络爬虫、知识抽取、SPO三元组、NEO4J图数据库
3
TP391.1(计算技术、计算机技术)
2019-05-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
13-17