期刊专题

10.11897/SP.J.1016.2018.01814

基于众包的知识库索引对齐算法

引用
知识库对齐工作是近年来的热点研究问题.知识库对齐是将不同知识库中的实体、关系和类型进行对齐.由于知识库的规模巨大,并且不同知识库的结构差异太大,对齐工作有很多问题有待解决.从这些问题出发,且针对知识库里三种属性值,该文提出了三种索引结构,分别是基于字符串的前缀倒排索引、基于日期的DateTrie、基于数字的线段树,并且通过指示函数将对齐的字面值传递到实体对齐,再利用实体与实体之间的结构性提高准确性,最后,采用机器和人工相结合的方式,控制一定的人工预算,减少问题的候选集,利用众包将类别进行对齐,提高准确性.该文在Yago-DBpedia上对比了所提出的方法、PARIS和Exact-string方法.PARIS得到的实体对达到93.5%的准确率和71.2%的召回率,耗时839 min,而Exact-string方法耗时只有1min,但是召回率只有57.2%.相比于这两种方法,该文的方法达到90%的准确率和79.3%的召回率,耗时25 min,耗时比PARIS方法短,而召回率比Exact-string高.

知识库对齐、实体对齐、索引、类别对齐、众包

41

TP311(计算技术、计算机技术)

2018-09-20(万方平台首次上网日期,不代表论文的发表时间)

共13页

1814-1826

暂无封面信息
查看本期封面目录

计算机学报

0254-4164

11-1826/TP

41

2018,41(8)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn