基于众包的知识库索引对齐算法
知识库对齐工作是近年来的热点研究问题.知识库对齐是将不同知识库中的实体、关系和类型进行对齐.由于知识库的规模巨大,并且不同知识库的结构差异太大,对齐工作有很多问题有待解决.从这些问题出发,且针对知识库里三种属性值,该文提出了三种索引结构,分别是基于字符串的前缀倒排索引、基于日期的DateTrie、基于数字的线段树,并且通过指示函数将对齐的字面值传递到实体对齐,再利用实体与实体之间的结构性提高准确性,最后,采用机器和人工相结合的方式,控制一定的人工预算,减少问题的候选集,利用众包将类别进行对齐,提高准确性.该文在Yago-DBpedia上对比了所提出的方法、PARIS和Exact-string方法.PARIS得到的实体对达到93.5%的准确率和71.2%的召回率,耗时839 min,而Exact-string方法耗时只有1min,但是召回率只有57.2%.相比于这两种方法,该文的方法达到90%的准确率和79.3%的召回率,耗时25 min,耗时比PARIS方法短,而召回率比Exact-string高.
知识库对齐、实体对齐、索引、类别对齐、众包
41
TP311(计算技术、计算机技术)
2018-09-20(万方平台首次上网日期,不代表论文的发表时间)
共13页
1814-1826