10.3772/j.issn.2095-915x.2017.01.007
面向学术资源集成的真值发现算法
在构建多渠道元数据资源建设体系时,往往存在着大量的元数据冲突的问题,即对同一对象的属性存在多种描述,造成了元数据的组织与揭示的困难.本文处理的原则是遵从原文,优先选取原文的值作为唯一的真值,将数据冲突问题视为单真值冲突问题.考虑到数据提供商均需要加工数据,将数据源之间的关系视为相互独立.根据以上,本文提出了一种面向学术资源集成的真值发现算法.该算法基于贝叶斯算法,考虑了有关联关系的属性.实验证明本文方法所构造的真值发现算法在保证准确率的同时,大大节省了人力的工作时间.
资源建设、元数据集成、冲突数据、真值发现
3
G250.7(图书馆学、图书馆事业)
NSTL专项基金项目:开放学术资源建设2016XM16
2017-06-30(万方平台首次上网日期,不代表论文的发表时间)
共6页
66-71