人在回路的数据融合系统
一个端到端的数据融合系统在如下几个阶段需要用户的反馈,包括为实体匹配收集训练数据的阶段,对计算出来的实体聚类进行纠错的阶段以及对每个实体聚类中的数据形式进行转换的阶段.经过这些步骤之后,数据融合系统可以将每个实体分组中的实体合并成一条权威的实体表示(被称作"黄金记录").传统的数据融合系统通常会按照特定的顺序,在用户时间代价不超过预算的前提下,依次询问特定集合中的问题并且获得用户反馈.可是,由于这些问题是高度相关的,一个问题的答案会影响到数据处理管道中任何一个阶段的结果,所以将各个阶段交替进行并且对他们的执行顺序进行全局优化能带来显著的收益.在这篇文章中,我们提出一个"人在回路"的数据融合系统,通过交…展开v
数据融合;实体匹配;实体合并;人在回路;机器学习;相似查询;代价优化
45
TP311(计算技术、计算机技术)
智能数据管理资助61925205
2022-03-10(万方平台首次上网日期,不代表论文的发表时间)
共15页
654-668