10.11896/j.issn.1002-137X.2018.03.051
一种基于CFDs规则的修复序列快速判定方法
数据一致性是大数据质量管理研究的一个重要内容.条件函数依赖(CFDs)是维护数据一致性的有效技术手段.然而,在修复过程中选择不同的CFDs修复顺序,会影响修复的准确性和效率.因此,如何选取一个正确且合理的修复顺序对数据修复至关重要.针对该问题,提出一种基于CFDs规则的快速判定修复序列的计算方法.首先,设计了一种数据修复框架.然后,利用CFDs之间的关联关系,提出了修复序列图的概念,以用于CFDs修复顺序的计算.一方面,可以避免某些错误的或者不必要的数据修复,提高修复的准确性.另一方面,使用规则来判定修复顺序比使用实际数据进行判定更为快速.此外,在判定修复序列的过程中,对修复死锁进行了检测,保证了修复过程的可终止性.最后,通过在真实数据集上与现有方法进行对比实验,证明了所提方法具有更高的准确性和运行效率.
数据一致性、条件函数依赖、修复序列
45
TP311.13(计算技术、计算机技术)
河北省自然科学基金F2014409008;河北省科技计划项目17210336;廊坊市科技计划项目2017011042
2018-04-23(万方平台首次上网日期,不代表论文的发表时间)
共6页
311-316