10.3778/j.issn.1002-8331.2011.30.035
聚类反馈学习的数据清洗研究
重复记录的清除是数据清洗领域的核心问题,但如何实施有效的清除一直是研究的难点.提出了一种通过建立聚类反馈模式规约来验证重复记录的有效性方法.依据经过聚类后各个类别间的关联性关系分析,首先提出了聚类模式和反馈模式的概念和实现方法;然后给出了数据清洗中聚类反馈模式规约;最后应用项目案例验证了它的有效性.
数据清洗、重复记录、模式规约、聚类学习、反馈学习
47
TP393.01(计算技术、计算机技术)
国家自然科学基金the National Natural Science Foundation of China under Grant 60671063;中央高校基本科研业务费专项资金GK201002011;教育部科学研究重点项目107106
2012-02-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
127-131