期刊专题

RIIM:基于独立模型的在线缺失值填补

引用
随着数据来源的不断丰富,数据的获取变得愈发容易,但质量难以得到保证,从而导致缺失值在真实数据集中普遍存在且难以避免,缺失值填补也就成为数据质量管理领域的经典问题之一.目前,大多数的缺失值填补算法均是针对静态数据提出的,并不适用于高速到达的动态数据流,且现有算法大多未同时考虑数据的稀疏性和异构性问题.基于此,文中提出了一种新的基于独立模型的在线缺失值填补算法RIIM.该算法同时考虑了数据的稀疏性和异构性问题,并结合近邻填补和回归填补的基本思想对缺失值进行有效填补.首先,针对数据的动态实时性,提出了高效的填补模型增量更新算法;其次,针对数据近邻查找时间代价高以及近邻个数难以确定的问题,提出了最优近邻自适应周期性更新策略;最后基于真实数据集通过大量实验验证了所提算法的有效性.

缺失值、在线填补、数据流、稀疏性、异构性

49

TP3-05(计算技术、计算机技术)

国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;中国博士后科学基金面上项目;中国博士后科学基金面上项目;中国博士后科学基金面上项目;辽宁省自然科学基金;赛尔网络下一代互联网技术创新项目;中央高校基本科研业务费

2022-08-11(万方平台首次上网日期,不代表论文的发表时间)

共8页

56-63

暂无封面信息
查看本期封面目录

计算机科学

1002-137X

50-1075/TP

49

2022,49(8)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn