10.16442/j.cnki.qlgydxxb.2024.04.003
基于ETL技术的多源异构数据融合方法研究
在多源大数据融合阶段处理历年异构的数据时,涉及到多指标和多维度的问题,需要清洗、转换、映射和对齐等操作.相关数据处理工具和方法逐步涌现,但仍难以解决大量数据的交叉融合问题.为此,研究了基于ETL技术的多源异构数据融合方法,分析了常用的ETL工具和数据融合技术,包括数据抽取、转换、加载工具以及数据处理算法.分析了面向灵活需求、业务交叉较多和实时数据流场景时,遇到的数据源异构、数据结构差异、数据更新频率困难等问题,并从模块化设计、逻辑和参数分离、标准化构件库、轻量级JSON格式的配置文件等方面研究了ETL工具模块化扩展和构件重复使用的方法,以便更好地处理大规模异构数据.解决了多源大数据融合阶段的交叉融合问题,对提高数据处理效率、确保数据质量以及支持更深入的数据分析和决策具有重要意义.
教育统计、数据挖掘、转换-抽取-加载、软件工程
38
TP311.1(计算技术、计算机技术)
国家重点研发计划2019YFB1404700
2024-09-01(万方平台首次上网日期,不代表论文的发表时间)
共7页
18-24