期刊专题

时间序列数据逐步聚类降维法

引用
为了达到对复杂的多维度时间序列数据进行简化和提取有效信息的目的,本文介绍了一种新的对多维度的时间序列数据进行聚类及降维的方法,处理数据科学及其相关领域的时间序列数据的分类、剔除多重共线性及降维问题.该方法首先通过借鉴K临近算法(K-Nearest Neighbor)和贪心算法(Greedy Algorithm)的思想,基于数据横截面有效性为启发式函数(Heuristic Function),按启发式函数大小为顺序逐步对时间序列数据进行聚类;得到已聚类分组的数据后,在每一组内同样通过数据有效性为顺序进行逐步普通最小二乘法(Ordinary Least Squares,OLS)回归分析,逐步回归得到的残差作为新数据,根据新数据回测的有效性进行加权平均,在每个组别内合称为一个新的数据,最终达到降维的效果.通过利用金融量化投资领域的多因子模型(Multi-Factor Model)和过去十年的A股数据进行回测及分析,证明采用逐步聚类降维法能够有效的处理高维度、高共线性时间序列因子数据,帮助后续应用模型更好的剔除时间序列数据间的多重共线性关系,同时最大程度上保留甚至提高时间序列数据的有效性.

有监督聚类、降维、时间序列分析、K临近算法、贪心算法

23

C37(数据处理)

2020-06-04(万方平台首次上网日期,不代表论文的发表时间)

共7页

2-8

相关文献
评论
暂无封面信息
查看本期封面目录

IT经理世界

1007-9440

11-3928/TN

23

2020,23(1)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn