一种时间序列鉴别性特征字典构建算法
时间序列数据广泛产生于科技和经济的多个领域.基于符号傅里叶近似(symbolic Fourier approximation)和滑动窗口的定长单词抽取算法是目前时间序列特征字典构建过程中最有效的特征生成算法之一,但是该算法在特征生成过程中不能根据不同滑动窗口长度动态地选择保留的最优傅里叶值的个数,而且特征字典构建过程中缺少从生成的海量特征中对鉴别性特征进行有效选择的算法.为此,提出一种鉴别性特征字典构建算法.首先,提出一种针对不同长度滑动窗口学习最优单词长度的基于Fourier近似的可变长度单词抽取方法;其次,构建了一种新的特征鉴别性评价指标,并依据其动态阈值对生成的特征进行选择.实验结果表明,基于构建的特征字典的逻辑回归模型不仅分类精度高,而且可以有效发现预测过程中的鉴别性特征.
时间序列分类、特征生成、鉴别性特征选择、特征字典学习
31
TP311(计算技术、计算机技术)
中央高校基本科研业务费专项资金;国家自然科学基金;北京市自然科学基金;北京市优秀人才项目资助
2020-11-10(万方平台首次上网日期,不代表论文的发表时间)
共22页
3216-3237