10.11896/j.issn.1002-137X.2018.06.039
一种基于始末距离的时间序列符号聚合近似表示方法
时间序列数据的特征表示方法是时间序列数据挖掘任务的关键技术,符号聚合近似表示(SAX)是特征表示方法中比较常用的一种.针对SAX算法在各序列段表示符号一致时无法区分时间序列间的相似性这一缺陷,提出了一种基于始末距离的时间序列符号聚合近似表示方法(SAX_SM).由于时间序列有很强的形态趋势,因此文中提出的方法选用起点和终点来表示各个序列段的形态特征,并使用各序列段的形态特征和表示符号来近似表示时间序列数据,以将其从高维空间映射到低维空间;然后,针对起点和终点构建始末距离来计算两序列段间的形态距离;最后,结合始末距离和符号距离定义一种新的距离度量方式,以更客观地度量时间序列间的相似性.理论分析表明,该距离度量满足下界定理.在20组UCR时间序列数据集上的实验表明,所提SAX_SM方法在13个数据集中获得了最高的分类准确率(包含并列最大的),而SAX只在6个数据集中获得了最高的分类准确率(包含并列最大的),因此SAXSM具有比SAX更优的分类效果.
时间序列数据、序列段、始末距离、符号距离
45
TP391(计算技术、计算机技术)
江苏省重点研发计划社会发展项目BE2016630;江苏省六大人才高峰项目2014-WLW-012;江苏省重点研发计划社会发展项目BE2015617;无锡市卫计委重点项目Z201603
2018-08-30(万方平台首次上网日期,不代表论文的发表时间)
共6页
216-221