一种有效的量化交易数据相似性搜索方法
量化交易数据与一般交易数据的不同之处在于它在各个维上的值是数值型而不是二值型的.研究这种数据的有效的相似性搜索方法是一个重要而具有挑战性的课题.提出了一个新的相似性度量函数Hsim(),这个度量函数可以较好地克服Lp等传统的距离函数在高维空间中的缺点,并能将二值型和数值型数据距离的计算整合到一个统一的框架中去.结合量化交易数据的特点,构造了定义在该函数上的相似性索引结构,并对建立在该索引结构上的相似性查询方法进行了阐述.实验表明,这种搜索方法对量化交易数据的相似性搜索有较高的修剪率,能大大地加快搜索的速度.
相似性搜索、高维数据、距离函数、量化交易数据、索引结构
41
TP311(计算技术、计算机技术)
国家高技术研究发展计划863计划2001AA113181;上海市科技发展基金015115010;信息产业部科研项目01XK310012
2004-03-26(万方平台首次上网日期,不代表论文的发表时间)
共8页
361-368