局部差异正则化的边界判别投影
高维是大数据的一个重要特点,数据降维是处理高维数据的有效手段.数据降维算法的设计,关键在于保持原始高维数据集中蕴含的判别信息和几何结构,使得生成的低维特征表示既能刻画原始高维数据的分布形状,又能以更低的计算成本服务于后续的分类任务.边界判别投影算法是一种有监督的线性降维算法,通过最大化不同类别样本点之间的最小距离和最小化同类样本点之间的最大距离,来获取最优判别投影方向.为了保持样本点的几何结构,提高边界判别投影算法的泛化能力,在边界判别投影模型中融入了样本点的局部差异性信息.通过最大化投影之后样本点之间的局部差异来保持数据集的多样性,即在数据降维过程中,局部邻域内相距较远的样本点在投影之后应该保持较远的距离,从而防止在投影过程中原始数据集中蕴含的相似关系和拓扑结构发生扭曲.在图嵌入框架下,数据集的相似信息、判别信息和局部差异信息可以采用正则化的迹差准则进行数据建模.在优化求解时,为了降低散度矩阵特征分解的时间复杂度,通过对数据矩阵进行QR分解来加速计算.人脸图像数据集上的分类实验验证了局部差异正则化的边界判别投影算法在判别特征提取方面的有效性.
数据降维、边界判别投影、数据分类、局部差异、图嵌入
41
TP18(自动化基础理论)
西北农林科技大学博士科研启动基金2452015302;杨凌示范区科技计划项目2016NY-31;科学计算与智能信息处理广西高校重点实验室基金GXSCIIP201406
2018-07-30(万方平台首次上网日期,不代表论文的发表时间)
共16页
780-795