权重概率主成分分析模型的建立及应用研究
目的 建立权重概率主成分分析模型,通过模拟实验进行模型评价,选择最优模型进行代谢组学数据分析,为代谢组学数据分析提供降噪优化的分析方法.方法 使用折刀抽样法计算变量载荷的置信区间和变异系数,利用变量载荷的变异信息设计倒数式、开根式、对数式三种加权方式进行原始数据中的变量加权,结合概率主成分分析模型建立权重概率主成分分析模型;通过模拟实验从第一主成分载荷的估计和预测效能进行模型评价,选择最优权重概率主成分分析模型;绘制代谢组学数据主成分得分图,利用中心距离比较权重概率主成分分析模型与概率主成分分析模型在可视化分组效果.结果 倒数式加权概率模型在第一主成分载荷的估计和模型预测方面优于另外两种权重概率模型.在可视化方面,权重概率主成分分析不仅缩小了模型估计的不确定性,而且增大组间的中心距离.结论 构建了权重概率主成分分析模型,不仅结果解释和可视化优于概率主成分分析模型,而且为差异变量的筛选提供了一个较小的参考范围.
代谢组学、变量筛选、概率主成分分析、权重
35
国家自然基金81502889;黑龙江省自然基金重点项目ZD201314;黑龙江省卫生厅项目2012-770
2019-01-07(万方平台首次上网日期,不代表论文的发表时间)
共4页
802-805