10.3321/j.issn:0251-0790.2009.07.008
基于环境的编码方法在预测HLA-A*0201结合多肽中的应用
T淋巴细胞对抗原的识别是产生与调节有效免疫应答的关键, T细胞只识别主要组织相容性复合物(MHC)呈递上来的抗原, 因此MHC与抗原多肽的结合就成为一系列免疫应答过程中基础的一环. 为了辅助疫苗设计, 多种机器学习技术已被普遍应用于MHC结合多肽的预报领域中. 本文以支持向量机(SVM)为手段, 以HLA-A*0201的实验数据集为对象, 对多种肽段编码方法形成的模型进行评价, 得到的AUC值的范围在0.932~0.936之间. 提出一种新的利用抗原多肽结合环境的编码方法, 使预报的AUC值提高到0.953. 对独立数据集进行建模预报, 同样证明环境编码模型的预报准确率高于传统编码方法的准确率.
HLA-A*0201、结合多肽预测、支持向量机(SVM)、编码、受试者工作曲线(ROC)
30
O652;Q516(分析化学)
国家自然科学基金20675057, 20705024
2009-10-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
1309-1313