10.3969/j.issn.1004-9444.2024.04.001
基于机器学习算法识别DNA甲基化位点
DNA甲基化是表观遗传学中的研究热点之一.本研究提出一种预测DNA序列中甲基化位点的新方法,名为DPTRS.首先,利用二核苷酸组成(dinucleotide composition,DNC)、伪二核苷酸组成(pseudo dinucleotide composition,PseDNC)和三核苷酸组成(trinucleotide composition,TNC)对序列进行表征.其次,融合获得的信息并利用重复编辑的近邻方法(repeated edited nearest neighbour,RENN)进行不平衡处理.再次,通过局部线性嵌入(locally linear embedding,LLE)方法进行降维.最后,利用支持向量机(support vector machine,SVM)对特征子集进行预测.最终的预测结果基于十折交叉验证方法得出,基准数据集上预测准确率为91.48%.结果显示,DPTRS方法能够有效识别DNA序列中的甲基化位点.
DNA甲基化、不平衡处理、支持向量机
40
Q811.4(生物工程学(生物技术))
2024-09-10(万方平台首次上网日期,不代表论文的发表时间)
共7页
1-6,20