10.3969/j.issn.1002-2694.2019.00.013
棘球属绦虫线粒体基因组全序列生物信息学分析
目的 利用生物信息学技术分析棘球属绦虫线粒体基因组全序列碱基组成、基因的结构组成及排列、蛋白基因核苷酸序列变异位点、密码子使用情况及偏好性、系统发育等,为研究棘球绦虫系统起源、演化、分类及亲缘关系等提供理论基础.方法 从GenBank数据库下载12种棘球属绦虫线mtDNA全序列,并以猪带绦虫作为外类群,构建系统发育树.利用OGDRAW在线分析网站及Vector NTI Express软件,分析mtDNA的组成及排列情况.用Clust-X软件对多个相似序列进行多重序列比对分析;使用Mega4.0软件选择邻接法构建进化树,并分析密码子使用情况;利用RNAfold在线预测网站使用minimum free energy (MFE) and partition function算法预测l-rRNA和s-rRNA二级结构.结果 除Eg G1外,棘球绦虫属mtDNA有36个编码基因,包括22个转运RNA基因、12个蛋白基因、2个核糖体RNA基因;但Eg G1 mtDNA最小,只有30个编码基因,在起始编码区缺少6个编码转运RNA的基因,且第一个编码基因不是ND5,而是COX3;编码蛋白的基因核苷酸序列变异率为27.9%~42.7%,其中COX1最为保守,ND5变异率最大达到42.7%;棘球属绦虫线粒体蛋白质编码基因起始密码子除atg,也有一些蛋白质以gtg作为起始密码子,终止密码子以taa和tag常见,但也有以ttt作为终止密码子的;棘球绦虫属使用的密码子为密码表9,使用频率最高的密码子是UUG(2.72%),频率最低的是CUC(1%)、CGC(1%),编码亮氨酸、精氨酸的密码子最多达6个,编码甲硫氨酸、色氨酸最少只有一个,亮氨酸也是棘球属绦虫最偏好的氨基酸达到6%;棘球属绦虫核糖体基因有两个长度大小分别为977~985 bp、700~727 bp,两个基因的位置十分靠近中间只隔一个trnC基因;系统进化树中Ev、Eo单独为一枝,Em、Es及Eg G1、Ef形成姐妹枝,细粒棘球绦虫G4、G5、G6、G7、G8、G10亚型聚为一枝,进化距离较近.结论 本研究将为棘球属绦虫mtDNA的研究、分子进化和分子诊断等方面提供诸多信息,并为种系鉴定起到一定的指导作用.
棘球属绦虫、线粒体基因组、生物信息学分析、系统发育
35
R383.3(医学寄生虫学)
青海大学附属医院中青年项目ASRF-2018-YB-01;2017国家重点研发计划“精准医学研究”专项2017YFC0909900;青海省应用基础研究项目2014-ZJ-719
2019-05-20(万方平台首次上网日期,不代表论文的发表时间)
共7页
271-277