10.13313/j.issn.1673-4890.20221109015
药用植物青葙全长转录组测序分析
目的:构建药用植物青葙全长转录组,旨在为青葙功能基因组学研究提供遗传信息.方法:基于PacBio Sequel平台对青葙的根、茎、叶、花、果 5 个部位的混合样本进行高通量测序,对原始数据进行校正、筛选、聚类、去冗余、过滤、功能注释和结构分析,获得青葙全长转录组数据.结果:经质量控制后获得高质量测序reads数据量为 13.46 Gb,拼接去冗余后获得 155 300 条循环一致性序列(CCS),研究共获得 521 928 个高质量isoforms和 210 189 个转录本.利用非冗余蛋白(NR)、核苷酸序列(NT)、SwissProt、京都基因与基因组百科全书(KEGG)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、基因本体(GO)7 个数据库进行全长序列的功能注释,结果显示共有 158 562 个转录本被成功注释.GO注释结果显示,转录本共富集在包含生物学过程、细胞组成和分子功能三大类的 47 个条目中.KEGG分析显示,转录本注释到代谢通路中的基因较多,其次是基因信息过程.基因结构分析结显示,共得到 8350 条蛋白质编码序列(CDS)、88 574 条 lncRNA、45 535 个简单序列重复(SSRs),其中单核苷酸重复的占比最大,为 52.94%,此外预测得到 57 类转录因子,如常见的MADS、WRKY、AP2-EREBP、bHLH等类型.结论:获得了青葙的全长转录组数据,为该植物后续分子功能研究提供了遗传信息和基础数据.
青葙、全长转录组、功能注释、结构分析
25
R282(中药学)
广西创新驱动发展专项;对发展中国家科技援助项目;广西中药材产业科技先锋队
2023-09-08(万方平台首次上网日期,不代表论文的发表时间)
共10页
1463-1472