Improving amphibian genomic resources: a multi-tissue reference transcriptome of an iconic invader
海蟾蜍的混样转录本组装(Gigascience 11月)
摘要
海蟾蜍(Rhinella marina)是某些地区的入侵者,同时也是研究快速进化的良好样本。本文介绍了一种利用多个组织样和发育阶段的样本进行转录组组装的方法,以期为快速进化的研究提供遗传学基础。
背景
众所周知,重复序列对基因组大小的评估影响很大,而两栖动物基因组大小差异很大,因此海蟾蜍作为两栖动物中大基因组的代表,利用基因组进行测序组装困难较大。但不含有重复和非编码区的转录组测序,就能很好的避开重复序列对基因组大小的影响。
样品
本文对泛滥成灾的澳大利亚和生长地巴西两个地区的海蟾蜍进行了多组织取样测序(表1)。其中肌肉和肝脏的数据下载自NCBI。
结果
一、数据处理、组装、注释
首先利用Trimmomatic软件进行数据处理,然后将数据按样品来源分成两类:一类来自澳大利亚,另一类来自巴西。并利用Trinity对两类数据分别进行标准化,得到约42.2 Mb和82.2 Mb数据。接着分别采用软件Trinity、SOAPdenovo、Velvet/Oases进行多种参数的组装(表2),得到100个组装结果,约4,200000条转录本。经过软件tr2aacda去冗余后,最终得到62,202条转录本。
紧接着利用TransDecoder预测CDS区,并通过Transvestigator进行标准化处理后得到最终用于上传至NCBI的转录本。
最后利用Trinotate流程对预测到的蛋白序列进行注释(表3)。
二、组装评估
本文采用3种方法对组装转录本进行评估。
1、比较对象:分别由肌肉和肝脏转录组数据进行单样组装的转录本。
比较方法:组装指标
结果:混样的各项组装指标都明显优于单样(表3)
2、比较对象:已发表海蟾蜍、两栖动物的转录本或基因组
比较方法:BUSCO评估
结果:评估结果优于大部分参考对象,并且本文海蟾蜍转录组含有更多完整BUSCO基因,说明组装的完整性很好(表4)。
3、比较对象:已发表海蟾蜍转录组和3个两栖动物基因组(X.tropicalis, X.laevis, N.parkeri)
比较方法:BLAST标准比对+BLAST最优比对
结果:将本文海蟾蜍转录组与肝脏和肌肉转录组进行标准比对,比对率分别为65.5%和50.1%;而最优比对率分别为38.5%和25.5%。文章推测造成这种差异的原因,可能是组装的转录组中仍旧存在冗余。
将本文转录组分别与3个两栖动物基因组进行BLAST标准比对,发现比对到X.tropicalis, X.laevis, N.parker的比例分别为40,275(64.7%)、40,218(64.7%)、40,244(64.7%),其中37,064条转录本为4个物种所共有。在注释上的31,103条转录本中,97.8%能比对到X.tropicalis,97.9%比对到 X.laevis,98.3%比对到N.parkeri,96.3%为 4个物种所共有。说明本文海蟾蜍转录组同源性好。
三、Orthologues
利用OrthoFinder寻找与X.tropicalis, X.laevis, N.parkeri之间的Orthologues。发现60.2%基因具有同源性。另外,有12,674个orthogroups的基因包含4个物种(即每个orthogroup都含有4个物种的基因,并且每个物种至少1个基因);有4,586个orthogroups仅含有单拷贝基因(即每个orthogroup不仅含有4个物种基因,并且每个物种只有一个基因)。
意义
为解决海蟾蜍入侵问题提供参考,同时也增进了对两栖动物基因组的了解。
点击以下「关键词」,查看往期内容:
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史