Scallop genome provides insights into evolution of bilaterian karyotype and development
扇贝基因组揭示双侧对称动物核型和发育进化
研究背景
进化学家推测双侧对称动物可能起源于一个古老的共同祖先(Urbilateria),但由于早期动物化石记录匮乏,长期以来人们对双侧对称动物的起源和进化机制存有较多争议,因此组装出高质量的双侧对称动物基因组用以比较分析很有必要。
软体动物是冠轮动物中最大的门,并且是化石记录中最古老的双侧对称动物。几亿年来,包括双壳贝类在内的软体动物,在贝壳形态及生活习性上没有太大改变,但却能大量存在于多种多样的海洋环境中。软体动物形态的多样性,有助于研究动物进化;眼睛形态、数目和位置的多样性,有助于研究眼睛的起源和进化。所研究的扇贝个体P.yessoensis是一个大型软体动物,它生活在又冷又稳定的太平洋西北边的海底。它拥有19条染色体,这可能是多种多样的双壳类动物的共同特性,甚至也可能是双壳类祖先染色体的核型。因此,扇贝为研究双侧对称动物的祖先基因组提供了良好的模型。
研究结果
1、 测序,组装
扇贝的基因组杂合度很高,基因组非常复杂,组装其基因组精细图很困难,于是作者选择了一只雌雄同体扇贝,它可以同时产生卵子和精子,利用其自体受精产生的后代进行测序组装,降低了基因组的杂合度,就可以使基因组组装的精确度更高。
作者构建180bp、300bp、500bp小文库,和2 kb、5 kb、10 kb、16 kb大文库,利用Illumina HiSeq 2000测序,最终共获得424.3Gb数据。
利用Soapdenovo组装得到988 Mb基因组,contig N50为38 kb,scaffold N50为804 kb。组装基因组比评估的基因组小442 Mb(基因组评估为1.43 Gb),作者怀疑是重复序列元件导致的。作者还对基因组进行了组装评估:94.5%的测序reads、99.8%福斯质粒,以及96%~99.8%的转录组数据能比对到基因组。作者采用2b-RAD技术构建了含有7,489个marker的遗传图谱,并利用遗传图谱将1,419条scaffolds(约占组装基因组的81%)挂载到19条染色体上。在软体动物或者说是古老的冠轮动物中,这是首次将基因组组装到染色体水平。
Ps:
①圈表示染色体上marker分布;②圈表示子代杂合度;③圈表示亲本杂合度;④圈表示测序深度;⑤圈表示重复序列含量;⑥圈表示基因密度。通过②圈和③圈的比较说明自交子代的杂合度相比亲本大大降低。通过④圈和⑤圈比较说明重复序列含量高的区域,测序深度也很高,进而证明重复序列区域的组装效果较好。
对扇贝基因组预测得到26,415个编码基因,其中91%能注释到各大数据库中。重复序列含量为39%,其中18.4%为串联重复序列。作者以雌雄同体的亲本基因组作为参考进行重测序分析,检测得到SNP和indel含量为1.04%,这比太平洋牡蛎略低(1.30%),但仍是人的7倍左右(0.14%)。相比于亲本,子代的多态性有所降低,作者猜测这可能促使组装成功的因素之一。
2、比较基因组学分析
通过482个高度保守的单拷贝基因进行进化分析。发现扇贝与太平洋牡蛎和珍珠牡蛎的祖先在约4.25百万年时发生分化。凭借扇贝在双壳纲和腹足纲之间的独特进化地位,作者评估得出在约5.04百万年时,双壳类与腹足类发生分化。扇贝也是双壳类中突变速率相当低的物种,说明扇贝具有低进化速率的特征。
将扇贝与太平洋牡蛎和珍珠牡蛎进行基因家族聚类分析,得到共有基因9,365个。同时发现,扇贝与太平洋牡蛎之间以及扇贝与珍珠牡蛎之间的共有基因数,均高于两牡蛎之间的共有基因数目,因此作者推测扇贝的进化速率更低,更多地保留了祖先基因组特征,这也说明了太平洋牡蛎的多态性更高。将24个近缘物种进行基因家族分析,得到756个双壳类特有基因以及567个发生扩张的基因家族。富集分析发现,这些扩张的基因家族具有离子通道和神经递质相关功能。作者接着将9个冠轮动物(其中扇贝P.yessoensis、太平洋牡蛎C.gigas和珍珠牡蛎P.fucata属于双壳类动物,其他6个为非双壳类动物)与三组分别代表蜕皮动物、后口动物和非双侧对称动物(冠轮动物和蜕皮动物组成原口动物,原口动物和后口动物属于双侧对称动物)的物种进行基因家族聚类分析,发现3个双壳类动物与这三组的共有基因数比其他非双壳类冠轮动物多。相比于“活化石”——腕足动物海豆芽(非双壳类冠轮动物),扇贝与三组非冠轮动物的共有基因数更多,由此说明:扇贝,真的很保守。作者还通过家族聚类检测到扇贝特有基因830个,以及349个扩张家族,这些家族与多种多样的生物过程相关,作者因此推测它们也可能与扇贝独特的适应性相关。
之前发表过许多冠轮动物的共线性分析,但都受限于scaffold水平的基因组而不能展现出染色体水平的进化关系。因此作者利用已发表的高密度遗传图谱,将扇贝及太平洋牡蛎和珍珠牡蛎基因组均挂载到染色体上,用于后续染色体水平的共线性分析。分析表明,扇贝的19条染色体与推测的17个祖先基因组连锁群具有高度共线性,并且扇贝的染色体保留率更高,作者因此推测扇贝与双侧对称动物祖先的核型高度相似。作者又将11个双侧对称动物的基因组进行比较分析(均为scaffold水平),发现保守性最高的依旧是扇贝。
3、Hox基因簇及分段共线性表达模式
ANTP类中的同源异型盒(homobox)基因是存在于所有动物发育过程中的关键调控子,来源于由ANTP前体基因的串联重复序列组成的Mega基因簇。在文昌鱼(后口动物)和环节动物(蜕皮动物)中,ANTP基因存在于4条不同染色体上,由此产生了Mega基因簇假说(Mega-cluster hypothesis):Mega基因簇是随着后口动物和原口动物的共同祖先(双侧对称动物)的分化而分散在了4条染色体上。作者在扇贝的4条染色体上也发现了与ANTP基因的相似分布,进一步证明了上述假说。另外,该假说还证明了Hox基因和NK-linked基因——Dlx的共存关系,进一步为NK-linked基因和Hox-linked基因在祖先基因组中的紧密联系提供了关键证据。
看到这里,小编觉得有必要给大家介绍一下hox家族成员,帮助大家理清关系。
homobox基因家族包括ANTP, PRD, LIM, POU, HNF,SINE, TALE, CUT, PROS, ZF, CERS。ANTP类由能产生ANTP前体(Proto-ANTP)的串联重复序列组成,而这一系列ANTP前体被称为Mega基因簇,因此Mega基因簇可用于指代ANTP类中的串联重复序列。Mega基因簇中又包括superHox基因簇(包括真正的Hox基因和Hox-linked基因:EuHox和HoxL)和superNK基因簇(同理superHox基因簇)。Dlx基因事实上属于Hox基因簇,但序列却与NK基因更相似,因此有时也被认为是NK-linked基因。由此说明Hox基因簇和NK基因簇在祖先基因组中关系很密切。更详细的Hox基因说明请参考文章:Evolution of Homeobox Gene Clusters in Animals: The Giga-Cluster and Primary vs. Secondary Clustering。更形象的关系说明请见下图。
作者发现,扇贝中ParaHox基因簇和Hox基因簇(两者都属于ANTP类)都很保守、完整,由此推测出冠轮动物祖先基因组中ParaHox基因簇和Hox基因簇的存在状态。
作者还发现,在扇贝中ParaHox基因簇的表达呈现完全时空共线性,但Hox基因簇却呈现分段共线性(STC,subcluster-level temporal co-linearity):4个领头基因(leading genes)Hox1、Hox4、Lox5和Post2在原肠胚期同时开始表达,并且他们的表达分别呈现出完全时空共线性,但其他基因在同一时期无表达。另外,这4个基因在整个前后轴都有表达,暗示它们在早期躯体模式中的重要作用。
作者还在其他双侧对称动物中检测STC,发现牡蛎的Hox基因表达模式与扇贝很像,但却没有发现明显的STC机制。作者推测是否具有STC机制,与是否拥有完整的Hox子类而非大类相关(牡蛎的Hox基因比扇贝少)。同时,作者发现了在无腔动物只有3个在原肠胚期之后同时表达的Hox基因,并且在近缘的双侧对称动物中检测到了相似或者局部的STC机制,由此作者推测STC是一种古老、独特的躯体模式决定机制。有趣的是,作者在环节动物C.teleta中发现了一种S-WTC机制,可能是介于STC和WTC之间的一种中间态。随着STC机制日趋复杂,STC在躯体模式的进化中可能起重要作用。
Ps:
无腔动物只有3个Hox基因,并且这3个基因很可能是非常保守的祖先基因,但此时还没有STC机制;之后出现的生物中,Hox基因发生了复制,也出现了STC机制,因此作者推测STC机制的建立是伴随着Hox基因的复制产生的(而不是祖先基因组中就已经存在了)。分段共线性:各个子集内部的基因表达水平呈线性上升,不受其他子集表达水平影响;完全时空共线性:整体呈线性上升,子集之间的表达水平相关;中间态S-WTC:各个子集内部表达水平一致,但整体来看呈上升趋势。
4、光传导系统和眼睛调控网络
扇贝没有特化的头部,其眼睛分布在外套膜上,属于非头部眼。它的眼睛中有双层的视网膜结构,分别由脊椎动物型的睫纤毛感光细胞和无脊椎动物型的微绒毛感光细胞组成的。作者在扇贝基因组上检测到了10个视蛋白基因,包括4个r-opsin、1个r-opsin like、 2个c-opsin、2个Go-opsin和1个peropsin。其中,参与到两套光传导系统中的基因在扇贝眼睛中的表达量高于外套膜中的表达量。在扇贝的眼睛中,r-opsin的表达量最高。但是c-opsin过去一直被认为是脊椎动物特有的视蛋白,此次却在扇贝眼睛中检测到了表达量。作者还发现扇贝眼睛具有多套光传导系统共存的现象,这为研究如何使多套光传导系统在单个视觉系统中共存和协调提供了独一无二的模型,也为研究无脊椎动物和脊椎动物眼睛的进化提供了思路。
作者还检测到了825个在眼睛中显著上调的基因,差异基因的富集分析发现扇贝眼睛中富集G蛋白偶联受体信号通路。pax6及其下游作用的six 1/2、six3/6、 eya和dach基因在眼睛中不表达或下调表达,暗示扇贝眼睛的发育是pax6非依赖的模式。为了研究扇贝眼睛的基因调控网络,作者利用26个成年转录本数据集构建基因共表达网络,找到了共表达网络中的重要转录因子:Pax2/5/8,Brn3,Lmx1b,说明它们才是扇贝眼睛中调控发育和功能的关键因素。对沙蚕的腹部感光细胞和文昌鱼的Hesse体的研究表明,眼睛发生由pax2/5/8基因而非pax6基因主导,对目前国际主流的眼睛单源起源假说(pax6控制)提出了挑战,为动物体侧眼独立于头眼起源进化的新假说提供关键证据。
研究意义
作者通过对扇贝基因组深度解析,揭示扇贝呈现众多原始动物祖先基因组特征。新成果除对动物起源和进化研究提供参考,对于扇贝品质的改良、快速成长也将有所裨益。
参考文献
Ferrier D E K. Evolution of Homeobox Gene Clusters in Animals: The Giga-Cluster and Primary vs. Secondary Clustering[J]. 2016, 4.
Wang S, Zhang J, Jiao W, et al.Scallop genome provides insights into evolution of bilaterian karyotype and development[J]. Nature, 2017, 4.
欢迎关注生信人