藜麦基因组
一、写在前面
今天小编跟大家分享一下近期发在nature上的藜麦基因组文章。
2016年一个日本研究组已经在DNA research上发表了第一篇藜麦全基因组测序及组装的文章,其利用的测序方法是Illumina Hiseq 2500结合PacBio RS II。最终组装得到近25,000个scaffold,N50达到86K。文章主要完成基因组结构研究,同科物种基因组的基因家族分析,抗非生物胁迫信号通路的基因进化分析等。这篇文章存在的问题首先是基因组组装结果不能够满足类似基因组结构变异这样的分析;其次,进化部分的分析过于简单,不能够满足科学界对四倍体基因组进化的好奇。所以,上述问题为这篇基因组文章提供了机遇,虽然发表时间晚,但是能够发表在顶级期刊nature上。
二、摘要
藜麦(Chenopodium quinoa)是异源四倍体,这篇文章利用单分子测序+光学图谱+遗传图的方法完成全基因组测序及基因组组装。文章另外利用二代测序方法测序组装两个祖先二倍体,分别为A基因组的C. pallidicaule和B基因组的C. suecicum。文章还对藜麦的22个异源四倍体完成重测序。本篇文章确定了藜麦的进化地位及找到了控制种子中合成anti-nutritional 三萜类(triterpenoid)saponins的重要的转录因子。
三、简介
藜麦营养价值丰富,且其生长适应广阔的生态系统。它被驯化的历史长达7,000年之久,在哥伦布登陆美洲大陆前即被印加王朝进行驯化,并被认为是印加王朝的“mother grain”。藜麦已经适应了安第斯山脉阿尔蒂普拉诺高原(Andean Altiplano)高海拔(高于海平面3,500米)的环境,具备抵抗多种非生物胁迫的能力。藜麦因为其种子不含谷蛋白,营养丰富而受到国际关注。2013年被定为藜麦年(Year of Quinoa).
四、测序和组装
藜麦种子含有三萜皂苷类(triterpene glycosides)混合物,称为saponins。虽然saponins对植物生长有益(防御食草动物),但是在人食用前需要去除,不去除会导致溶血和产生苦味。在生产实践中,去除saponins的花费很高,且会造成很多种子中的营养物质的流失,所以saponin-free一直是藜麦育种的主题。saponins在藜麦开花后20-24天的种皮中积累,最终占到成熟种子质量的4%。Saponins种类众多,研究者在本次全基因组测序藜麦品种中发现43种,而之前的研究发现大约存在100种。
甜藜麦含有的saponins含量很低。为了找到控制这个性状的基因,文章利用linkage mapping和BSA的方法,结合两个segregating population:Kurmi(甜藜麦)X 0654(苦藜麦),Atlas(甜藜麦)X Carina Red(苦藜麦)定位基因。F1的表型显示苦藜麦性状为单基因控制且呈现显性。另外发现saponins的存在与种皮厚度的差别相关,苦品种的藜麦种皮比甜品种的明显厚。
linkage mapping和BSA将性状定位在CqB16染色体的scaffold 3489上的一个700 kb window。在这700 kb区域内,共有54个功能注释的基因,其中两个基因AUR62017204和AUR62017206与苜蓿中的基因TSAR1和TSAR2存在同源性。TSAR1和TSAR2在一篇苜蓿的文献中被证明在saponins合成通路起作用,且文献中提到这两个基因可以结合一段特异的DNA motif:5’-CACGHG-3’。在藜麦中,文章发现AUR62017204(TSARL1)只在种子中表达,且在甜藜麦品种中表达量低;藜麦的saponin合成通路的基因start codon上游2 kb序列存在TSAR结合的那段DNA motif;saponin合成通路的基因在甜藜麦中低表达。以上暗示TSARL1很可能是TSAR的直系同源,从而在控制saponins合成过程中起转录调控作用。
TSARL1转录本在Kurmi和0654的后代植株中存在可变剪切。TSARL1转录本第三个外显子最后一个碱基存在一个SNP(G2078C),该SNP与Kurmi和0654的杂交后代saponins的含量性状共分离。G2078C会改变intron/exon剪切边界,有可能使剪切发生在第三个外显子上游的一个位置(Fig. 4e)。这样的可变剪切会使TSARL1产生提前终止,生成的多肽不能形成homodimer,且不具备结合DNA的能力,也就丧失了调控转录的作用。所有Kurmi和0654的后代中的苦藜麦在上述SNP位点的基因型都为G,而几乎所有的甜藜麦都具有G2078C这个基因型,除了Pasankalla这个品种。Atlas品种的个体重测序发现Atlas品种有些个体存在G2078C基因型,有些携带外显子的插入序列。这样的插入序列很可能导致基因功能的丧失,从而使植株具有甜种子表型。两种不同的TSARL1突变形式与甜的性状的相关性暗示TSARL1基因调节了saponins在藜麦种子中的合成。另外,TSARL1也调控固醇类的合成,但是苦和甜藜麦表型上不能发现明显的相关区别。这也许是因为固醇类合成需要的前体物质是由质体中的MEP通路提供的。当然,这些需要相关的功能实验进行验证。
十、藜麦的育种方向
藜麦的育种需要如下性状:更矮小的植株,植株少一些分支,更紧凑的种穗(seed head),抗高温和生物胁迫能力,甜种子的表型。本篇文章对控制藜麦苦种子性状基因的发现不仅从科学角度提供了saponins合成的机理,更为分子标记育种提供了素材。藜麦成为研究四倍体基因组进化的模式植物,同时也为研究植物抗盐胁迫提供基因组素材。
十一、参考文献
Yasui Y, et al. Draft genome sequence of an inbred line of Chenopodium quinoa, an allotetraploid crop with great environmental adaptability and outstanding nutritional properties. DNA Res 2016, 23(6): 535-546
Jarvis E. D., et al. The genome of Chenopodiium quinoa. Nature 2017, published online 08 Feb. 2017
欢迎关注生信人