2018年4月25日,Nature以article形式在线发表了由中国农业科学院作物科学研究所主导的,联合国际水稻研究所(IRRI)、上海交通大学、华大基因、深圳基因研究所、安徽农业大学和美国亚利桑那大学等16家单位共同完成的研究成果--“Genomic variation in 3,010 diverse accessions of Asian cultivated rice”。
2011年9月,全球3000份水稻核心种质资源基因组项目(3K Rice Project)正式启动,该项目由中国农业科学院的黎志康研究员主持,联合国际水稻研究所和华大基因共同参与的重大国际合作研究项目。然后本文为此项目发布成果,主要分析了3010种不同的亚洲栽培稻(Oryza sativa L.)的遗传变异,种群结构和多样性来。 我们的结果与之前的确认的五个主要群体是一致的,但也揭示了一些与地理位置相关的几个未报告的亚群。 我们确定了种群内和种群间29百万个单核苷酸多态性变异(Rice SNP-Seek Database),240万个小型indels和超过90,000个结构变异。 通过泛基因组分析(RPAN: Rice Pan-genome Browser),我们确定了超过10,000本新的全长蛋白质编码基因和大量存在得 PAV变异。 观察到复杂的基因渗入模式在驯化基因与多个独立的水稻驯化事件相一致。 大家可从3,000 Rice Genomes Project获得相关数据,此项研究将为水稻基因组学研究和育种提供重要的资源。
文章详细述:
1.基因组概述
估计基因组大小为375.1 ± 20.9 Mb,,重复序列含量为 35.6 ± 3.7% 。
2.群体结构与多样性分析
划分为9个亚群。XI3个亚组:东亚的籼稻(XI-1A),南亚的籼稻XI-2,东南亚的籼稻(XI-3)和现代籼稻品种;GJ3个亚组:东南亚的温带粳稻(GJ-tmp),热带粳稻(GJ-sbtrp),亚热带粳稻(GJ-trp);来自南亚的cA和cB。
3.结构变异
主要研究3,010 中的 453个样本,测序深度 > 20×,比对深度 > 15×,。鉴定到93,683 SVs, 包括 582 大于 500 kb的SVs, 每个基因组平均有 12,178 SVs 。 deletions, inversions 和duplications 平均长度分别为 5.3 ± 0.6 kb, 127.1 ± 19.4 kb和105.1 ± 22.7 kb; SVs在 XI–GJ 分化严重。
4.泛基因组与群体分化
使用“map-to-pan”策略构建了3010个亚洲栽培稻的泛基因组,获得了268M的长度>500 bp ,identity <90% 的 日本晴参考基因组序列之外的非冗余序列,预测了1.2万个新的全长基因和几千个新的不完整的基因。在主要研究的高组装质量的453个水稻泛基因组中,包含了12,770~14,826 个(53.5%~ 62.1%)核心(core)基因家族和9,050个(37.9%)分散式(distribute)基因家族。
5.独立起源
虽然基于SNP和SV的3K-RG群体结构分析与先前已知的五个主要群体一致,但是鉴定了XI和GJ群体中的另外亚群,并提示与地理来源相关的九个亚群。 发现大量的SNP,基因和基因家族以及SV在单个亚群中是独有的。 在大约1,000个被充分表征的基因中及其周围观察到不同水稻亚群的多样性减少模式。 仔细研究驯化基因的单体型模式表明,并非所有'驯化'等位基因都来自GJ的XI。 综合起来,我们的研究结果与印度和中国的9,000年以上的XI栽培考古证据相结合-支持多个独立的O. sativa家系。
6.重新命名。
1928年,日本加藤茂范将栽培稻种分为两个亚种japonica和indica,后来国际上补充完善为籼稻(Oryza sativa L. subsp. indica Kato)和粳稻(Oryza sativa L. subsp. japonica Kato),并一直沿用至今。
从拉丁文标注可以看出,两个亚种用印度和日本来命名,带有很深的殖民主义烙印,不能正确反映籼粳的亲缘关系、地理分布和起源演化过程。
中国是栽培稻种的最重要的原产地之一,我国水稻学界一直谋求改变加藤茂范分类方法,老一辈著名水稻专家丁颖把籼稻定名为籼亚种(Oryza sativa L. subsp. hsien Ting),粳稻定名为粳亚种(O. sativa L. subsp. keng Ting)。按照音译的原则,粳稻的拉丁后缀为keng Ting,即明确规定粳字发音是keng,通汉语音geng。该分类方法已被中国水稻学界广泛接受。“gěng”的读音,尽管只是一个简单读音的改变,却对籼粳的亲缘关系、地理分布和起源演化过程作出了更为科学的阐释。
张启发说,要完成水稻分类命名中去殖民化的努力,当前首当其冲最为迫切的工作便是要对粳字的汉语拼音进行正确标注。“粳(gěng)读音有丰厚的历史、文化和科学内涵。小小的读音问题关乎中华科学文化的国际地位。地不分南北,水稻人没有读"jīng"的。”
本文根据籼、粳亚种的独立多起源假说,并恢复为“籼”(Oryza sativa subsp. xian)、“粳”(Oryza sativa subsp. geng)亚种的正确命名。
本文中也罕见出现中文字体:
欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史