Cell重磅|详细解读最全的植物泛蛋白质图谱
生信干货
张积极 ·2020年10月23日 02:30

继基因组学时代和转录组学时代的到来之后,蛋白组学也逐渐变得炙手可热,人类与动物的基因组学发展的很快,植物的蛋白组学紧随其后,今天小编为大家带来一篇于2020.4.16发表于国际著名学术期刊Cell的关于植物泛蛋白组的文献——《A Pan-plant Protein Complex Map Reveals Deep Conservation and Novel Assemblies》
植物是全球生态和经济系统的基础,但大多数植物蛋白仍然没有特征。蛋白质相互作用网络常常暗示着蛋白质的功能,并为基因和蛋白质的特性开辟新的途径。本文系统地确定了13种具有科学和农业重要性的植物的蛋白复合物,大大扩展了已知的稳定蛋白复合物在植物中的库。通过使用协同分馏质谱,我们收集了已知的复合物,确认了预测在植物中会出现的复合物,并确定了保存了11亿年的绿色植物进化过程中先前未知的相互作用。一些新的复合物参与纯化和病原体防御,这些特性对农业至关重要。本文所得到的图谱提供了一个跨物种的观点,保守的,稳定的蛋白质组件共享的植物细胞,并提供了一个机制,生化框架解释植物遗传学和突变表型。13种不同进化程度的植物:(如图1A所示)拟南芥、甘蓝、大豆、大麻、番茄、藜麦、玉米、水稻、小麦、椰子、蕨类(卷柏)、衣藻这里面提到了一个概念OGs(orthogroups)即表示现代生物中的一组基因,它们来自于这些生物最后共同祖先的相同原始基因,也可以简单的理解为直系同源基因群。通过35种生化分级手段,得到了2111个生化分级等级,鉴定到了可以归属到23896个OGs的14520970个蛋白质肽段。2.高倍性物种的蛋白质组学通过将蛋白质分配到OGs而增强。从图3A中可以看出在二倍体物种中,每个OGs的蛋白质数量峰是在1上的,四倍体在2上,六倍体在3上,这说明OGs这种汇总方法在研究不同倍性的植物上是非常适用的,图2BC也显示使用OGs要比使用单个蛋白质去做分析更有优势。图2EF表示结合转录组数据表示,观察到的蛋白质有更高的转录丰度,基本上是成正比的,不过也有意外,比如在细胞中蛋白质丰度非常高的RuBisCo蛋白。3.根据机器学习与共洗脱程度系统鉴定蛋白质之间的互作。本文中利用一个监督的机器学习方法来为蛋白质共洗脱程度进行打分—CF-MS分数(我们简称分数),分数从0到1,表示了两个蛋白之间互作的强烈程度。图4AB是该机器学习在测试数据集中的表现,我们可以看到其精准率还是很高的,图3C是在玉米中进行了验证,结果可以看出高分的蛋白质之间在玉米中也富集于互作的蛋白质。接着作者又利用亲和纯化试验和酵母双杂试验进行验证,结果也表明了很强的相关性(图3DE)。接下来作者又进行了非活性蛋白的化学交联验证试验,结果如图5所示,也表明了很强的相关性。最后作者给出了本文中鉴定到的所有的蛋白质互作的总览图(图6),其中绿色表示已经知道的蛋白质,黄色表示在本文中首次提到的蛋白质,粗圈表示尚未鉴定到的蛋白质。动物中存在多蛋白复合物,植物中存在类似的替代组成的蛋白质,如图7中所示的MSC蛋白质以及NDH复合物。不过尽管存在着多种替代装配物,其互作程度始终存在着强弱梯度。所有研究的最终落脚点都是为了与表型相联系,用于指导实际生产应用。本文作者鉴定到了CHIB蛋白与OSM34蛋白互作抵御真菌侵染、PIP蛋白与NUDT3蛋白互作对抗细菌感染。除此之外,还鉴定到了与角果发育、育性以及角果数目相关的蛋白质,并做了突变试验进行验证(如图8)本文用质谱蛋白质组学技术确定植物间共享的主要蛋白复合物,构建了植物细胞基本生化“接线图”的参考图。深度的蛋白质组学数据采集了来自多个组织和不同物种的超过200万个蛋白质丰度测量数据,揭示了在超过10亿年的植物进化过程中保存下来的稳定、丰富的蛋白质复合物。所得到的图谱提供了植物蛋白质组织的全面图谱。本文所提供的数据库网址:http://plants.proteincomplexes.org