Cancers|肿瘤RBP预后分析方案
生信干货
zary ·2020年6月1日 02:50
神经胶质瘤,又称为胶质瘤或者胶质细胞瘤,是一种起源于神经上皮的颅内恶性肿瘤,根据恶性程度分为I-IV级,第IV级就是我们常说的胶质母细胞瘤(GBM)。研究表明,某些RNA结合蛋白(RBPs)的表达水平与胶质瘤的恶性程度密切相关。RBPs通过结合靶RNAs,在转录后水平调节基因表达。RBPs参与RNA剪接、多聚腺苷化作用、序列编辑、RNA转运、维持RNA的稳定和降解、细胞内定位和翻译控制等。小编今天带大家看的这篇文章是四月份发表在cancers杂志(IF=6.16)上的,作者利用加权共表达网络分析(WGCNA)构建了RBPs表达与GBM患者临床特征之间的关联。
Integrated Analysis of RNA-Binding Proteins in Glioma研究中使用的人类RBPs整理自以下6个数据库:Gerstberger, SONAR, the Gene Ontology project, Poly(A)-binding protein, CARIC和XRNAX;下载的数据集有TCGA数据库中699名患者的转录组数据,以及CGGA中包含325个样本的RNA-seq数据(ID是mRNAseq_325);在生存分析时,用到了138名GBM患者的临床信息,其中54名为复发性和继发性;此外,CGGA中205个新样本的生存和临床数据被用来验证研究结果。作者根据RBPs的结构域是否得到证实将它们分为标准(canonical)RBPs和非标准(non-canonical)RBPs两组,结构域信息来源是Pfam数据库;用DAVID做了GO和KEGG的富集分析以及可视化等分析。作者从TCGA获得了包含3564个RBPs的表达谱,然后用R包WGCNA构建了一个共表达网络。首先,基于RBPs表达谱,将胶质瘤样本按照不同的临床特征进行层次聚类;然后,根据RBPs间的皮尔森相关系数筛选软阈值β,来确保网络的无标度性,这里β为6;根据TOM这一相似性量度,研究通过AL层次聚类法(组间距离等于两组对象之间的平均距离)将表达相似的RBPs聚到了同一模块。接下来,文中定义了两个参数MEs和GS, MEs代表第一个主成分相关的模块,它的值代表模块中的所有基因,GS表示基因和临床性状之间的相关性,用于量化单个基因与感兴趣的性状的关联关系。单因素COX回归分析用来评估RBPs的预后价值,并筛选出与生存时间相关的RBPs作为基因特征对TCGA和CGGA数据集进行风险分类。然后,通过多元Cox比例风险回归分析构建了风险特征,计算了每个患者的风险评分,最后根据中值将患者分成高低风险组。该研究从ATCC购买了人类GBM细胞系LN229和U251,然后培养、切片、转染等。此外,作者还做了siRNA转染、细胞增殖、qPCR和Western Blot分析,以及RNA免疫沉淀和高通量测序。作者评估了大约3564个RBPs的表达水平。归一化后,用和作为单个患者中RBPs和TFs的表达丰度。DEGs使用R包DEseq2筛选的,绘制箱式图和对表达差异的统计分析用了R包ggplot2、ggpubr和ggsignif。单变量和多变量Cox比例风险回归分析用的都是survival包。生存曲线采用的是Kaplan-Meier法。RNA结合蛋白(RBPs)在转录后水平调节基因表达,转录因子(TFs)则在转录水平进行调控。作者对比了二者在几个数据集的丰度,发现RBPs显著高于TFs(图1.C-D)。在3564个RBPs中,差异表达的约43.13%,在1725个TFs中,差异表达的有34.02%,这些数据表明RBPs可能在胶质瘤中起着更重要的作用。
文中根据WHO的分类标准,将TCGA的胶质瘤患者分成了14类,CGGA患者分成了12类(图2.A-B),然后通过分析RBPs的mRNA表达水平,发现RBPs的丰度随疾病程度的加深而增加。作者又基于患者的RNA测序数据分析了RBPs的表达水平,结果表明具有IDH(这个基因在胶质瘤中突变频率很高)突变的患者,其RBPs表达水平低于野生型。接下来,他们比较了TCGA和CGGA数据集中不同分子亚型的RBPs表达水平,与图2.C中其他三种亚型相比,RBPs在neural亚型中的表达显著下调,并且与疾病等级无关。
图3.A和B分别列出了部分候选的标准和非标准RBDs(RNA结合结构域),在3564个胶质瘤相关的RBPs中,只有965个包含标准RBDs。GO富集结果显示,标准RBPs富集到了转录、翻译、RNA剪接和加工以及线粒体翻译相关的生物过程;而非标准RBPs的富集除了跟标准RBPs有部分重叠外,还在蛋白质修饰、稳定、定位和代谢等生物学过程有富集,KEGG的富集结果与之基本一致。
作者使用R包WGCNA 将TCGA中包含3564个RBPs的表达数据转换成了基因共表达网络。首先,从TCGA胶质母细胞瘤数据集中选择了160例不同年龄、性别和总生存率的患者进行RBPs表达聚类(图4.A);然后,参数β=6,通过一步邻居网络构建方法获得了10个共表达模块(图4.B);接下来,对不同的共表达模块跟样本性状做了相关性分析,如图4.C所示,黑色模块与年龄显著相关,绿色模块则跟患者的总生存期关联最密切,因此,研究进一步分析了绿色模块和胶质瘤患者预后的关系。
作者通过Cox回归分析,在绿色模块中识别了8个预后相关的RBPs(图5.A),它们的风险比(HR)都大于1。然后,文章使用多元Cox比例风险回归模型将这8个RBPs构成了一个基因特征,根据中值风险评分,TCGA和CGGA中的患者都被均分到了高、低两个风险组。生存分析的结果也表明,风险得分高的患者生存时间短(图5.D)。这个基因特征的ROC曲线也展现了它们较好的预测生存期的性能。最后,作者还发现这些 RBPs的mRNA表达水平在高风险组有所增加(图5.F,G),由此认为它们的高表达会影响GBM预后。
在上文提到的8个预后相关RBPs中,有3个是非标准的,5个标准的。作者设计siRNAs降低了它们在胶质瘤细胞中的表达,来查看它们的生物学功能。在细胞系LN229中,敲除PTRF或FNDC3B这两个非标准RBPs,会显著抑制细胞增殖, LRRFIP1,ZC3H12A和HSP90B1这三个RBPs的沉默同样会抑制增殖(图6.B)。此外,作者注意到PTRF参与了GBM增殖的维持,在另一个胶质瘤细胞系U251中敲除PTRF后,细胞增殖也受到了抑制,敲除FNDC3B得到了同样的结果。
基于以上的分析结果,作者在LN229细胞中对PTRF这一非标准RBP做了RIP实验,RIP就是RNA结合蛋白免疫沉淀,是研究细胞内RNA与蛋白结合情况的技术。然后通过高通量测序,识别了PTRF特异性靶基因,并获得了胶质瘤生物学相关的靶RNAs,大多数靶RNAs参与了胶质瘤的增殖(图7B)。对PTRF靶基因的GO富集发现它们显著富集到了转录、蛋白质泛素化和凋亡等过程,以及细胞衰老和细胞代谢等通路(图7C,D)。
好了,今天的文章小编就为您解读到这了,have a nice day!