IF:4.8|代谢相关的mRNA-lncRNA双预后模型
生信干货
小仙女 ·2020年11月18日 01:50
小编最近发现一个现象去年的时候很多文章做的的是免疫mRNA或者免疫lncRNA signature ,最近看到很多自噬相关lncRNA文章雨后春笋一般涌现,发的杂志影响因子还不低,明年的文章又是什么方向呢? 也许跟今天分享:代谢相关mRNA-lncRNA双预后模型相似文章也不一定哦。今天跟大家分享的是最近发表在Journal of cellular and molecular medicine( IF:4.486 )的一篇文章。生信人提供新颖、正规、可复现的
代谢双预后分析服务
感兴趣扫码手慢则无!


RNA序列和微阵列数据的组合分析揭示了有效的基于代谢的神经母细胞瘤预后标志
首先让我们通过摘要了解下这篇文章的主要内容,这篇文章主要研究的是代谢重编程与神经母细胞瘤之间的关系。数据包括三个数据集,一个RNA序列数据集被用作发现队列,而两个微阵列数据集被用作验证队列。识别出4s期和4 期NBs中差异表达的代谢基因。通过LASSO回归分析选择了12个代谢基因,并将其整合到预后标记中。这些基因标志将NB患者分为两个风险组,并且在预测NB患者的生存方面表现良好。作者还识别了九种与代谢有关的长非编码RNA(lncRNA),并将其整合到与代谢有关的lncRNA标记中并且在预测NB患者的生存中也表现良好。最后通过GSEA分析识别出高低危两组富集的生物学通路。这些结果表明代谢重编程与NB的进展有关,并且靶向某些代谢通路可能是NB的有前途的疗法。从GDC Data Portal中下载了RNA序列数据集(n=153),用作发现队列,称为队列1。从GEO中获得微阵列数据集GSE49710(n = 498)。从ArrayExpress数据库获得微阵列数据集E-MTAB-8248(n = 223)。这两个为验证队列,分别称为队列2和队列3。使用平台GPL16876信息注释了微阵列探针ID,并根据探针ID对应的GenBank登录号对它们进行重新注释。在cBioPortal上分析了已识别基因的基因组改变。从MSigDB数据库中获得KEGG基因集,提取了与代谢相关的KEGG基因集中的所有基因,共识别出910个基因参与代谢通路。然后使用“limma”包识别了差异表达基因。应用pearson相关性识别出与代谢基因相关的lncRNA,认为是代谢相关的lncRNA。首先进行单变量Cox比例风险回归分析识别出队列1中与OS相关的基因。将这些基因放入LASSO中消除因过渡拟合导致的假阳性。最后,通过加权Cox回归系数来计算每个患者的风险评分来构建预后代谢基因标志。以中值为临界值将患者分为低风险和高风险组。验证队列中也应用相同的公式和相同的临界值。同理,通过相同的方法构建了代谢相关的lncRNA标志。应用GSEA软件对低风险和高风险组进行了基因集富集分析。应用R包“ GSVA”进行单样本基因集富集分析(ssGSEA),以评估肿瘤样本的免疫状态。应用R包“ESTIMATE”来估计浸润到肿瘤组织中的基质细胞和免疫细胞。
作者首先识别了神经母细胞瘤4期和4s期的差异表达基因,在队列1中,发现这两组中共有65个代谢基因差异表达。在4 期NB中有36个代谢基因上调,而在4s 期NB中有29个代谢基因上调(图2)。单变量生存分析显示,队列1中有36个代谢基因与OS显著相关。作者根据这36个基因进行无监督层次聚类,发现这些基因将三个队列中的每一个分为两个不同的聚类:一个聚类具有良好的生存结果,而另一个聚类则具有较差的生存结果。
图2. 识别在4s和4期神经母细胞瘤之间差异表达的生存相关代谢基因通过LASSO回归分析选择了12个代谢基因,并将其整合到预后基因标志中。根据基因标志构建了风险评分公式。根据风险得分的中位数,将队列1分为两个风险组(图3)。ROC曲线分析表明代谢基因标志在预测OS中性能很好。单变量生存分析显示代谢基因标记与队列1中的OS显著相关。在队列1中,多COX模型显示只有代谢基因标记和倍性状态与OS独立关联。使用相同的风险评分公式和相同的临界值,在队列2和队列3中测试了代谢基因标志进行验证。发现在队列2中,高危组的患者的OS显著低于低危组并且代谢基因标志在预测OS方面有很好的性能。队列2的列线图也表明了预测精度很高。
根据MYCN扩增状态,COG危险状态,年龄状态,组织学亚型,分化状态,MKI状态,病理亚型,倍性状态和INSS阶段,进行了亚组的Kaplan-Meier生存分析(图4)。
图4. 基于不同临床风险因素的代谢基因标志的亚组Kaplan-Meier图将36个与生存相关的代谢基因进行GO和KEGG功能注释(图5)。对队列2进行GSEA分析来比较低风险组和高风险组。结果显示高风险组显著富集在14个代谢相关的KEGG通路中。由于新陈代谢也与免疫系统有关,因此作者还研究了高危组和低危组是否具有不同的免疫活性状态。结果显示低风险组的免疫评分和基质评分显著高于高风险组,这表明低风险组的免疫活性较高。相反,高风险组的肿瘤纯度水平显著高于低风险组,表明高风险组的免疫细胞浸润水平相对较低。
图5. 神经母细胞瘤代谢基因标志的功能注释及GSEA分析将那些表达与代谢基因标记中的12个代谢基因的表达相关的lncRNA提取为与代谢相关的lncRNA。单变量Cox生存分析显示有47种与代谢相关的lncRNA与OS显著相关。最后,通过LASSO回归分析选择了9个与生存相关的lncRNA,并将其纳入与代谢相关的lncRNA标记中。这些lncRNA与代谢基因之间的关系如图6所示。
图6. 代谢基因和与代谢相关的lncRNA的相关矩阵和网络与构建代谢基因标志和验证的部分一致,结果如图7所示。
在cBioPortal平台中,总共有755个带有突变数据的NB病例和59个带有基因拷贝数数据的NB病例。其中各个代谢基因和代谢相关lncRNA的突变情况如图8所示。
图8. 神经母细胞瘤中代谢基因和lncRNA的遗传改变好啦~这篇文章的内容就这么多啦,总之,作者识别了NB样本4期和4s期(找准切入点很重要)之间的差异表达基因。代谢基因标志和代谢相关的lncRNA(定位好方向)在预测NB患者OS方面有良好的表现。因此,代谢特征有可能用于NB的危险分层。针对某些代谢途径也可能是治疗NB的一种有前途的治疗方法。今天的分享内容是真的丰富,切入点也是肿瘤细微的一个方向(慢慢的也会成为趋势),不失为一个很好的思路。生信人提供新颖、正规、可复现的
代谢双预后分析服务
感兴趣可扫码
