最近天气渐冷,人越发懒惰,脑子也转的不那么灵活,今天小编的自噬相关预后第三弹分享给大家。是一篇基础但经典的生物信息文章,换成任意一种基因,任意一种癌型都适用哦。这篇文章的主要内容是基于16个自噬相关基因的表达数据对多发性骨髓瘤进行生存风险打分,根据风险分数将其分为高低风险组。这篇文章是发表在ONCOLOGY LETTERS的,影响因子不是特别高,但是不要看不起这种小文章哦,小文章是基础,基础牢固,才能万丈高楼平地起。A predicted risk score based on the expression of 16 autophagy-related genes for multiple myeloma survival
基于16个自噬相关基因表达的多发性骨髓瘤生存的预测风险评分自噬在浆细胞发育和多发性骨髓瘤(MM)的发病机制中起重要作用。然而,自噬相关基因(ARGs)在MM中的预后作用仍未阐明。这篇研究从Gene expression Omnibus数据库(GSE24080)中获得559个MM患者的234个ARGs的表达数据。基于单因素Cox回归分析识别出55个 ARGs与MM患者生存显著相关的基因。然后,基于多变量Cox回归分析构建16个ARGs的生存风险评分模型,本模型由ATIC BNIP3L, CALCOCO2, DNAJB1, DNAJB9, EIF4EBP1, EVA1A, FKBP1B, FOXO1, FOXO3, GABARAP, HIF1A, NCKAP1 PRKAR1A和SUPT20H等基因构成。基于这一预后特征,MM患者可以被分为高风险组和低风险组,分别对3年、5年和10年的预后进行预测,其ROC曲线下面积分别为0.740、0.741和0.712。另外,通过四个独立的数据集(GSE57317、GSE4581、GSE4452和GSE4204) 可以对本风险评分的预后作用进行验证。总之,ARGs在MM的进展中起重要作用,基于ARGs的预后模型可能为MM的临床应用提供新的思路。这篇文章所需5套数据均来自于GEO数据库,1套训练数据(GSE24080),4套验证数据(GSE57317、GSE4581、GSE4452和GSE4204)。首先对5套数据的表达信息进行注释,根据注释平台信息将其探针匹配到基因ID上,对于多个探针匹配到同一ID的情况,取其探针平均值作为基因表达值。另外,从第一个人类自噬专用数据库中检索人类自噬相关基因,共检索到234个自噬相关基因。基于单因素cox回归分析,识别与预后相关的自噬相关基因。234个自噬相关基因中, 55个与MM的预后显著相关(表1)。图1显示了与存活率显著最相关的20个ARGs。


图1
接着,文章分析了这些预后ARGs与生物过程(BP)、细胞成分(CC)和分子功能(MF)类GO节点之间的相关性。富集的前三个BP项是自噬机制、自噬过程和对细胞外刺激的响应(图2A)。前三个CC项是以液泡膜、自噬体和晚期核内体最多(图2B) 前三个MF项是泛素相关功能,如蛋白连接酶结合、泛素蛋白连接酶结合和蛋白异二聚活性(图2C)。KEEG富集主要富集到了自噬相关通路,包括动物自噬、线粒体自噬和PI3K - Akt信号通路(图2D;表II). PPI网络表明这些基因之间存在重要的相互作用。GAPDH、MAPK1、BCL2L1、ATG5和PARP1位于PPI网络的中心,说明这些基因与其他基因的联系更为广泛(图3)。



图3
对单因素识别出的预后相关自噬基因进行多因素Cox回归分析,构建出16个ARGs的生存风险评分模型,模型打分如下:Risk score=ATIC x 0.3374 + BNIP3Lx (0.2126) + CALCOCO2 x (0.2682) + DNAJB1 x (0.3848)+ DNAJB9 x (0.3443) + EIF4EBP1 x 0.1397 + EVA1A x 0.1794 + FKBP1B x (0.1205) + FOXO1 x (0.3114) + FOXO3 x (0.2853) + GABARAP x (0.3557) + HIF1A x 0.0876 + NCKAP1 x (0.1487) + PRKAR1A x 0.7314 + SUPT20H x (0.3261) +利用这个预后特征模型,分别计算每个样本的风险得分,基于风险得分将MM患者分为高风险组和低风险组,其预后各不相同(图4)。3年、5年和10年的AUC值分别为0.740、0.741和0.712(图5)。

图5
GSEA分析结果显示,5个hallmarks与高危患者显著相关,包括‘G2M_CHECKPOINT’,‘MITOTIC_ SPINDLE’, ‘E2F_TARGETS’, ‘MYC_TARGETS_V1’ 和‘MYC_TARGETS_V2’。图6展示了其中最相关的三个marker。高风险组与低风险组的G2M检查点基因表达的热图显示两类样本间表达差异很大 (图7)。
图6

通过四个独立的数据集(GSE57317、GSE4581、GSE4452和GSE4204) 对本风险评分的预后作用进行验证。从这些微阵列数据集中提取16个ARGs的表达数据,并根据上述公式计算预后特征分数。所有患者的HRs均为>1(图8)。
图8
好了,今天的文章差不多就是这些了,让我们来总结一下吧。基于单因素Cox回归分析识别出55个 ARGs与MM患者生存显著相关的基因。然后,基于多变量Cox回归分析构建16个ARGs的生存风险评分模型。并基于预后特征将MM患者分为高风险组和低风险组并通过四个独立的数据集进行验证。思路大概就是这样,但是这篇文章其实还是存在一些问题的,尤其是在验证模型方面,如果可以基于本模型将四套数据分别分成高低风险组,并且两组预后存在一定差异,验证效果会更好一点,模型也会更可靠一些。大家自己分析时千万不要忘了哦。今天的文献解读到这里就要结束了,最近天气越发寒冷,大家在努力搬砖的同时不要忘记防寒保暖,根据天气增减衣物哦!欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史
