5+肿瘤坏死因子预后模型
生信干货
小仙女 ·2020年11月24日 01:48
大家好,长假过后第一天上班是不是巨艰难,别迟到咯!今天跟大家分享的是最近发表在EBioMedicine杂志上关于肿瘤坏死因子家族预后的一篇文章,影响因子5.736,普通的预后分析能发到5分以上肯定有值得借鉴的内容,小板凳搬好咯。
对基于TNF家族标志的肺腺癌的预后,免疫功能和免疫标志物进行全面的分子分析
对该思路感兴趣的小伙伴
客服小姐姐等你来撩哦!

首先让我们通过摘要了解一下这篇文章的主要内容,这篇文章的主角是肿瘤坏死因子(TNF)家族成员,它在增强抗肿瘤免疫反应中起着重要作用,但是TNF成员在肺腺癌(LUAD)中的表达模式和临床意义仍然未知。在这篇文章中作者探讨了LUAD中TNF家族成员的基因表达谱,并构建基于TNF家族的预后标志物。作者共收集了来自七个不同队列的1300例LUAD病例。其中TCGA队列样本用作训练集,应用5个GEO数据集的RNA数据和102个样本的qPCR数据进行验证。还探讨了signature的免疫特征和潜在的免疫治疗反应预测值。好啦,让我们一起来看一看作者具体都做了哪些研究以及得到哪些结果吧~作者从6个公共数据集中收集了1198例LUAD病例。其中包括从UCSC下载的TCGA中502份LUAD样本的RNA序列数据以及临床注释和总体生存信息用作训练集,还从UCSC收集了这502例LUAD患者的所有相应临床数据和突变数据。还包括5个GEO数据集作为验证集,这几个数据集包含相对大量的LUAD患者,并带有临床注释和总体生存信息。具体为GSE11969 :90例,GSE13213 :117例,GSE30219 :83例,GSE31210 :226例和GSE41271 :180例。这一部分主要是通过实验的方法来获取102个样本的qPCR数据,作者从医院收集了102例经冷冻手术切除的肺腺癌组织。应用试剂从样本中提取RNA,逆转录生成cDNA,制备所有cDNA样本用于qRT-PCR。在qRT-PCR分析中,检测到了基于TNF家族特征的5个基因。使用DAVID对来自TCGA的基于TNF家族的特征相关基因进行了GO和KEGG富集分析。应用CIBERSORT评估了不同组之间免疫细胞浸润的丰度。使用CIBERSORT和LM22计算了来自TCGA的LUAD患者的22种免疫细胞类型的分数,包括不同的T细胞类型,B细胞类型,浆细胞,自然杀伤(NK)细胞和不同的髓样亚型。通过肿瘤免疫图谱(TCIA)获得LUAD患者的突变负荷、新抗原数量、克隆新抗原数量和亚克隆新抗原数量。基于从cbioPortal检索到的TCGA数据集的反相蛋白质阵列(RPPA)分析PD-L1的蛋白表达。TIDE是可以预测免疫检查点封锁反应的计算框架,它整合了肿瘤免疫逃避的两个主要机制的表达:T细胞功能障碍和T细胞排斥,建立肿瘤免疫逃避模型。上传转录组图谱后,可从TIDE网站下载来自TCGA数据集的LUAD患者的TIDE评分,T细胞功能障碍评分和T细胞排斥评分。为了综合评估TNF家族标志物在不同人群中的预后意义,采用STATA软件进行预后meta分析。并使用随机效应模型计算合并HR值。在这里,作者首先应用单变量Cox比例风险回归分析评估TNF家族成员的基因表达值与LUAD患者OS之间的关系。然后,使用逐步Cox比例风险回归模型缩小变量来筛选与生存相关的基因中最有预测性的标记。根据这些选定的基因构建风险公式,它由基因表达水平的线性组合确定,并用逐步Cox比例风险回归模型中的相应回归系数加权。根据风险评分的高低,将患者分为高风险组和低风险组。应用Kaplan-Meier方法评估两组之间的OS得分,并使用对数秩检验计算两组之间的OS差异。采用Mann-Whitney U检验分析高、低风险组间的估计免疫细胞类型分数、TMB负荷、新抗原数量、克隆新抗原数量、亚克隆新抗原数量、PD-L1蛋白表达、TIDE评分、T细胞功能障碍评分和T细胞排斥评分的分布。2.1 LUAD患者TNF家族基因的分布及预后意义作者纳入了47个明确定义的TNF家族基因,包括18个TNFSF成员和29个TNFRSF成员。首先,作者使用502例TCGA LUAD患者的预后信息来探讨TNF家族的基因表达谱。作者应用单因素Cox比例风险回归分析评价TNF家族成员基因表达值与LUAD患者OS的关系。发现17个与OS显著相关的基因(表2),包括6个TNFSF成员和11个TNFRSF成员。其中有三个基因为“高风险”基因,14个基因为保护因子。表2. TCGA队列中TNF家族基因的单变量Cox分析2.2 TCGA队列中基于LUAD的TNF家族特征的构建在这一部分,作者首先滤出没有意义的基因,剩下17个基因需要进一步分析。然后,使用逐步Cox比例风险回归模型缩小变量,最终筛选出五个基因来构建模型:TNFRSF6B,TNFRSF13C,TNFRSF14,TNFRSF1A和EDA2R。建立了风险评分为risk score = 0.1633 x TNFRSF6B- 0.1153 x TNFRSF13C - 0.2234 x TNFRSF14 + 0.1992 x TNFRSF1A -0.1042 x EDA2R。作者绘制了这五个基因的表达和风险评分(图1)。根据最佳分界点,将患者分为高低风险两组,发现高风险组的OS显著较差。作者对LUAD患者的早期和晚期疾病患者进行分层分析,结果发现两组患者中都是高风险组与OS显著恶化相关。图1. 在TCGA数据集中构建基于TNF家族的signature这一步是验证部分,为了验证LUAD患者基于TNF家族的signature的准确性,作者首先使用相同公式在五个独立的GEO数据集中计算每位患者的风险值(图2)。根据最佳风险值分界点,将不同队列的患者也分为高风险和低风险组。结果显示,在这五个GEO数据集中,高风险组患者死亡风险增加。此外,基于这6个数据集进行预后meta分析(n=1198),结果证实TNF家族的特征是LUAD患者的危险因素。图2. 验证不同GEO数据集的LUAD中基于TNF家族的signature为了评估在临床实践中预测LUAD患者OS的五基因标志的稳健性,作者在一个独立队列中进一步验证了基于TNF家族的signature,包括102个LUAD冷冻组织样本的qPCR数据。用相同的公式,根据最佳临界点将患者分为两组(图3)。结果显示两组之间死亡率差异显著。接下来作者对LUAD患者的早期和晚期疾病患者进行分层分析,评估该标志的预后意义。结果证实,该标志可以将患者分为高危和低危组,OS结果明显不同。图3. 在基于102个冷冻组织的独立队列中验证基于TNF家族标志的预后性能2.4基于TNF家族的特征是LUAD患者的独立危险因素为了探讨TNF家族标志物的预后价值是否独立于其他临床病理因素,首先在TCGA数据集上进行了单变量和多变量Cox回归分析。结果发现LUAD患者的风险评分与OS独立相关(表3)。并且在102例具有qPCR数据的LUAD患者中,基于Cox回归分析后,基于TNF家族的特征也被确认为独立因素。表3. TCGA数据集中基于TNF家族的特征和生存率的单变量和多变量Cox回归分析这一部分主要是探索与TNF家族标志物相关的生物学通路(图4)。作者首先应用皮尔森相关性确定了与风险评分相关的基因,包括38个正相关基因和392个负相关基因。应用这些基因进行GO和KEGG分析,发现这些基因更多地参与了免疫应答的生物学过程以及其他免疫特异性过程。同时,KEGG分析显示这些基因与原发性免疫缺陷和其他免疫相关通路更相关。由以上知,基于TNF家族的标志与免疫相关的生物通路相关,作者决定深入研究风险评分,因为它与LUAD患者的免疫细胞浸润和炎症状况有关。应用CIBERSORT和LM22计算了来自TCGA的LUAD患者的22种免疫细胞类型的分数来评估免疫细胞的浸润程度。对高低风险组不同免疫细胞的分布进行了展示(图5)。具体来说,高风险组的活化NK细胞、中性粒细胞、活化树突状细胞(DC)和巨噬细胞M0的数量更高。相反,低风险组的记忆B细胞、静息DCs、静息CD4记忆T细胞、γδT细胞和巨噬细胞M1的数量更高。接下来,为了更好地了解与风险评分相关的炎症活动,作者检查了七个元基因簇之间的关系,探索了基于TNF家族的特征。使用基因组变异分析(GSVA)来模拟七个元基因的相应簇的结果。结果发现风险评分与HCK,LCK,MHC_I和MHC_II呈负相关。图5. LUAD中基于TNF家族的signature的免疫情况2.7基于TNF家族的特征与免疫治疗反应之间的关系在这一部分作者探索了基于TNF家族的特征与免疫治疗反应之间的关系。首先,计算了高低风险组的肿瘤突变负荷(TMB),新抗原数量,克隆新抗原数量和亚克隆新抗原数量。结果表明,高危患者显示出显著的突变负荷和新抗原,并证实了高风险评分与高TMB显著相关(图6)。接下来,作者研究了PD-L1的蛋白质水平,PD-L1是这两组中另一种众所周知的免疫疗法反应的生物标志物,发现高危患者中PD-L1蛋白水平较高。最后,作者将TIDE评分引入了分析中。与预期一致,高危患者的特征是TIDE评分明显降低,T细胞功能障碍和排斥评分更高。好啦,这篇文章的内容就这么多啦~总之,这是对LUAD患者TNF家族成员的表达谱和临床意义的首次也是最全面的调查。作者开发和测试了第一个基于TNF家族的LUAD患者预后模型。这些发现可能为优化LUAD患者的相关免疫疗法提供临床有用的工具。
对该思路感兴趣的小伙伴
客服小姐姐等你来撩哦!
