今天小编跟大家分享的是今年11月份刚发表在frontiers in Oncology杂志上的一篇文章。目前,已有许多临床试验表明了基质细胞和免疫细胞在胃癌微环境中的重要作用,但尚未有可靠的基于此的预后指标。因此,该文章的作者旨在开发一个用于胃癌预后分层的、基于基质和免疫评分的基因特征。Stromal-Immune Score-Based Gene Signature:A Prognosis Stratification Tool in Gastric Cancer基于基质-免疫评分的基因特征: 一种胃癌的预后分层工具作者首先从TCGA数据库下载了胃癌患者的基因表达以及相应临床数据(共354例患者),然后用ESTIMATE算法来评估每个胃癌样本的基质和免疫评分。两个GEO中的数据集GSE84437(包含433例胃癌患者)和GSE62254(包含300例患者)用来做外部验证。根据每个样本的基质和免疫得分,患者被分为高分组和低分组,最佳评分阈值通过R包”maxstat”来确定;然后以总生存期为预后终点,用Kaplan-Meier预估每个组的预后情况,采用对数秩检验比较两组患者的生存情况。R包”limma”被用来识别两组间差异表达的基因,FDR<0.0001且log2|FC|>4的基因被定义为DEG,它们的表达模式用热图进行了可视化。其中,与低分组相比,在高分组中过表达的定义为“overexpressed DEGs”,在高分组中低表达的则定义为”underexpressed DEGs”。此外,对于在基质评分组和免疫评分组共享的DEGs,作者还做了GO和KEGG富集分析(FDR<0.05)。首先,作者将最低对数秩检验P<0.01的DEGs定义为预后基因;然后用基于部分似然函数的Cox比例风险回归生存模型来选择预后特征基因,通过负对数似然统计和AIC准则筛选出最佳基因特征,并同已知的预后基因特征进行比较(CXCR家族和细胞周期相关的特征);三种特征的风险分层值利用Cox回归分析中的2log似然统计量进行比较,较小的值表明预测和分层生存结果的能力较好。基于研究筛选出的最优基因特征,作者又构建了一个风险分层模型:(1) 计算每个特征基因的得分,对于预后有利基因,0表示过表达,1表示低表达;对于预后不利基因,1表示过表达,0表示低表达;(2) 计算总风险得分,即所有特征基因的得分之和;(3) 根据风险总分进行分组:如果风险得分=0,则分类为低风险组;如果风险得分=1,则分类为中等风险组;如果风险得分2,则分类为高风险组。所有的分析都是通过R语言完成的,基质和免疫评分使用R包”estimate”计算所得;基于鲁棒似然函数的生存模型通过R包“rbsurv”构建;富集分析所用R包为“GOstats”、 “Category”和“KEGG.db”;热图和Venn图分别使用“pheatmap”和“VennDiagram”绘制。对于TCGA数据集中的354个胃癌样本,作者通过加入两个基因特征的ESTIMATE算法中估计了肿瘤组织的浸润细胞和肿瘤纯度,其中,“stromal signature”表示肿瘤组织中的基质细胞,“immune signature”表示肿瘤组织中的免疫细胞浸润。基于这两个特征,分别生成基质和免疫评分来反映基质和免疫细胞的存在,并使用单样本基因集富集分析将二者进行结合来测量肿瘤纯度。在整个群体中,患者的免疫评分要比基质评分高。通过比较不同肿瘤分期、分化程度和组织学分类的评分分布,研究分析了基质和免疫评分与胃癌患者病理特征的关系。由图1.A可以发现,基质和免疫评分均随肿瘤分期的增加而显著增加,分化较差的肿瘤基质和免疫评分相对较高,同时,基质评分和免疫评分在不同的组织学分类中也都差异分布。在分析两种评分与预后的关系时,发现低基质评分/免疫评分的患者总生存率高于那些高基质评分/免疫评分的患者(图1.C-D)。综合两个得分,结果同样表明评分较低的患者生存率明显高于评分较高的患者(图1.E)。
文章首先通过比较高免疫(基质)得分患者和低免疫(基质)得分患者的表达谱来识别免疫(基质)得分相关的DEGs。共识别出了952个基质得分相关的DEGs(600个过表达,352个低表达)和338个免疫得分相关的DEGs(226个过表达,112个低表达),这些DEGs表达谱的热图见图2.A-B,非监督层次聚类分析表明,识别出的DEGs在胃癌患者中有不同的表达模式,可以有效地区分高得分和低得分的患者。在两组DEGs中,共享了176个过表达的DEGs和45个低表达的DEGs(图2.C-D),对它们的生物功能富集分析发现,过表达DEGs与免疫相关蛋白和细胞器有关,而低表达DEGs可能参与微管蛋白复合体、细胞骨架组织和连接等过程(图2.F)。
图2. 基质和免疫评分相关DEGs的表达谱和生物学功能在上述的221个DEGs中,作者分别识别出38个过表达DEGs和7个低表达DEGs为预后基因(图2.E),这45个基因的预后效能如图3所示。研究发现,过表达的预后DEGs可能与良好的生存结果相关,低表达的预后DEGs则与较差的生存结果有关。
研究利用以上的45个预后DEGs,通过基于鲁棒部分似然函数的Cox比例风险回归生存模型,筛选出了SOX9, LRRC32, CECR1和MS4A4A为最优特征基因(基于负对数似然比和AIC统计的最小值),除SOX9外,其他三个基因都与不良预后相关(图4.A)。基于这四个特征基因,作者计算了个体水平的得分来进行风险分层(图4.B),风险得分越高,患者生存时间越短(图4.C),最终整个患者群体被分成三组(低、中、高风险组)。该风险分层模型又分别在胃癌Ⅱ期和Ⅲ期两组患者中进行了验证,结果与整个群体一致(图4.E-F)。
图4. 基于基质-免疫评分的基因特征与风险分层模型在三个不同风险组中,高风险组患者倾向于患有印戒细胞瘤并且分化水平低,大多肿瘤晚期的患者都在高风险组,该组患者的基质和免疫得分也相对较高。单变量生存分析的结果表明,基质得分、免疫得分和肿瘤分期是总生存期的显著危险因素,而多变量Cox回归模型也证实了基于基质-免疫得分风险分层工具的预后价值。图5.A是整合基质-免疫得分和临床病理危险因子后对生存期进行预测的列线图,校正图表明其效能堪比理想模型(图5.B-C)。
最后,研究又使用两个独立集GSE84437和GSE62254,对研究中基于基质-免疫得分的基因特征和风险分层模型进行了验证,结果与TCGA数据保持一致(图6)。
今天的文章小编就为大家解读到这了!Have a nice day!欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史
