今天跟大家分享的是十月份发表在Clinical Cancer Research杂志(IF:10.107)上的一篇文章,文章主要讲的是本工作基于TCGA的HNSCC的RNA-seq数据集和免疫基因集,通过加权基因共表达网络分析(WGCNA)识别了22个免疫相关的bub基因。通过Cox回归分析构建免疫相关遗传预后指数(IRGPI),并使用GEO数据集验证。随后,分析了在IRGPI定义的亚组中,ICI治疗的分子和免疫特性以及益处。
An immune-related gene prognostic index for head and neck squamous cell carcinoma
头颈部鳞状细胞癌的免疫相关基因预后指标
一、摘要
免疫检查点抑制剂(ICI)治疗是一种很有前景的肿瘤治疗方式,但ICI治疗有一定的局限性,比如患者响应率低,自付医疗费用高。本工作的目的是全面了解头颈部鳞状细胞癌(HNSCC)的肿瘤微环境,并找到一个有价值的生物标志物来预测HNSCC患者对免疫治疗获益。在本研究中,开发了一种免疫相关遗传预后指数(IRGPI),并分析了其在区分不同的分子和免疫特征以及HNSCC预后中的作用。多组学数据综合分析显示,IRGPI-high的患者免疫反应活跃,肿瘤表型侵袭性较低,总体生存时间较长,ICI治疗获益更多,而IRGPI-low的患者则相反。IRGPI作为一种免疫相关的预后标志物,可能会对HNSCC的免疫治疗策略产生一些潜在的影响。
二、数据及方法
1.数据
(1)TCGA的546个HNSCC样本,包括502癌症样本和44个癌旁样本的RNA-seq和临床病理信息。Vonn Andrew Walter和Pierre Saintigny提供502个HNSCC样本的分子亚型。由Yu-Pei Chen(中国中山大学癌症中心)提供502例HNSCC标本的免疫亚型。
(2)GEO数据库的270 个HNSCC样本的RNA-seq数据和生存信息(GSE65858)。
(3)ImmPort和InnateDB数据库的免疫相关基因。
(4)RAID 2.0、TRRUST v2和STRING下载mRNA与转录因子(TFs)、以及miRNA和lncRNA关系数据。cBioPortal下载基因突变数据
2.方法
(1)识别免疫相关的hub基因
用limma包对TCGA的HNSCC样本的RNA-seq数据进行分析,识别癌症vs正常的差异基因。对免疫相关的差异基因使用clusterProfiler进行GO和KEGG富集分析。
然后使用WGCNA来识别hub基因。首先计算两个基因表达之间的Pearson相关系数,构建相似度矩阵。然后将相似度矩阵转化为邻接矩阵,使用拓扑重叠测度(TOM)将矩阵转化为拓扑矩阵。接着以1-TOM作为基因聚类距离,构建动态剪枝树进行模块识别。然后基于显著相关模块的基因,利用两个基因之间的边的权重> 0.2的基因构建网络。网络中度排名前50的基因定义为hub基因。通过R包maxstat获得每个hub基因对总体生存(OS)的最佳阈值,并选择22个显著生存相关免疫相关hub基因进行进一步分析。
使用R包ComplexHeatmap分析了22个免疫相关hub基因的体细胞突变。分析了这些基因在TF、miRNA和lncRNA调控网络中的作用。使用Cytoscape软件对网络中的基因进行KEGG通路分析进行可视化。
(2)IRGPI的构建与验证
在22个免疫相关hub基因中筛选出显著影响OS的基因,通过多变量Cox回归分析构建IRGPI。每个样本的IRGPI是通过将某些基因的表达值乘以它们在Cox模型中的权重,然后相加得到。使用K-M生存曲线和log-rank检验来评估IRGPI的预后能力。
(3)综合分析不同IRGPI亚型的分子和免疫特性及ICI治疗
首先对IRGPI评分高(n = 251)和低(n = 251)的样本中的所有基因用R包limma进行差异表达分析。然后使用R包clusterProfiler进行基于KEGG和HALLMARK基因集的基因集富集分析(GSEA)来确定差异表达基因参与的信号通路。然后用R包GSVA对几个代表性基因集进行单样本GSEA(ssGSEA)分析,并分析生存差异。
使用R包Maftools分析两个IRGPI亚型基因突变的数量和质量。对IRGPI分数与PD-L1表达及总突变负荷(TMB)进行相关分析。使用CIBERSORT 评估502个HNSCC样本的22种免疫细胞的相对比例。然后比较两组IRGPI亚型中22种免疫细胞和临床病理因素的相对比例。
对两组接受抗PD-L1治疗的尿路上皮癌(UC)患者进行了生存分析。使用R包timeROC进行了时间依赖性ROC曲线分析,比较IRGPI、TIDE和TIS的预后价值。TIDE score是在线计算。T-cell-inflamed signature (TIS) score以18个特征基因log2-scale标准化表达的平均值计算。
(4)统计分析
采用T检验进行两组间连续变量的比较,使用卡方检验分析分类数据,使用Wilcoxon检验对两组间TIDE评分进行比较。使用Kaplan-Meier生存分析和log-rank检验进行单因素生存分析。采用Cox回归模型进行多因素生存分析。认为双侧P< 0.05是显著的。
三、结果解析
1.免疫相关hub基因
与正常样本相比,肿瘤样本中差异表达基因3877个。将这些基因与从ImmPort和InnateDB获得的免疫相关基因列表交叠,得到1131个差异表达的免疫相关基因,在肿瘤样本中有860个基因表达上调,271个基因表达下调。然后对基因进行功能富集分析。
通过基于average linkage层次聚类和最优软阈值,将1131个基因分配到7个模块。根据每个模块中模块与样本特征之间的Pierson相关系数,发现蓝色和蓝绿色模块与HNSCC肿瘤密切相关,选择这些模块中的基因进行进一步富集分析。获得了度排序前50个免疫相关hub基因。KM分析发现,22个免疫相关的hub基因表达与HNSCC患者OS密切相关。
然后分析了22个免疫相关hub基因的特征,发现大部分发生了扩增、深度缺失和错义突变。接下来分析了hub基因与miRNAs和TFs、miRNAs与lncRNAs的互作情况。去除冗余后,网络中共有118对相互作用,涉及77个基因。接下来通过使用Cytoscape的ClueGO plugin功能,对调控网络中的基因进行KEGG通路富集分析,发现它们在与糖尿病并发症相关的AGE-RAGE信号通路、癌症的转录错调和调节长寿的通路中显著富集。
2. 不同IRGPI组的生存结果
为了确定独立的预后基因,对22个免疫相关的hub基因进行了OS的多变量Cox回归分析。如图1A和1B所示,只有3个基因(SFRP4、CPXM1和COL5A1)显著影响HNSCC患者的OS。接下来构建预后指标,单因素Cox回归分析显示TCGA数据中年龄、IRGPI、HPV状态和分期与HNSCC的预后显著相关。多因素Cox回归分析证实在校正其他临床病理因素后,IRGPI是独立的预后因素(图1C)。然后以中位IRGPI值为阈值,发现IRGPI高的患者效果更好(图1D)。接下来使用GSE65858 (n = 270) HNSCC数据集验证IRGPI。如图1E所示,IRGPI-high亚组患者的预后明显优于IRGPI-low亚组患者,与TCGA数据集结果一致。
图1.不同IRGPI亚型的预后分析
3. 不同IRGPI分型的分子特征
首先通过GSEA分析不同IRGPI亚型中富集的基因集。IRGPI-high样本的基因集中富集于DNA修复和免疫应答相关通路(图2A),而IRGPI-low 样本的基因集中富集于癌症和肿瘤转移相关通路(图2B)。为了进一步了解IRGPI亚型的免疫学性质,接下来分析了基因突变情况。发现IRGPI-high亚组的突变数量明显高于IRGPI-low亚组。最常见的突变类型是错义变异,其次是无义和移码缺失。接下来确定了IRGPI亚型中突变率最高的10个基因(图2C)。接下来,分析了IRGPI评分与PD-L1表达及TMB之间的关系。结果显示,IRGPI评分与TMB的相关性较小,而IRGPI评分与PD-L1无显著相关性。
图2.不同IRGPI亚型的分子特征
4.不同IRGPI亚型的免疫特性
为了分析不同IRGPI亚型中免疫细胞的组成,采用Wilcoxon检验比较不同IRGPI亚型中免疫细胞的分布。发现在IRGPI-high亚型中,CD8 T细胞等细胞显著富集,而在IRGPI-low亚型中,naïve B细胞等细胞富集(图3A)。图3B显示了与免疫景观相关的特征,包括不同IRGPI亚型的临床病理特征。接下来发现在IRGPI-high亚组中,CD8 T细胞、MHC I类、损伤修复细胞较多,而在IRGPI-low亚组中有更多的免疫抑制细胞和信号以及肿瘤和转移相关信号。
然后研究了是否IRGPI的预后价值来自于更好的免疫控制或较低的肿瘤侵袭性。可以发现上皮-间充质转化、TGF -和WNT -相关信号得分较高的患者,有更差的预后,而具有更多P53突变、CD8 T细胞和巨噬细胞M1的患者有更好的预后。因此,认为IRGPI的预后价值可能来自更好的免疫控制和较低的肿瘤生长侵袭性。
图3. HNSCC的TME景观及不同IRGPI亚型的特征
5. IRGPI分型与其他免疫和分子亚型的关系
有一个根据肿瘤和间质室的组成不同对HNSCC进行免疫分型,总结出三种免疫亚型:非免疫亚型、免疫衰竭亚型和免疫激活亚型。从图4A中可以发现,非免疫样本的比例在IRGPI两组之间几乎是均等的,但是在IRGPI-high组相较于IRGPI-low组,免疫活性样本较多,免疫衰竭样本较少。然后将203个免疫样本按照已有研究的一个pan-SCC免疫亚型进一步分类。如图4B所示,其中IRGPI-low组中IS1和IS5亚型较多,IRGPI-high组中IS4亚型较多。
在大规模的HNSCC基因组分析研究中,有四种不同的分子亚型经常被报道,即atypical、basal、classical和mesenchymal。接下来着重研究了IRGPI组中分子亚型的分布。发现IRGPI-low亚组包括16%的atypical型样本,22%的basal型样本,19%的classical型样本和43%的mesenchymal型样本,而IRGPI-high亚组包括36%的atypical型样本,37%的basal型样本,15%的classical型样本和13%的mesenchymal型样本(图4C)。classical型在两组间几乎均匀分布,但IRGPI-high亚组atypical型和basal型样本多于IRGPI-low亚组,mesenchymal型较少。
图4. 不同IRGPI亚型的免疫和分子亚型分布及ICI治疗的免疫应答
6. 不同IRGPI亚组的ICI治疗疗效
接下来使用TIDE方法评估免疫治疗在不同IRGPI亚型中的潜在临床疗效。TIDE预测得分越高,表示免疫逃避的可能性越高,说明患者从ICI治疗中获益的可能性越小。结果发现IRGPI-high组的TIDE评分低于IRGPI-low组,说明IRGPI-high患者比IRGPI-low患者更能从ICI治疗中获益(图5A)。同时,发现IRGPI-high亚组有较高的微卫星不稳定性(MSI)评分,而IRGPI-low亚组有较高的T细胞exclusion评分,但在T细胞功能障碍方面两亚组无差异。此外,还评估了anti-PD-L1 治疗的两组UC患者中IRGPI的预后价值。从图5B和图5C可以看出,IRGPI-high患者比IRGPI-low患者的OS更好。发现TIDE在Alexandra et al’s UC 样本和Mariathasan et al’s UC 样本中的表现不一致(图E),TIS组在12个月和18个月的随访中AUCs更好,IRGPI组在18个月和24个月的随访中AUCs更好。因此,认为在两个组中,IRGPI对OS的预测价值与18-gene TIS 和TIDE相当。
图5. IRGPI对抗PD-L1治疗患者的预后价值
总结:
本工作是通过对TCGA的HNSCC的肿瘤和正常样本进行差异表达分析,得到差异基因后再与免疫相关基因做交叠,然后用交叠后的基因进行WGCNA分析识别了22个免疫相关的bub基因。然后通过COX回归识别3个基因特征并基于此构建免疫相关基因预后指数(IRGPI),发现IRGPI-high亚组患者的预后优于IRGPI-low亚组。接下来对IRGPI的分子和免疫结构进行了分析,识别了两组样本显著富集的通路、突变景观差异,并分析了IRGPI亚型中免疫细胞的组成,发现IRGPI的预后价值可能来自更好的免疫控制和较低的肿瘤生长侵袭性。然后分析了IRGPI分型与其他免疫和分子亚型的关系,以及不同IRGPI亚组的ICI治疗疗效。