转移性鼻咽癌的新抗原概况
大家好,今天分享的文章是今年4月19号发表在Theranostics[IF=8.579]上的一篇文章,是一项有关于鼻咽癌新抗原的研究。研究方法和结果都具有较大的突破,下面一起来看看吧!
方法部分
样本
26例鼻咽癌患者的57个样本,包括29个原发肿瘤,16个区域淋巴结和12个远处转移灶。
WGS/WES的SSNV/INDEL和SCNA检测
研究者使用了Sentieon的变异检测流程,它对基于BWA、GATK和MuTect的流程进行了改进。在此基础上,将2×150bp的双末端读长比对到人类参考基因组(UCSC hg38)中,并对bam文件排序和去重之后检测细胞单核苷酸变异(SSNV)和InDel。为了进一步减少假阳性变异结果,还进行了额外的过滤。当某个SNV读长计数大于等于5时,并且满足在肿瘤和正常样本之间突变型和野生型读长计数的费舍尔检验的显著性(p<0.05),该SNV才被认为是真阳性。随后使用ANNOVAR对变异进行注释。为了检测显著突变的基因,首先筛选了1000Genome,ESP6500和Exac数据库中的高频突变。用Control-FREEC检测体细胞拷贝数变异(CNV)、杂合性缺失(LOH)和肿瘤纯度评估。而对于RNA-seq分析,使用STAR将来自RNA-seq的双末端读长比对到人类参考基因组,然后用RSEM进行基因表达定量,DESeq2进行差异表达分析。相关性分析则采用log2TPM归一化数据。
变异的癌细胞组分(CCF)估计
ABSOLUTE算法用于估计每个SSNV,InDel和CNV的肿瘤样本纯度,倍性和CCF。在此分析中,根据ABSOLUTE评估的CCF置信区间,将变异(SSNV,InDel和CNV)分类为克隆或亚克隆。如果95%置信区间重叠1,则将突变定义为克隆,否则将其定义为亚克隆。
HLA分型与新抗原预测
研究者使用FASTQ格式的血液测序数据对人类白细胞抗原(HLA)进行分型,应用HLA-HD进行I类HLA基因分型。为了鉴定新抗原,将pVAC-Seq与NetMHC,NetMHCpan和PickPocket算法结合使用,以预测9-和10-mer新表位,3个预测因子中预测的最低结合强度用于定义新表位的结合亲和力,使用NetMHCstabpan评估新表位的结合稳定性。结合亲和力< 500 nM以及FPKM > 1的新表位被预测为新抗原。结合强度< 50 nM的新抗原定义为强亲和力,< 150为中亲和力,其他为弱亲和力。为了量化新抗原的质量,还计算了新抗原的Cauchy-Schwarz指数(CSiN)评分和新抗原适应性模型的潜能。
新抗原消耗
拷贝数丢失相关的消耗:所有非同义的突变都注释为拷贝数丢失或不丢失的区域。然后,计算出比值比,将非同义突变(新抗原)与非同义突变(未预测为新抗原)进行比较,以确定新抗原是否更有可能在拷贝数丢失的区域。转录消耗:使用以上定义,注释所有非同义突变,如是否在RNA-seq数据中表达。然后,计算了比值比,将非同义突变(新抗原)与非同义突变(未预测为新抗原)进行比较,以确定新抗原是否不太可能表达。
从肿瘤RNA-Seq数据推断T细胞受体(TCR)
使用MiTCR从测序肿瘤切片中存在的T细胞鉴定TCR互补决定区序列。简单来说就是,使用seqtk将双末端的FASTQ文件连接成单个文件,并通过MiTCR运行以优化从RNA-seq数据集中的提取。使用在线CiberSort工具对免疫细胞群(如CD8 T细胞)进行估计。通过通路分析来评估KEGG通路的激活,然后应用GSVA为每个样本分配通路活性估计值。此外,使用BioBloom工具从WES/WGS提取EB病毒的读长计数。
亚型预测模型的建立
为了提取队列中各亚型的特征,研究者首先使用Wilcoxon符号秩检验来检测每两个亚型之间的差异表达基因,并将其中一个亚型相对于其他两个亚型高表达的基因作为特征来建立预测模型。然后,使用mlbench R包在队列中随机选择2/3的患者作为训练集,其余的患者作为验证集。使用caret R包选择了一种随机森林算法,在训练集中建立了100次重采样迭代的亚型预测模型。最后,将预测模型应用于验证集,并评估其准确性。
肿瘤免疫循环的免疫图评分(IGS)计算
利用上述特征对抗肿瘤T细胞免疫等抑制性分子进行富集分析,用GSVA R包计算GSEA的归一化富集得分(NES),并将NES换算为z得分(Z)。对于肿瘤抗原性,计算癌症预测新抗原负荷的z得分。每个患者的抗肿瘤T细胞免疫、肿瘤抗原性等的IGS定义为3 + 1.5×Z,其余的IGS定义为3-1.5×Z。
统计分析
Kolmogorov-Smirnov正态性检验用于确定数据集在每次比较中是否遵循高斯分布。如果数据是高斯的,则执行参数检验(t检验、方差分析或Pearson相关性);如果数据为非高斯分布,则采用非参数检验(Wilcoxon秩和检验),生存分析采用Kaplan-Meier方法。采用log-rank检验评估不同Kaplan-Meier曲线之间差异的显著性,风险比采用Cox比例风险模型确定。
结果部分
鼻咽癌新抗原的特征
研究患者的临床信息如表1所示。研究者使用pVAC-seq检测了9-和10-mers MHC I类相关的新抗原,过滤出FPKM小于1或预测亲和力大于500 nM的新表位。总共检测到21174个新抗原,其中包括3061个高亲和力新抗原(结合亲和力<50 nM)和1629个克隆新抗原(图1A)。有18861个新抗原来自错义突变,1783个新抗原来自移码InDel(图1A)。平均而言,每个错义突变产生4.5个新抗原,每个移码InDel产生9.35个新抗原,这与TCGA的新抗原数据相当,也与先前报道的研究结果一致。值得注意的是,鼻咽癌和甲状腺癌等突变相对较低的肿瘤可能具有较高的产生新抗原的能力,因为预测的新抗原的数量除了受突变数量的影响外,还受到HLA类型、结合亲和力和表达水平的影响。在鼻咽癌中,大多数新抗原来源于错义突变(图1A)。尽管大多数非沉默突变会导致氨基酸序列变化,但只有约57.33%的人会产生新抗原,而忽略了这些新抗原是否可以被抗原呈递细胞识别并刺激T细胞反应(图1B)。
表1 患者的临床特征
与TCGA中肿瘤的突变数据相比,鼻咽癌的非沉默突变(中位数为65)相对较低,与肾乳头状细胞癌(中位数为64)和肝细胞癌(中位数为72)相当(图1C)。研究者还利用已发表的TCGA数据比较了鼻咽癌和其他癌症的新抗原负荷,鼻咽癌新抗原的数量(中位数为251)相对较高,与胃腺癌(中位数为235)和肺腺癌(中位数为321)相当(图1D)。鼻咽癌新抗原负荷与TMB呈正相关(R=0.76),与CD8+ T细胞、CD4+ T细胞比例无相关性(图1E-F)。在该研究中,临床检测到的EBV DNA拷贝数或用BioBloom定量的EBV感染与新抗原负荷没有相关性(图1G)。
作者使用MiTCR从RNA-seq数据中提取和量化TCR多样性。然而,新抗原负荷与TCR克隆数量无显著相关性(图1H)。由于TCR选择和克隆扩增的程度是局部T细胞活化和复制的重要指标,这一现象表明由于翻译后修饰或其他原因,许多预测的新抗原不能刺激T细胞。使用多区域样本进一步探讨了新抗原的肿瘤内异质性(ITH)与TCR的ITH之间的关系,观察到新抗原的ITH与TCR的ITH呈正相关(图1I-M)。
图1 鼻咽癌新抗原概况
原发肿瘤、区域淋巴结转移和远处转移样本中肿瘤抗原特征的差异
基因组不稳定性被认为与新抗原负荷有关。首先,研究者评估了加权基因组不稳定性指数(wGII)和0.2的阈值,该阈值可从癌症染色体不稳定-(CIN-)准确地区分出CIN +。原发肿瘤、区域淋巴结和远处转移的CIN状态相似(图S1A)。与CIN-肿瘤相比,CIN+肿瘤往往具有更多的新抗原,尽管可能由于样本量小而未达到显著性水平(图S1B)。此外,还使用MANTIS评估了微卫星不稳定性(MSI),所有样本均为MSI稳定的,在原发性,区域性淋巴结转移和远处转移中MSI评分无差异(图S1C)。此外,鼻咽癌MSI评分与新抗原数量无相关性(图S1D)。然后比较原发肿瘤、区域淋巴结转移和远处转移的新抗原负荷和高亲和力新抗原的比例。与基因组不稳定性比较一致,不同部位之间新抗原负荷或高亲和力新抗原比例无显著差异(图2A-B)。此外,原发肿瘤的新抗原负荷与远处转移的新抗原负荷呈正相关(图2C)。原发肿瘤的新抗原负荷与区域淋巴结的新抗原负荷有相关趋势,但无统计学意义(图2D)。与新抗原负荷相比,新抗原的质量在某些癌症的生存预后中有更重要的作用。研究者使用新抗原的Cauchy-Schwarz指数(CSiN)评分和新抗原适应性模型潜力来量化新抗原的质量。在原发肿瘤,区域淋巴结转移和远处转移之间,新抗原的质量没有显著差异(图2E-F),其结果推断原发性肿瘤、局部淋巴结转移和远处转移中新抗原的数量和质量相似。与CNV丢失相关的新抗原消耗发生在13.79%的原发肿瘤、0%的区域淋巴结和25%的远处转移灶中,51.72%的原发灶、37.5%的区域淋巴结和66.67%的远处转移灶出现转录相关的新抗原消耗,表明以新抗原消耗为特征的免疫抑制可能促进鼻咽癌的远处转移(图2G-H)。
补充图S1 基因组不稳定性和HLA LOH比较
图2 原发肿瘤、局部淋巴结转移和远处转移的新抗原特征
先前的全基因组关联研究发现,HLA中的SNP与NPC独立相关。在本研究中,MHCⅠ类相关基因(包括HLA-A、HLA-B和HLA-C等)的突变频率较低,仅检测到两个样本。除NLRC5在原发灶中表达最低外,其余MHC-I类相关基因在原发灶、区域淋巴结和远处转移灶中的表达差异不显著(图2I)。跟预期一样,HLA-A和HLA-B的表达分别与克隆性TCR-α和TCR-β的比例呈弱相关(图S1E-F)。此外,还评估了HLA基因是否存在LOH,共检测到8例HLA杂合性缺失,HLA杂合性缺失频率与不同部位、不同类型的新抗原消耗无相关性(图S1G)。具有HLA LOH的样本似乎比具有完整HLA的样本具有更高的新抗原负荷量,尽管不显著,可能是因为样本量较小(图2J)。HLA完整的样本中HLA基因的表达显著高于HLA LOH的样本(图S1H)。免疫微环境方面,M0巨噬细胞和活化的肥大细胞富含在HLA LOH样本,而CD8 T细胞等富含在HLA完整样本(图2K)。TMIT I(高PD-L1和CD8A)代表对ICI反应良好的炎性肿瘤,TMIT II(低PD-L1和CD8A)和TMIT III(高PD-L1和低CD8A)可能代表非炎性肿瘤,而TMIT IV(低PD-L1和高CD8A)代表免疫排斥微环境的肿瘤。有趣的是,几乎所有具有HLA LOH的肿瘤(87.5%)都属于TMIT II(图S1I),这表明HLA LOH可能与相对失活的免疫微环境有关,有利于肿瘤细胞的增殖和转移。
转移过程中的新抗原减少
根据CCF的动态变化,将新抗原分为三组:减少组、增加组和恒定组。同样地,作者还将非肿瘤抗原突变分为减少组、增加组和恒定组。正如预期的那样,发现在转移过程中,与非新抗原突变相比,产生新抗原的突变更容易发生减少(图3A),这可以合理地假设肿瘤细胞倾向于丢失具有高免疫原性的新抗原。与MHCⅠ类分子的结合亲和力和稳定性代表了抗原的免疫原性,计算降低组中强/中亲和力新抗原和高稳定性新抗原的比例。与增加组相比,免疫原性强的新抗原在肿瘤转移过程中易于减少(图3B)。
然后,研究者计算了新抗原减少的比例,以评估新抗原减少的程度。结果发现,新抗原减少发生在57.69%的转移性肿瘤中,并倾向于发生在转移性区域淋巴结中(图3C-D)。GSVA显示,新抗原减少的肿瘤中主要在免疫缺陷通路富集(图3E)。免疫抑制剂PD-1、BTLA和CTLA-4在新抗原减少的转移瘤中显著高表达,进一步证实新抗原减少与免疫细胞功能缺陷有关(图3F)。此外,B细胞和免疫调节T细胞富含在新抗原降低的转移瘤中,而巨噬细胞和静息树突状细胞富含在在没有新抗原降低的转移瘤中(图3G)。此外,还通过比较Tregs与CD8 T细胞、M2与M1巨噬细胞的比值来探讨免疫浸润的功能定位(图3H)。与无新抗原减少的转移样本相比,在有新抗原减少的转移样本中观察到较高的Tregs与CD8 T细胞比率(图3H)。
图3 转移过程中新抗原减少
不同亚型的新抗原消耗程度不同
原发肿瘤、局部淋巴结和远处转移之间的肿瘤突变负荷相似(图S2A)。当根据原发肿瘤的TMB中位数将患者分为高、低两组时,低TMB与较差的PFS相关,而TMB与OS预后无关(图S2B-C)。接下来,为了确定新抗原的特征是否可以预测NPC患者的生存结果,分别根据新抗原负荷的中位数,CSiN评分和新抗原适应性模型潜能将患者分为高组和低组。然而,新抗原负荷、CSiN评分和健康模式潜能组都与患者的PFS或OS无关(图4A-C;图S2D-F)。然后,还探索不同亚型的肿瘤细胞是否也通过新抗原消耗而逃脱免疫监视,使用随机森林算法建立了差异表达基因的亚型预测模型(图S2G-I)。预测准确率为85.71%,ROC曲线的AUC进一步证实了模型的稳定性(图S2I)。
补充图S2 亚型之间的表达和新抗原特征
然后,将预测模型应用于原发性肿瘤,17.4%、30.4%和52.2%的患者被分成亚型I、亚型II和亚型III。预测概率的分布评估了预测模型的准确性(图4D)。亚型II患者的特征为高免疫浸润和低增殖(图4E)。使用突变等位基因肿瘤异质性(MATH)评分量化ITH时,在不同亚型中,ITH亚型I最高,亚型III最低(图S2J)。亚型之间的新抗原特征显示,I型新抗原负荷显著低于III型,亚型间新抗原质量差异不显著(图4F-H)。亚型间高亲和力新抗原的比例也相似(图S2K-L)。然后计算比值比来评估不同亚型中拷贝数丢失相关的新抗原消耗和转录消耗的程度。与CNV丢失相关的新抗原消耗和转录消耗在I型中都很突出(图4I-J)。MHC-I类相关基因在亚型II中的表达始终高于其他亚型(图4K)。这些结果表明,I型患者缺乏有效的免疫细胞,并出现严重的新抗原消耗,这可能造成不良的生存结果。
图4 不同亚型之间新抗原消耗的特征
与II型和III型患者相比,I型患者的2年PFS更差(图5A-C)。由于II型和III型之间的生存率相似(图5A-B),将II型和III型患者合并为新的II型患者。 与新的亚型II相比,亚型I的患者2年OS和PFS较差(图5C-D)。 此外,研究者发现,合并的亚型可以更好地预测患者的PFS。
为了帮助临床医生为每个患者做出准确的治疗决策,计算了癌症免疫周期的免疫图得分(IGS),包括抗肿瘤T细胞免疫、肿瘤抗原性等(图5E)。然后使用雷达图显示每个样本的癌症免疫周期状态(图5F)。I型患者缺乏T细胞,肿瘤抗原性、抗原呈递和对肿瘤细胞的识别能力较弱,这可能导致免疫疗法抗性(图5G),因此迫切需要针对这些患者新的靶向治疗。相反,II型亚型患者高表达免疫检查点分子(图5G),表明ICI对这些患者可能有效。使用ImmuCellAI预测ICI治疗的疗效,II型的应答率最高(47.6%),I型的应答率最低(12.5%)。亚型III是3种亚型中最具异质性的一组,因此需要更多地关注亚型III患者的治疗决策,综合考虑临床信息、免疫状态和分子亚型。
图5 不同亚型的临床结果和肿瘤免疫周期的特征
参考文献:Neoantigen landscape in metastatic nasopharyngeal carcinoma