大家好,今天给大家分享的是今年2月发表在cancer research(IF=9.727)上的一篇文章。该研究对大量的肿瘤转录本进行了反卷积,以推断20种实体肿瘤类型中肿瘤和基质细胞上的配体与受体之间的串扰,该研究为探索肿瘤微环境的串扰提供了新的见解。
肿瘤微环境中配体-受体串扰的泛癌分析
方法
肿瘤数据源
这项研究总共分析了TCGA上BLCA、BRCA、CESC等20种实体瘤类型,从Firehose网站获得了20种肿瘤类型的体细胞突变(SNV)和拷贝数变异(CNV)数据,还从UCSC下载了经过统一处理的TCGA RNA-seq(FPKM)数据。在配体-受体互作数据库
中获得了约1400个配体-受体对。
肿瘤纯度评估
肿瘤纯度可以通过从大量肿瘤样本中获得的DNA和RNA数据来估计。首先使用三种基于基因组和一种基于转录组的方法计算所有样品的肿瘤纯度:AbsCN-Seq(Exome-seq),PurBayes(Exome-seq),ASCAT(SNP-array)和ESTIMATE(RNA-seq)。为了在一致性纯度评估中限制缺失数据带来的潜在技术偏差,使用不完全算法与样本肿瘤纯度矩阵的迭代主成分分析(使用missMDA R软件包)估算缺失数据。使用分位数归一化来标准化和平均不同算法得到的肿瘤纯度分布。
癌症-基质基因表达反卷积
我们假设肿瘤由癌症和基质细胞组成。然后,把从这两个区室衍生的mRNA分子的总和作为肿瘤的mRNA丰度。对于样本i中给定基因测得的肿瘤mRNA表达可以表示为:
这里的pi表示样本i中的癌细胞比例(肿瘤纯度),和 分别是该基因在癌症和基质区室中的平均表达水平,使用非负最小二乘回归对平均区室表达水平进行估计。在反卷积之前,要对肿瘤RNA-seq FPKM数据进行了对数转换,即log2(X+1)。他们发现,上面的公式可能对基质基因表达存在错误估计,因此对这些基因使用了一种改进的方法。首先在给定的一组肿瘤中鉴定CNA和mRNA表达之间相关的基因(Mann-Whitney U检验),然后使用两步法估算癌症和基质区室的基因表达。此外,研究者在cBioPortal上获得了BRCA和OV肿瘤类型的iTRAQ(同位素标记相对和绝对定量)蛋白丰度数据,并按照与上述RNA-seq数据类似的步骤,将大量的丰度图谱分解为癌症和基质区室的丰度图谱。
配体-受体相对串扰(RC)得分
为了评估癌症和基质细胞区室之间的信号相对流动,作者应用了相对串扰(RC)评分,使用配体和受体基因表达的产物来估计配体-受体(LR)复合物的活性。然后,RC评分会根据信号的四个可能方向和正常组织状态来估算相对复合物浓度:
分母中的正常项用于对正常组织中的复杂活性进行标准化,该项是根据TCGA每种肿瘤类型的正常组织样本中的基因表达水平计算得到的。在这里,我们可以根据平衡状态下单个配体的摩尔浓度L,受体R及其解离常数KD估算LR复合物的浓度:
免疫细胞类型关联分析
利用Cibersort在所有TCGA样本中获得了估计的免疫细胞类型比例。为了发现细胞类型与检查点配体/受体之间的关联,我们计算了免疫细胞类型比例中位数与不同肿瘤类型的癌症/基质表达水平之间的Pearson相关系数。对于黑色素瘤的scRNA-seq数据分析,研究者从单细胞数据库(https://singlecell.broadinstitute.org/)获得了处理过的黑色素瘤scRNA-seq数据,分析并比较了恶性和非恶性细胞的反卷积基因表达估计。使用Wilcoxon秩和检验评估癌症和基质细胞之间的基因表达差异。
人蛋白图谱数据的免疫组织化学(IHC)定量分析
为了量化肿瘤和基质细胞的基因表达,使用ImageJ软件包对从人类蛋白质图谱(proteinatlas.org)获得的IHC图像进行了颜色反卷积。在手动选择和分割肿瘤和基质细胞后,使用ImageJ测量颜色强度,并评估靶点、细胞和互补成分。然后估计给定载玻片的癌症和基质区室的平均抗体强度。
小编在这里对方法部分进行一下总结,作者为了获得TCGA队列中肿瘤纯度的无偏估计,利用每个肿瘤样本的基因组和转录组数据,对大约8000个样本和20种实体肿瘤类型计算了一致的纯度估计(图1)。大多数肿瘤的纯度在40-70%之间,但在肿瘤类型内和类型之间表现出很大的差异(图2a)。其次,肿瘤转录组图谱被反卷积成肿瘤和基质细胞图谱。对于每种肿瘤类型和基因,将测量的mRNA表达量与估计的肿瘤纯度进行回归,以预测完全由癌症或基质细胞组成的表达水平。第三,为了推断癌症和基质细胞的配体和受体情况,以及这些区室之间的潜在串扰,将表达谱与LR互作的精选数据库相结合,以预测跨癌症类型的候选LR相互作用。
图1 方法概述
结果
肿瘤转录组反卷积的验证
研究者进行了多项分析,以评估肿瘤转录组反卷积方法的有效性和准确性。首先,已知的基质和上皮细胞谱系因子在不同癌症类型的基质和癌症区室之间的表达差异显著(图2b)。类似地,先前衍生的基质和免疫细胞特异性基因组在所有肿瘤类型的基质区室中具有显著的高表达(图2c)。其次,由于体细胞CNA是癌细胞基因组的标志,研究者推断基质特异性基因不应受到肿瘤CNA的影响。实际上,癌症特异性基因(而非基质特异性基因)在表达和肿瘤CNA水平之间显示出显著的正相关(图2d)。此外,肿瘤类型之间的总体CNA表达相关性水平的变化可以用给定肿瘤类型中CNA的总体患病率来解释。
作者检测了反卷积表达估计与黑色素瘤scRNA-seq分析数据的一致性。实际上,对于scRNA-seq研究鉴定的基质和癌症细胞特异性基因,反卷积的基质和癌症区室表达显著较高(图2e)。接下来,使用基因集富集分析,发现跨癌症类型的基因表达和癌症的已知标志(例如细胞周期和DNA修复)和基质细胞存在一致的关联(图2f)。然后,评估了反卷积mRNA谱代表癌症和基质细胞中蛋白水平的准确程度,发现mRNA和蛋白质表达谱之间有很好的一致性(图2g)。最后,为了评估反卷积方法与IHC数据的一致性,首先鉴定了跨肿瘤类型的癌症/基质细胞差异表达具有高可变性的基因,然后证实了这两种最高表达和可变基因的表达模式在不同肿瘤类型中是一致的(图2h)。总体而言,使用正交类型数据的这些不同比较证实反卷积方法可以稳健地反卷积20种受试肿瘤类型的癌症和基质细胞区室的基因表达谱。
图2 肿瘤转录组去卷积的验证
乳腺癌中配体受体异常表达的推断与验证
为了进一步验证是否可以推断配体和受体的区室特异性表达,对乳腺癌的分子亚型进行了研究。与HER2+和腔内亚型相比,在基底细胞中观察到HER2 (ERBB2)和雌激素(ESR1)受体的癌症区室表达分别降低了60倍和250倍。然后,对基底肿瘤中差异表达的配体和受体进行了系统的筛查,这突出了拮抗Wnt-通路配体SFRP1,该配体在基底肿瘤的癌细胞中具有非常高的表达,而在其他乳腺癌亚型的癌细胞中几乎不存在(图3a,c)。在受体中,基底癌细胞中IL-6共受体IL6ST (GP130)显著下调(图3b,c)。为了验证这些区室特异性差异表达模式,研究者在基底型和腔内型乳腺肿瘤的FFPE切片中使用特异性RNAScope探针进行RNA原位杂交(图3d)。使用两种不同的定量方法对每个亚型的癌症区室SFRP1和IL6ST的表达进行定量,得到了相似的结果(图3e)。与转录组反卷积筛选结果一致,我们观察到基底肿瘤的癌细胞中SFRP1的表达明显高于管腔肿瘤,而IL6ST的表达明显低于管腔肿瘤。
图3 基底乳腺癌中异常配体和受体表达的验证
配体和受体在泛癌区室中的特异性表达
然后,研究者探索了603个LR对的区室特异性,结果显示属于补体系统的配体以及白细胞特异性趋化因子在不同肿瘤类型中具有高基质特异性表达(图4a)。在受体中,免疫和巨噬细胞特异性因子是不同肿瘤类型的重要基质特异性受体(图4b),并且跨肿瘤类型的癌症特异性配体表达的频率和显著性要低得多。不同肿瘤类型中癌细胞特异性表达的受体也不常见,但包括EGF家族、Wnt家族和FGF家族的相关成员(图4b)。
图4 串扰的泛癌推断
不同肿瘤类型配体-受体互作的推断
接下来,研究者构建了RC评分,以量化和区分自分泌和旁分泌(分别表示区室内或区室间的信号)LR串扰类型(图4c)。对这些RC评分进行的泛癌分析显示,癌症与基质区室之间存在显著差异。虽然在所有肿瘤类型中,只有3对LR具有高自分泌癌到癌信号的RC评分,但在所有癌症类型中,有264对LR具有高自分泌基质到基质信号RC评分(图4d)。有趣的是,癌症和基质细胞区室之间的旁分泌信号也显示出频繁的互作(图4d)。
癌症-癌症自分泌LR对包括FGFR8、LRP6和MST1R等受体(图4e),在许多实体癌类型中,MST1R是一个预后标记物和候选治疗靶点。在不同肿瘤类型的癌症-癌症和基质-癌症信号互作中,通过ACVR2B的信号均显著(图4e,f),这表明了ACVR偶联的TGF-β/SMAD信号传导在肿瘤发生中的潜在共同作用。
接下来,还研究了是否可以使用正交scRNA-seq数据验证这些区室特异性LR表达模式,其中重点研究了在SKCM中3个最有意义的癌症-癌症信号泛癌LR对(图4e)。在这些对中,有两个受体(ACVR2B和LRP6)在SKCM中癌症区室相对于基质区室过表达,而配体的表达未改变。在黑色素瘤scRNA-seq数据集内,这两个受体在恶性与非恶性细胞中也显著过表达(图4g)。
不同肿瘤类型自分泌癌细胞串扰的汇聚
泛癌分析表明,癌细胞导向的LR互作往往因肿瘤类型而异。事实上,大多数癌症类型都有多种LR互作,且自分泌评分较高(图5a)。在用公开的scRNA-seq数据验证SKCM癌症自分泌对时,在前2个LR对(BMP7>BMPR1B,SEMA6A>PLXNA2,图5a)中,受体BMPR1B和配体SEMA6A在反卷积癌细胞中显著过表达,这两个基因在黑素瘤scRNA-seq数据中的癌细胞中也显著过表达(图4g)。其次,在脑肿瘤(LGG和GBM)中,Delta-Notch信号对癌症区室具有高度特异性(图5a)。这些结果表明Notch自分泌/旁分泌信号对胶质瘤的发生至关重要。
在每种肿瘤类型中,重要的自分泌癌症-癌症LR互作倾向于汇聚在相同的信号通路上。近一半实体瘤类型的自分泌互作汇聚在BMP-信号通路(图5a)。此外,除KIRC的所有肿瘤类型至少存在一种癌症-癌症特异性互作(图5a,b)。
图5 不同肿瘤类型间自分泌癌细胞串扰的汇聚
免疫检查点的泛癌表达特征
免疫检查点是肿瘤免疫细胞浸润和抗肿瘤活性的调节剂。在所有肿瘤类型中,PD-1和CTLA4的表达在基质中较高,而在癌细胞中几乎不存在(图6a)。表达反卷积显示,与所有肿瘤类型的癌症区室相比,基质中两种配体(PD-L1和CD86)均显著过表达(图6a)。接下来,研究者将分析扩展到与抗肿瘤活性相关的27种免疫检查点LR互作的更大集合,该分析显示不同癌症类型的PD-L1>PD1 和CD86>CTLA4检查点的癌症-基质串扰评分较低(图6b)。然而,NCR3LG1>NCR3和ICOSLG>ICOS这两对的RC评分较高(图6b)。涉及IFNG和两个同源受体(IFNGR1和IFNGR2)的LR互作在所有类型的肿瘤中具有中等程度但一致的癌症-基质评分(图6b,c)。
图6 免疫检查点在泛癌中的表达
免疫细胞类型与检查点表达的关联
最后探索了肿瘤免疫细胞类型与检查点配体/受体表达之间的潜在关联。通过获得所有TCGA样本中估计的免疫细胞类型频率,将这些频率与不同癌症类型的PD1/CTLA4配体和受体的癌症和基质表达水平相关联(图6d)。该分析揭示了CTLA4基质表达和PDCD1受体表达之间的多重强关联。基质PDCD1表达与不同肿瘤类型的细胞毒性CD8 T细胞水平高度相关,基质CTLA4和PDCD1的表达均与M1/M2巨噬细胞极化相关。CTLA4尤其明显,与M0/M1水平呈强正相关,与M2水平呈负相关(图6e)。免疫细胞类型水平与CD86/CD274配体表达之间的强关联不太常见。癌症CD274表达与所有类型的免疫细胞相关性较差,而基质CD274表达与CD4+记忆细胞水平呈负相关(图6e)。
参考文献: Pan-cancer analysis of ligand-receptor crosstalk in the tumor microenvironment