肿瘤微环境研究一直是肿瘤研究的热点,一些研究发现肿瘤微环境可能会影响结直肠癌的分类及药物敏感性。因此,今天小编要和大家分享的是今年2月份发表在npj Precision Oncology(IF:8.25)杂志上的一篇将肿瘤微环境与耐药相结合分析的文章,最终作者识别出了预测结直肠癌患者化疗耐药的肿瘤微环境特异性基因表达特征。肿瘤微环境加耐药又一个癌症分析新思路,小伙伴们一起get起来吧!
A tumor microenvironment-specific gene expression signature predicts chemotherapy resistance in colorectal cancer patients
预测结直肠癌患者化疗耐药的肿瘤微环境特异性基因表达特征
Jing PMID: 33580207 2021/02/12 npj Precision Oncology(IF:8.25)
一、研究背景
研究已经发现结直肠癌(Colorectal cancer, CRC)是一种异质性很强的疾病,它具有独特的分子发病机制、组织发生和药物敏感性。此外,也有研究表明,肿瘤微环境(TME)与结直肠癌(CRC)的药物敏感性和分类密切相关。然而,目前使用TME特异性基因特征来识别具有独特临床相关性的CRC亚型的分析比较少。因此,今天小编和大家分享的文章将肿瘤微环境与耐药相结合,来对结直肠癌患者进行分型及多角度分析。
二、研究数据及方法
1. CRC数据收集和候选基因选择:作者从TCGA及GEO收集公开数据集。使用GSE39395、GSE39396和GSE62080三个数据集构建SFM特征。研究中使用五个scRNA-seq数据用于SMF验证,包括CCR的GSE81861,HNSCC的GSE103322,黑色素瘤的GSE72056,以及BRCA的GSE75688。此外,研究中也使用了一些数据集探索药物反应,包括合并GSE19860, GSE28702和GSE69657分析FOLFOX反应;用GSE104645和GSE72970分析FOLFOX或FOLFIRI反应;以及使用GSE5851和PRJEB34338对cetuximab的反应进行分析。接下来利用GSE39395、GSE39396和GSE62080三个数据集进行差异表达分析,构建了可区分TME并与FOLFIRI敏感性相关的SFM特征。在GSE39395和GSE39396中,使用FACS分别从8个和6个样本中分离了细胞亚群。GSE62080数据集包含9个FOLFIRI应答者和12个无应答者的转录组数据。作者也对GSE39395和GSE39396的两个细胞群进行了差异表达分析。GSE39396也采用了类似的策略。对于GSE62080,直接在FOLFIRI有应答者和无应答者之间进行差异表达分析。最后,将这三个数据集之间的差异表达基因取交集,进一步称为SFM基因特征。GSE39582由566个CRC样本组成,作为发现数据集。为了构建大数据集进行验证,将GSE14333、GSE17536、GSE17537、GSE33113和GSE37892作为一个单元,即5个GEO batch数据集。另外,作者直接从CRCSC下载了577份TCGA CRC基因表达谱。这个TCGA数据被用作第二个验证数据集。另53例CRC样本来自仁济医院。研究中的临床数据直接从相应的GEO网站下载或相关文献的补充资料获取。TCGA CRCs的临床信息从数据库CRCSC中下载,免疫相关特征从最近的一项公共研究中下载。
2. 使用K-means聚类算法识别SFM亚型:作者首先在SFM的基础上,利用K-means聚类算法对GSE39582数据集进行SFM亚型识别。在这些聚类中,k = 6是最好的。然后作者评估了SFM亚型间的相似性和表达差异。为了验证SFM亚型的鲁棒性,作者进一步在验证数据集中进行了相同的分析。
3. SFM亚型的功能及通路富集:为了发现SFM亚型间的信号通路异常,作者对每个SFM亚型与发现队列中的其他亚型进行了差异表达分析,并选择2000个上调和下调表达的基因在每个SFM亚型中进行进一步分析。即将这些基因应用于ClueGO和CluePedia插件。这两个插件可以提取一组基因的非冗余生物信息。研究采用Cytoscape对基因肿瘤学(GO、BP、CC、MF、免疫系统过程)和KEGG进行功能富集分析。
4. NTP 实现及特征应用:使用GenePattern执行基于NTP的分类。NTP采用最近邻方法计算基因表达谱与参考基因表达特征的相似性。然后通过对基因空间进行随机子抽样来评估相似性系数的零分布。最后,将由给定基因特征得到的相似系数与零分布进行比较。接下来作者也评估了SFM亚型与一组基因特征的关联。来自以前发表的论文的基因特征列表为:肠道干细胞特征、结肠隐窝特征、锯齿状CRC特征、EMT特征、FOLFIRI应答特征、FOLFOX应答特征和VEFG/EGFR抑制剂特征。
5. 细胞浸润评估:研究使用CIBERSORT算法来估计CRC样本中的免疫细胞浸润。此外,作者还使用微环境细胞群(MCP)计数算法来估计基质细胞和内皮细胞的比例。
6. 生存分析:研究中生存分析采用Kaplan-Meier算法。采用log-rank检验计算SFM亚型间差异的P值。Cox比例风险回归构建单变量和多变量Cox模型。
7. 单样本基因集合富集分析:在本研究中,作者采用了ssGSEA在3个数据集中评估了SFM亚型的EGFR基因集活性。EGFR基因集由EGFR通路相关的配体或受体组成。此外,作者还在4个单细胞数据集中对TGF -beta应答、耗竭的T细胞、热肿瘤、IPRES特征和SFM基因特征等进行了类似的分析。
8. Oncotype DX:基于12 mRNA的Oncotype DX结肠癌复发评分是基于1851例II期和III期结肠癌的转录组数据建立的。它已经被认为是CRC的一个独立预后因素。为了证实SFM亚型的预后价值,作者提出在单因素和多因素Cox回归模型中,将SFM亚型Oncotype DX与DFS联系起来。结果发现所有病例证实了Oncotype DX与DFS的相关性。
9. 采用PathSeq算法进行微生物检测:PathSeq算法可以根据人体组织RNA测序和WGS的深度测序数据来识别微生物。通过PathSeq方法,作者获得了429份CRC样本中1093个微生物的相对丰度,其中415个样本进行了SFM亚型注释并进行分析。
三、研究的主要内容及结果
1. 与TME相关的化疗耐药基因特征
在文章的第一部分,作者对TME相关的化疗耐药基因特征进行了分析。研究共纳入2269例结直肠癌患者的整体基因表达谱。作者首先确定了涉及FOLFIRI应答的896个探针集,接着识别了在TME成分中具有显著区别性表达的基因。将差异探针重叠后,获得了317个探针,它们与250个独特基因相对应(图1a),并将此基因特征称为“与FOLFIRI耐药和微环境相关的特征”(SFM)。为了证实SFM特征可以区分TME,作者将SFM特征应用于4个scRNA-seq数据集。结果t-SNE图显示,在所有4个scRNA-seq数据集中,SFM形成了对应于不同细胞类型的不同簇,表明SFM具有普遍的分辨TME的能力(图1b-e)。此外,作者还发现不同来源的恶性细胞也能形成不同的簇,而非恶性细胞无论来源如何都能聚集在一起,这表明正常细胞的SFM表达在患者间没有很强的异质性。接下来,研究评估了9个发表的基因特征与SFM的重叠,发现其中一些基因特征有很大的重叠(图1f)。然而,SFM与其他基因特征的重叠非常有限(图1 g)。
2. CRC亚型的k-均值聚类
这一部分作者检验SFM是否能够对CRC亚型进行分类,使用k-means聚类算法对发现数据集(GSE39582)使用SFM进行分类。确定了6个亚型,并将其称为从SFM-A到SFM- F的CRC SFM亚型。并对SFM分类的鲁棒性在其他队列验证。可以观察到,在三个大数据集中,每个亚型的比例是相似的(图1h)。
3. SFM亚型的主要特性
接下来作者刻画了SFM亚型的主要特性。分析发现SFM亚型与独特的临床病理、分子和表型特征以及基因特征和信号通路的特异性富集有关,例如可以发现在每个SFM类中II和III阶段的比例高于I和IV阶段(图1i);SFM - E和SFM-F中IV期比例较高;TP53在SFM-B和SFM-D中突变频率更高,而KRAS突变多发生在SFM-A中等。在致癌突变方面,作者进一步聚焦TCGA数据集中的95个CRC驱动突变,发现SFM-C和SFM-D有超过7个驱动基因突变的样本比例更高。SFM亚型中有53个基因突变状态存在显著差异。接下来作者利用先前报道的基因特征,基于NTP算法来识别SFM亚型的细胞和前体起源。此外,作者还分析了每个SFM亚型中异常调节的信号通路。对每个SFM亚型的2000个上、下调基因进行分析。
4. SFM亚型预测化疗反应
在这一部分作者对SFM亚型预测化疗反应进行了分析。由于SFM特征与来自GSE62080的FOLFIRI敏感性相关,作者首先在GSE62080数据集中使用SFM特征进行K-means聚类,以检验SFM亚型是否与药物反应相关。结果显示,21例GSE62080病例可分为四种SFM亚型(图2a)。分析发现SFM-E和SFM-F对FOLFIRI均有应答。SFM-A和SFM-B对FOLFIRI均有抗性。为了全面比较SFM亚型之间的药物反应差异,作者使用NTP算法将先前的药物基因特征应用于基因表达谱,包括FOLFIRI、FOLFOX和血管内皮生长因子(VEGF)或表皮生长因子受体(EGFR)抑制剂。结果发现SFM亚型间药物敏感性差异显著(图2c)。此外,作者发现大多数SFM-A和SFM-B显著性与EGFR抑制剂相关(图2 c),其他药物也可观察到类似的结果。接下来作者纳入KRAS野生型样本,以进一步验证西妥昔单抗对SFM亚型的敏感性。结果再次发现SFM-A-B-E可以预测西妥昔单抗的反应(图2d)。此外,一些与EGFR通路活性相关的基因被认为与西妥昔单抗反应有关。同样,该特异性基因集在SFM-A-B-E亚型中表现出较高的表达(图2e、f)。总之,这些发现表明,无论KRAS表型如何,SFM亚型都具有西妥昔单抗应答的预测价值。
5. SFM亚型中不同的TME
由于SFM特征可以区分TME,作者这一部分比较了SFM亚型之间的TME。首先,作者利用CIBERSORT方法研究了SFM亚型间的细胞组分。结果发现SFM亚型显示不同的免疫细胞的数量(图3)。研究也发现SFM-C-F中检查点生物标志物高表达,包括CD274、PDCD1和CTLA4(图3l,n)。这表明SFM-C-F具有抑制T细胞的作用。SFM-C和F均为热性肿瘤,对IFN-γ反应有应答(图3o, p)。而SFM-F富含天然抗PD1抵抗(IPRES)基因特征(图3q, r),表现出较高的IPRES评分,这意味着SFM-F具有免疫治疗无应答的特征。以上结果表明,虽然SFM-C和-F对T细胞具有抑制作用,但它们对免疫治疗的反应不同。这可能是因为SFM-C富集MSI表型,免疫抑制剂可阻断免疫抑制,而SFM-F富集基质/EMT表型,也可导致免疫抑制,但免疫抑制剂不能逆转。
6. SFM亚型是CRC的独立预测因子
这一部分作者检测了SFM亚型与生存的关系,以检验其预后价值。结果发现SFM亚型与DFS或OS显著相关(图4a-d),且SFM-E和SFM-F的预后较差。作者将SFM-E和SFM-F作为一个单独的高危组与其余4个进行对比来证实这一点,结果二分类器如预期的那样显示出很强的预后价值。此外,作者根据现有的放化疗信息划分发现SFM亚型在非放化疗患者中具有显著的预后价值,但在放化疗患者中没有。接下来作者使用二元分类器进行类似的分析,发现非放化疗患者中高危组预后更差,而放化疗组没有。由于Oncotype DX复发率评分被认为是结肠癌的预后分类器,作者在联合数据集中评估了其预后价值,然后比较SFM亚型与Oncotype DX分类器的亚型比例,结果发现,经Oncotype DX分类器识别的多数高危病例和中危病例可归为SFM高危组(图4 g,h),这表明SFM亚型具有良好的预后价值。此外,在单变量Cox回归分析中,大多数分类器至少有一个具有显著差异的亚型,然而,当对每个分子亚型进行多变量Cox回归分析时,根据年龄、性别等进行调整,SFM、CMS、CCS亚型仍有显著差异。CCS3亚型有最强的预后价值,其次是SFM-F和SFM-E。
7. SFM亚型间不同的肠道微生物组模式
最后作者分析了SFM亚型间不同的肠道微生物模式。作者在TCGA队列中执行了PathSeq算法。在415个CRC亚型注释的病例中,获得了物种水平上1093种微生物的相对丰度值,发现几乎每个SFM亚型都有不同的细菌群落(图5)。
这篇文章的主要内容就介绍完了,总结一下,分析中作者结合多个公共平台数据,构建了一个新的CRC分类器,将其分为6个分子亚型,这个SFM特征能够区分TME,并与药物反应相关。此外,这种基因特征可以解析CRC的异质性,而这些SFM亚型有助于提高CRC的精准治疗。总的来看,研究对多平台大样本的结直肠癌样本进行分析,聚焦肿瘤微环境与耐药特征进行纯生物信息分型分析,这种将肿瘤微环境与耐药相结合的研究角度及涉及到的分析方法,小伙伴们可以学习参考呦。