Cancer Cell|转移性结直肠癌的整合组学研究
生信干货
Leyla ·2020年10月29日 23:39
今天跟大家分享的是八月份发表在Cancer Cell杂志(IF:26.602)上的一篇文章Integrated Omics of Metastatic Colorectal Cancer,本工作整合了来自146例中国结直肠癌患者的480个临床组织的基因组学、蛋白质组学和磷酸化蛋白质组学数据,并使用蛋白质组学数据识别出具有不同的临床预后和分子特征的三种亚型。激酶网络分析显示,原发结直肠肿瘤与其转移之间存在显著的异质性,异种移植的药物测试显示来自同一个体的原发肿瘤和转移瘤对同一药物可能表现出不同的反应。

本工作整合了来自146例中国结直肠癌(CRC)患者(其中70例为转移性CRC ,即mCRC)的480个临床组织的基因组学、蛋白质组学和磷酸化蛋白质组学数据。蛋白质组学分析区分了三种CRC亚型,其特征是不同的临床预后和分子特征。单独的原发性肿瘤的蛋白质组学和磷酸化蛋白组学分析成功地区分出了转移的病例。转移组织与原发肿瘤在基因而非蛋白质组水平上表现出高度的相似性,而激酶网络分析显示,在原发结直肠肿瘤与其肝转移之间存在显著的异质性。31例原发性和转移性肿瘤的体内基于异种移植的药物测试显示出个体化响应,这也可以通过激酶-底物网络分析预测,无论肿瘤是否携带药物靶向基因突变。本工作的研究为更好地理解mCRC提供了一个有价值的资源,具有潜在的临床应用价值。样本来源于上海长海医院结直肠外科接受结直肠癌手术的中国结直肠癌患者(样本集简称CCRC)。临床材料也来源于该医院,包括已建立的miniPDX模型。使用QIAGEN公司的QIAamp DNA迷你试剂盒从肿瘤或血液样本中提取基因组DNA。然后进行全基因组测序,使用合格reads进行体细胞突变检测、微卫星不稳定性预测和体细胞拷贝数改变(SCNA)分析。使用 MSIsensor来评估微卫星不稳定状态。采用非负矩阵因子分解(NMF)方法来推断CCRC样本中146例原发肿瘤的突变特征。新检测到的突变特征也与30个已知的COSMIC癌症特征进行了比较。了消除由基线人口统计学和临床因素引起的CCRC和TCGA数据库中患者的选择偏倚,使用倾向性评分匹配来平衡两个数据集。用多变量logistic模型来拟合诊断年龄、性别、AJCC分期和转移情况等临床病理基线特征,logistic模型采用最近邻算法和一对一匹配。计算算法采用R包MatchIt。使用 R包sequenza的默认参数来分析体细胞突变的BAM文件,Sequenza基于概率模型计算等位基因特异性拷贝数分布。使用Genomic Identification of Significant Targets in Cancer(GISTIC)来识别样本的基因水平SCNAs和显著的SCNAs。log2比值cut-off±0.3来定义SCNA的扩增和缺失。使用Illumina Infinium MethylationEPIC array BeadChip Kit来生成甲基化谱。分析了32个原发肿瘤的MLH1高甲基化样本。探针水平的“高甲基化”样本定义为z-score 标准化beta值> 1。如果超过一半的MLH1探针被标记为高甲基化,则该样本在基因水平上被鉴定为高甲基化。使用Kaplan–Meier方法生成生存曲线,使用 log-rank检验来计算曲线差异,使用R包survival来进行多变量生存分析7. 识别差异突变、拷贝数变异、蛋白质和磷酸化位点使用Chi’square检验识别差异突变,使用双侧Student’s t 检验来识别原发性和远端正常组织,或mCRC和非mCRC原发性组织之间的差异拷贝数、蛋白和磷酸化位点。采用ANOVA分析检测mCRC患者三种蛋白组亚型或四种组织间的差异SCNAs和蛋白。在基于亚型的网络中,使用PhosphoSitePlus(PSP)或NetworKIN 3.0计算每对激酶和底物的Pearson相关系数。对于基于单样本的网络,根据每个激酶和磷-底物对之间的相关性,按照上述方法构建激酶和磷-底物边的特征。为了在体内快速测试药物疗效,建立了微型患者衍生异种移植模型(MiniPDX model)。用已发表的公式计算肿瘤细胞生长抑制率(TCGI)(%)为了寻找药物反应相关特征并建立预测模型,将31个miniPDX模型分为两个数据集。配对的18个模型作为训练数据集,其余13个独立的模型作为测试数据集。弹性网(EN)算法具有从大量特征和相对少量样本中创建简洁模型的能力,已在多个研究中成功地用于建立药物敏感性预测模型。建立每种药物的弹性网络回归模型,然后计算预测药敏值与检验药敏值之间的Pearson相关系数,以评估预测效果。在146例CRC患者的原发性肿瘤中,中位值为107个非同义、体细胞、单核苷酸变异和7个插入或缺失,与TCGA CRC样本的结果相似。该样本中最常见的癌症相关突变为APC(65%)、TP53(64%)和KRAS (32%)(图1A)。临床病理特征将CCRC样本与TCGA或MSK CRC样本(来自Yaeger et al.,2018)区分开(图1B)。与TCGA CRC数据集相比,CCRC中mCRC患者比例较高(图1B)。CCRC中BRAF和PTEN突变的频率明显低于西方数据集(图1C)。考虑到CCRC样本与TCGA样本在人口统计学上存在差异,且包含更多晚期病例和更多直肠疾病病例(图1B),对两组患者的临床特征进行倾向性评分匹配(PSM),以进行基因组特征比较。为了识别与转移相关的基因,比较了来自CCRC样本的非mCRC和mCRC的基因组改变频率。与非mCRC相比,mCRC原发肿瘤的突变负荷降低(图1D),这在非高突变的CRC病例中也可以观察到。在CRC中最常见的突变基因中(图1C),只有SMAD4在mCRC患者的原发性肿瘤中突变率显著高于mCRC患者;XIRP2在mCRC患者的原发肿瘤中也显著高富集(图1E),XIRP2据报道与乳腺癌进展相关。然后进一步应用非负矩阵分解来提取突变特征。在mCRC和非mCRC原发肿瘤中,最常见的体细胞拷贝数改变(SCNAs)没有明显差异。然而,与非mCRC患者相比,mCRC患者的原发肿瘤表现出了更多的多克隆结构(图1F),说明mCRC在原发肿瘤组织(T)的转移概率。接下来对原发肿瘤和远端正常组织(N)之间的2440个差异表达蛋白进行了一致性聚类。在146例CCRC原发肿瘤中,发现了3个一致性类(CCs)(图2A)。CC1的特征是RNA加工和DNA错配修复(MMR)的增加。细胞外基质(ECM)-受体整合、细胞黏附和免疫相关通路的上调蛋白在CC2中富集。CC3富集了上调的DNA复制和代谢通路。除术前治疗外,临床病理特征差异无统计学意义,可能是由于CC2和CC3中mCRC的轻度富集。三种亚型均有不同的无复发生存率(图2B),多因素分析调整肿瘤分期和术前治疗后,分型仍然是独立的预后因素。此外,与CC1和CC2亚型的mCRC患者相比,CC3亚型的mCRC患者无复发生存概率也最差(图2C)。CC3中升高的蛋白主要与柠檬酸循环、氧化磷酸化和代谢通路有关。然后在这三种亚型中识别差异突变基因或SCNAs。发现基因差异突变在CC3和直肠癌中显著富集(图2E),这与亚洲人群中CRC的肿瘤定位一致。重叠基因在CC3亚型中,SCNAs显著缺失,蛋白表达上调(图2D,2E)。然后检查了具有差异SCNAs 和蛋白丰度的相关性(图2D),与CC1和CC2相比,大多数SCNA基因在CC3中缺失更多,而CC3中的蛋白表达水平更高。CC2中下调的蛋白在DNA MMR通路中富集,但与微卫星不稳定性(MSI)状态无明显相关性(图2A)。与一般报道的MMR蛋白不同,本工作发现PCNA、RFC1、RFC3、RFC4和SSBP1 MMR通路蛋白在CC2中较其他亚型存在差异富集和下调(图2F)。选择32个样本进一步研究驱动MMR的机制,发现RFC3和SSBP1的甲基化水平与其编码蛋白的表达呈显著负相关(图2F)。这些结果表明,CC2亚型具有独特的、非典型的与蛋白模式相关的表观遗传特征。由蛋白质组数据确定的亚型与之前CPTAC蛋白质组数据和CMS分类研究的亚型一致(图2G)。
图2. CCRC的蛋白质组分型和每个亚型的临床意义
3. 磷酸化蛋白组学特征区分mCRC与Non-mCRC在蛋白质组分型中,三种亚型在mCRC或非mCRC患者中均未显著富集(图2A)。发现1487个磷酸位点在原发肿瘤和N中有差异表达。使用一致性聚类的方法,用这些不同的磷酸化位点来确定每个CC的子类。发现在每个蛋白质组亚型中,磷酸化蛋白质组数据将原发性肿瘤与mCRC和非mCRC区分开来,产生六种磷酸蛋白质组亚型的分类(图3A,3B)。SC1、SC3、SC5在mCRC中富集,而SC2、SC4、SC6在非mCRC中富集。接下来进行了功能富集分析,发现SC1、SC3和SC5中高表达的磷酸化蛋白在焦点粘连和粘附连接通路中富集(图3C)。相比之下,在SC2、SC4和SC6中上调的磷酸化位点在各亚型之间的功能更相似,并且在ERBB2信号通路、子宫内膜癌、抗原处理和递呈以及Fc gamma R-介导的吞噬通路中富集(图3C)。基于PhosphoSitePlus提供的激酶-底物关系发现,在SC1、SC3和SC5中,激酶和磷酸化位点的相关性大多为负相关,而在SC2和SC4中,正相关增加(图3D)。具体来说,SC6具有激酶与底物负调控的特点,说明CC3中的非mCRC更像预后不良的mCRC(图3E)。分析显示,在CC3中,磷酸化蛋白质组数据也可以区分原发性mCRC和非mCRC肿瘤。
对于mCRC,无论MSI状态如何,在原发肿瘤和转移瘤中观察到突变谱的高度一致(图4A,4B)。虽然原发肿瘤倾向有更多独特的突变,但在假定的驱动基因或既往研究的mCRC数据集的突变中没有观察到明显的差异(图4C)。此外,最频繁突变的SCNAs在原发肿瘤和转移瘤之间没有表现出差异(图4D),而转移性mCRC肿瘤与原发肿瘤相比,表现出更大的单克隆比例(图4E)。这些结果表明转移性肿瘤来自原发肿瘤或来自同一祖先克隆。然而,转移性肿瘤的蛋白质组分析显示与原发肿瘤有明显差异。具体来说,转移性肿瘤与正常组织以及原发肿瘤相比,有更多的上调蛋白(图4F)。这些差异表达的蛋白清楚地区分了转移组织和原发组织(4G)。转移性肿瘤中上调的蛋白与ECM-受体相互作用、药物代谢、焦点粘连和紧密连接相关(图4H),而转移性肿瘤中下调的蛋白在代谢通路、脂肪酸降解、柠檬酸循环和氧化磷酸化中富集(图4H)。
接下来,重点研究了42例mCRC,包括了四种组织类型[N、P(癌旁组织)、T和LM(远处肝转移组织)]。其中CC1、CC2、CC3分别为10例、21例、11例。在个样本汇中,计算了所有四种组织在每两对匹配的磷酸化位点丰度与蛋白质丰度之间的Pearson相关系数,得到了42例mCRC病例的一系列相关系数。发现,在所有CC亚型中,相关性均呈双峰分布,并明显向正值偏移。使用方差分析识别了在三个CC亚型之间显著差异的954个磷酸化位点-蛋白两两相关关系。发现CC2表现出更多的负调控相互作用,而CC3和CC1则表现出更多的共变异。954个成对的磷酸化位点-蛋白相关性可以区分所有42例mCRC病例的三种蛋白质组亚型(图5A)。954个磷酸化位点-蛋白对可分为三个类:CC1阴性(CC1neg)、CC2阴性(CC2neg)和CC3阴性(CC3neg)。Metascape分析显示三类中的酸化位点-蛋白对对应的蛋白富集的通路。利用超几何分布,进一步将实验验证(Hornbeck et al., 2015)的或预测的(Horn et al., 2014)激酶-底物对映射到CC1neg、CC2neg和CC3neg类。CC3neg成员的激酶数量最多,三个类没有共同的上游激酶,表明了三个类之间激酶-底物网络的多样性。使用MCODE复合/子网分析方法,发现了五个关键的磷酸化位点-蛋白的共变异MCODEs(图5B)。在mCRC的多个组织中,凋亡、网格蛋白介导的内吞作用、有丝分裂前中期和HDAC I类通路是前四位协同作用的MCODEs。注意到TP53的转录调控(图5C)和LKB1通路(图5E)是最高的CC1neg或CC3neg特异的 MCODEs。mRNA剪接复合体是CC2neg类中最大的MCODE(图5D)。在CC3neg类LKB1通路中(图5E),PRKACA和PRKAA1这两个激酶也确认为MCODE成员。大多数激酶在三个CCs的MCODE中不共享。在MCODE 1细胞凋亡的CC3neg类中发现了四种激酶的七个位点。PRKCD-S304和MTOR-S1166及其相应蛋白在CC各亚型中表达差异显著,且在三个CC中均表现出差异蛋白或磷酸化位点表达谱(图5F)。发现表明,在一个病人的多个组织中,磷酸化位点-蛋白的关系表现出与蛋白质组亚型相关的明显特征。
考虑到蛋白激酶已开发为癌症治疗的可行药物靶点,接下来通过与N的比较,根据每个CC亚型中mCRC原发组织和转移组织中不同富集的磷酸化位点来推测激酶活性。发现不同的CCs对不同的激酶富集,同一CC的原发组织和转移组织对同一激酶表现出不同的活性(图6A)。对于具有可量化蛋白水平和临床可操作药物的激酶,分析了42对mCRC N-T或N-LM组织中相应的磷酸底物丰度(图6B和6C)。将定量蛋白质组数据与PhosphoSitePlus或NetworKIN 3.0结合,共发现251对激酶磷酸底物。在每种蛋白质组亚型中,原发性肿瘤和转移瘤之间的激酶-磷酸底物网络也存在显著差异,而且CC3网络与CC1的相似性大于与CC2的相似性(图6D)。为了进一步探索mCRC患者的药物反应,在31个miniPDX模型上对三种激酶抑制剂(afatinib、gefitinib和regorafenib)进行了药理学试验,其中包括9对原发转移瘤和13个其他原发瘤(图7A)。通过抑制肿瘤细胞生长,测量了每种肿瘤对每种药物的药物反应,并确定来自同一个体的原发肿瘤和转移瘤对同一药物可能表现出不同的反应(图7B)。
接下来探讨了激酶-磷酸底物网络和药物敏感性之间的关系。首先基于先前报道的方法构建了组织特异性激酶-底物网络。然后构建了基于1696个边的强度特征的弹性回归模型,用于预测药物反应。18个肿瘤组织和相应的药物测试结果作为训练集,其余的13个模型作为验证集。值得注意的是,所有三种激酶抑制剂的预测和观察到的TCGIs之间都有很高的相关性(图7C)。弹性网分别选择了21、17和21对激酶-磷酸底物边的特征用于预测药物对afatinib、gefitinib和regorafenib的反应(图7D和7E)。大多数选择的特征与afatinib敏感性呈负相关,而regorafenib敏感性与相应的激酶-磷酸基特征呈正相关(图7D和7E)。这些结果表明,激酶-磷酸底物网络在预测mCRC患者的药物敏感性方面具有强大的潜力。
本工作整合了来自146例中国结直肠癌患者的480个临床组织的基因组学、蛋白质组学和磷酸化蛋白质组学数据,并使用蛋白质组学数据识别出具有不同的临床预后和分子特征的三种亚型,结果显示CC3亚型的mCRC患者无复发生存概率最差。接下来使用磷酸化蛋白质组数据将原发性肿瘤与mCRC和非mCRC区分开来,产生六种磷酸蛋白质组亚型的分类。接下来分析了原发和转移瘤的特征,发现突变谱的高度一致,但蛋白质组分析显示有明显差异。然后识别了五个关键的磷酸化位点-蛋白的共变异MCODEs。激酶网络分析显示,原发结直肠肿瘤与其转移之间存在显著的异质性,异种移植的药物测试显示来自同一个体的原发肿瘤和转移瘤对同一药物可能表现出不同的反应。激酶-磷酸底物网络在预测mCRC患者的药物敏感性方面具有强大的潜力。