Nature genetics|胰腺癌转录组表型与基因组突变关联
生信干货
Iris ·2020年5月29日 03:20
今天跟大家分享的是一月份发表在nature genetics(IF:25.455)杂志上的一篇关于胰腺癌转录表型与基因组的文章,其中涉及了非常有代表性的临床数据,值得一看Transcription phenotypes of pancreatic cancer are driven by genomic events during tumor evolution 胰腺腺癌是高度致死性的癌症。大多数患者都患有阶段性疾病,并会在诊断后一年内死于该病。IV阶段尽管被认为具有统一的攻击性,但患者在治疗反应方面存在广泛的异质性。目前尚不清楚如果大多数肿瘤都通过相同的突变途径,临床异质性如何产生。原发性和转移性肿瘤之间有限的突变异质性表明,非遗传机制可能是这种变异的主要来源。但是,大多数针对这个问题的基因组研究都是使用细胞数较低的肿瘤进行的,并且集中于单核苷酸变异(SNV)。与基因组不稳定性相关的突变过程是否会影响胰腺癌临床疾病的异质性尚不清楚。研究进行了COMPASS试验(NCT02750657),招募患者进行基因组分析。患者队列包括IV期疾病,该疾病占胰腺癌患者总数的一半以上,更具有代表性。最新研究证实,胰腺癌的分子分类受基质细胞高度浸润的影响。因此,在不进行细胞纯化的情况下,可能会掩盖肿瘤的表达特征。为了改善肿瘤细胞的基因组分析能力,通过激光捕获显微切割术(LCM)从大量病例中纯化肿瘤上皮。对314例患者的330例LCM纯化的肿瘤进行了全基因组测序(WGS),并对248例肿瘤进行了全转录组测序(RNA-seq)。这项研究代表了对胰腺癌分子亚型的全面分析,使用这些数据来调查这种疾病的临床疾病异质性是否有遗传基础。当前的亚型方案可以识别可切除肿瘤中的预后亚组,但不能识别晚期疾病。利用队列对疾病亚型进行从头重新分类,使用非负矩阵分解(NMF)提取肿瘤特异性表达特征(特征1、2、6和10),并在单细胞数据集中确认这些表达模式,然后将这四个特征的基因用于共识聚类。该队列根据肿瘤NMF特征的基因连续表达分为五个亚型(图1a),并且与肿瘤细胞结构无关(图1a)。然后标记Basal-like-A,Basal-like-B,Hybrid,Classical A和Classical B,将它们与以前的分类模型相匹配(图1b),把每个先前定义的Basal-like和Classical亚型分为两种疾病亚型(图1b)。由于存在多个表达特征(图1a),所有先前的方案都对第五种亚型进行了不一致的分类,将此子集称为Hybrid。然后评估上述亚型的临床疾病阶段,与IV期相比,Classical A / B肿瘤在早期阶段更为常见(图1c,d)。Basal-like-A亚型在可切除疾病中很少见,在局部晚期肿瘤中不存在,占IV期疾病的近四分之一。以前可切除疾病中的Basal-like肿瘤主要由Basal-like-B和Hybrid瘤(图1c)组成。这表明可切除和晚期疾病之间的Basal-like表型是不同的。在不同的临床阶段,肿瘤亚型是不一致的,并且还突出了将IV期肿瘤纳入分子分析的重要性。
二、Basal-like 和Classical亚型在肿瘤内共存为了研究大量RNA-seq的表达特征如何在肿瘤内分布,对15例患者肿瘤(13个可切除,2个转移性)进行了单细胞RNA seq(scRNAseq)。使用阴性细胞选择富集肿瘤上皮,共研究了31,195个细胞。使用建立的谱系标记基因鉴定剩余的免疫细胞,成纤维细胞和内皮细胞,通过谱系抗原鉴定上皮细胞。正常人胰腺的单细胞转录组图谱中的标记基因用于区分正常人和恶性上皮细胞。聚类肿瘤细胞并对其进行Basal-like(特征2和10)和Classical特征(特征1和6)评分。在图2a,b所示的肿瘤中,观察到七个单细胞簇:簇0、1和3含Basal-like特征,簇2、4和6含Classical特征,簇5未显示任何特征的高得分(图2b)。在15个肿瘤中,有13个在同一肿瘤中发现了Basal-like和Classical簇,这些细胞簇通常划分出不同的肿瘤细胞群。成对比较Basal-like和Classical相关的表达特征表明,它们在单细胞水平上呈负相关(图2c)。通过大量RNA序列分析发现了Basal-like特征与上皮间充质转化(EMT)之间的关系。在单个细胞内,EMT与Basal-like特征正相关,而与Classical特征负相关(图2d)。总而言之,Basal-like和Classical表达特征可以在肿瘤内存在,这些特征通常分离到不同的肿瘤细胞亚群,并且EMT和Basal-like表达之间存在相关性。
图2用scRNA-seq追踪Basal-like和Classical相关特征三、SMAD4和GATA6变异在Classical肿瘤中富集接下来分析肿瘤亚型的WGS数据遗传特征,具有同源重组缺陷(HRD)和DNA错配修复缺陷(MMR)的肿瘤被排除在外。通过检查点突变,发现除了TP53或基因网络外,没有其他基因富集在Basal-like-A / B亚型中。基因集富集分析(GSEA)表明,EMT和TGF-β信号传导富集于Basal-like-A/B肿瘤,因此分析SMAD4基因状态,SMAD4基因是TGF-β信号传导的关键参与者。考虑了所有主要形式的遗传突变(即SNV,结构变异(SV),杂合性缺失(LOH),纯合缺失和扩增),在78%的Basal-like-A肿瘤中观察到了完整的SMAD4等位基因。相反,Classical A肿瘤显示出完整SMAD4的最低发生率。根据GSEA的发现,Basal-like A /B肿瘤富含CDKN2A(E2F靶标)和TP53突变(TP53信号传导),然后寻找富含Classical A / B肿瘤的分子畸变。Classical A / B肿瘤的标志是与胰腺谱系分化相关的转录因子上调(HNF1A,HNF4G,GATA4,GATA6,ONECUT2和NKX2-2;图3a),在这些转录因子中,只有GATA6在基因组中被重复扩增(图3b)。此外,Classical A / B中GATA6拷贝数增加的频率显著高于Basal-like-A / B肿瘤(图3c,d)。然后进行了良性邻近组织的RNA原位杂交(RNAish),发现GATA6在导管和腺泡中均高表达。这表明Classical表型是胰腺癌发病机理中的默认分子通路。SMAD4完全缺失和GATA6扩增频率增加与Classical A / B肿瘤相关,而TP53突变和CDKN2A完全缺失与Basal-like-A / B肿瘤相关。为了调查人类肿瘤基因组的高度复杂性是否掩盖了突变KRAS不平衡与肿瘤亚型之间的关系,比较原发性和转移性疾病的基因组复杂性。转移性疾病的基因组倍增频率明显高于原发性肿瘤,与原发性疾病相比,相同的分子亚型在转移性环境中更加不稳定。基因组复制肿瘤通常会丢失其基因组的四分之一,导致总体拷贝数失衡。为了准确定义突变KRAS中的拷贝数失衡并解决转移肿瘤中四倍体的高频率,将患者分为突变KRAS的三种不同等位基因状态:平衡(KRASba)、轻微失衡(KRASmi)、严重失衡(KRASMa)。此外,与转移性Classical A / B肿瘤相比,转移性Basal-like-A / B肿瘤具有KRASMa。在原发性肿瘤中,与阶段匹配的Classical-A / B肿瘤相比,Basal-like-B肿瘤在突变KRAS(KRASmi或KRASMa)中的任何失衡都显著富集。除了KRASMa之外,可能还有多种遗传通路可产生这些表型。然后评估了分离程度不同的突变KRAS不平衡的肿瘤的临床效用。使用实体瘤反应评估标准(RECIST)评估化学疗法的反应,与KRASmi或KRASba相比,具有KRASMa的IV期肿瘤具有更高的化学耐药性(图3e,f)。对于晚期患者,观察到KRASMa患者的总体预后较差(图3g)。在患有KRASmi的晚期患者和患有KRASba的晚期患者之间未观察到总体存活率的差异,这表明,至少部分而言,KRASmi可能阻碍基因组复制。在主要为二倍体的I / II期疾病肿瘤中,突变KRAS失衡的每种状态之间的总体存活率存在差异(图3g右图)。在原发性或转移性疾病中,与KRASmi或KRASba相比,具有KRASMa的肿瘤在基因组上并未更加不稳定。因此,突变体KRAS的不同等位基因状态的分离可以区分具有不同化学疗法反应和结果的患者亚组。
为了研究导致突变KRAS不平衡的突变过程,绘制了该拷贝数畸变的进化轨迹。为了证明该方法的原理,使用了一个肝转移病例(图4a)。Pcsi_0729是一种具有KRASMa的四倍体肿瘤(图4b顶部A段),该区域中的胚系SNP比值表明WT等位基因丢失,导致四个突变体且没有WT复制(图4b底部)。利用片段A上突变的拷贝数,确定了三个不同的突变簇:KRAS突变A,两个拷贝上的突变B和仅一个拷贝上的突变C(图4c)。标记为C的突变是最近的突变,发生在基因组加倍后;标记为B的突变位于拷贝数状态,在基因组加倍之前出现在单个DNA拷贝上(图4d)。标记为A的所有四个DNA拷贝上的突变都发生在两条原始亲本DNA链中的一条上,该两条DNA经拷贝中性LOH,随后进行基因组加倍(图4d)。在这三组突变中,A是最早的突变,由于该肿瘤中没有KRAS WT等位基因,推测它在KRAS突变后消失。然后使用三组突变A–C推断每个进化阶段的分子时间(图4e)。通过将进化轨迹划分为三个不同的阶段,Pcsi_0729花费了69%的分子时间与二倍体平衡的突变KRAS(一个突变体,一个WT)共存,17%的分子时间用于二倍体的KRASmi(两个突变体,无WT)中;在其进化的最后阶段,肿瘤基因组增加了一倍,并获得了KRASMa(四个突变体,无野生型)。为了研究基因组倍增是否驱动KRASMa,将以上分析应用于48个其他肿瘤,这些突变中KRAS失衡是拷贝数变化的一部分。这些肿瘤中有11个带有KRASMa,整体上几乎所有患有KRASMa的肿瘤均为四倍体(图4f-g)。就像在Pcsi_0729中一样,基因组加倍可能会加剧先前存在的轻微失衡,从而产生严重失衡。这一发现表示基因组加倍是胰腺癌进化中KRASMa潜在的关键分子事件。
在队列中,有六个患者样品在不同时间点进行了活检,在四名患者中,肿瘤亚型没有随进展而变化,在进行进展活检时,其基因组几乎相同。在两名患者中,随着进展,观察到肿瘤表型有明显变化。Compass_0003最初呈现为可切除的肿瘤,根据研究方案分类为Hybrid瘤(图5a,b)。该患者未接受辅助治疗,在切除后迅速发展到IV期(肝转移)。为了推断转移的分子亚型,将RNAish用于GATA6。GATA6低至无转移,表明肿瘤表型已变为Basal-like。没有RNA-seq,不能将此肝转移分类为Basal-like-A或B。从两个时间点对肿瘤进行WGS,尽管SNV 、插入缺失或SV的数量没有明显变化,但原发性肿瘤为二倍体,而转移性肿瘤为四倍体(图5c)。大多数的Chr. 12p在原发性肿瘤中处于拷贝中性LOH(拷贝数为2)。在肝转移中,突变体KRAS等位基因的拷贝数为4,表明该等位基因的转移进展已翻了两番。在转移性肿瘤中观察到突变KRAS基因座侧翼的单串联复制。这表明串联复制发生在二倍体克隆中,从而使突变KRAS拷贝数从1增加到2。然后,该二倍体克隆持续了基因组倍增,使突变KRAS拷贝数变为4(图5d)。这种向KRASMa的转变伴随着分子表型向Basal型的转变,将原发肿瘤异种移植,观察到四倍体克隆具有与肝转移相同的串联重复性。这表明这种转移性疾病的起源是原发性肿瘤中的Basal-like KRASMa四倍体亚克隆。第二位晚期患者Compass_0064(图5e,f)在相同放射部位进行化疗之前和之后,对肝转移进行了活检。来自这两个时间点的RNA-seq证实诊断性肿瘤为Basal-like-B,而治疗后肿瘤为Classical A。与Compass_0003一样,肿瘤的倍性发生了巨大变化,诊断肿瘤的倍数与两个基因组倍增一致,而治疗后肿瘤的倍数却只有一个基因组倍增(图5g)。治疗前病变显示为KRASMa(五个突变体,两个WT),但第二个肿瘤是平衡的(KRASba-两个WT,两个WT)。这种从KRASMa到KRASba的转变伴随着亚型的变化(图5h)。总之,在极少数情况下,手术或治疗后肿瘤的分子亚型可能发生变化。这些数据证明肿瘤中持续的基因组不稳定性影响其分子亚型。
文章做了大量的工作,首先对队列使用非负矩阵分解(NMF)提取肿瘤特异性表达特征,根据肿瘤NMF特征的基因连续表达分为不同亚型并标记,与以前的分类模型相匹配,然后评估亚型的临床疾病阶段,得到疾病亚型及其与临床分期的关系。之后为研究RNA-seq的表达特征在肿瘤内分布,进行了单细胞RNA seq。通过基因集富集分析(GSEA)分析肿瘤亚型的WGS数据遗传特征。比较原发性和转移性疾病的基因组来调查突变KRAS不平衡与肿瘤亚型之间的关系。为了研究导致突变KRAS不平衡的突变过程,绘制该拷贝数畸变的进化轨迹。应用RNAish推断转移的分子亚型,并通过活检实验验证原理。总体来讲,研究过程环环相扣,循序渐进,给了我们一个完整的分子亚型分析方案,生信之路,道阻且长啊,高分不易,数据难得,希望各位能勇攀高峰,多发文章~