本文发表在JAMA Oncology,在最近一年的影响因子: 31.777,比上一年增加了 6.978。原发性前列腺癌的管腔型和基底型具有分子特异性,在预测治疗反应方面具有重要的临床价值,但是关于两类亚型在转移性去势抵抗前列腺癌(mCRPC)中未见详细报道。通过回顾性研究634例mCRPC样本,发现管腔型和基底型mCRPC患者的临床响应和分子特征存在相关,尤其是接受雄激素信号抑制剂(ASIs)治疗后。该项研究提示,可以基于mCRPC患者活检样本的病理和分子特征,提示预后以及ASIs治疗的潜在效果。
背景知识:
metastatic castration-resistant prostate cancer (mCRPC):耐去势转移性前列腺癌。
androgen-signaling inhibitors (ASIs):雄激素信号转导抑制剂。
方法思路:
作者使用4个mCRPC队列的数据来评估腔型和基础型从cBioPortal下载了3个队列:Fred Hutchinson Cancer Research Center (FHCRC) (n = 157)【小编介绍:cBioPortal提供了这样一种网络资源:探索,可视化和分析多维度癌症基因组数据。查询交互界面整合用户的数据可以使研究者交互探索不同样本,基因,通路的遗传学上的改变,还可以联系到临床结果。这个网站还提供基因水平的图形总结。多平台的提供网络可视化分析,生存分析,和软件编程入口。直观的网站交互界面使得复杂的癌症基因组为没有学过生物信息学专业的研究者和临床工作者提供便利。】神经内分泌前列腺癌患者的队列来自Weill Cornell Medicine(WCM) (n = 49)。mCRPC 队列来自East Coast Dream Team (ECDT) (n = 266) 作者还从West Coast Dream Team (WCDT)(n=162)队列的扩展中获得了临床、处理过的RNA测序、变异和拷贝数数据。作者首先将基因表达水平转换为每个样本的基因排名,以标准化队列中的基因。然而,一大批效应仍然存在(补充图1A)。因此,作者将经验贝叶斯框架应用于批次校正,该框架能够成功地消除批次效应(补充图1B )。
因为在转移性前列腺癌中缺乏管腔A亚型,以前用于确定原发性前列腺癌亚型的centroid-based的标准方法不能直接应用于mCRPC样本。因此,作者使用所有样本的无监督分层聚类作为一种无偏见的方法【小编介绍:分层聚类(hierarchical clustering): 层次聚类算法按数据分层建立簇,形成一棵以簇为节点的树。如果按自底向上进行层次分解,则称为凝聚的层次聚类, 而按自顶向下的进行层次分解,则称为分裂法层次聚类。凝聚的层次聚类首先将每个对象作为一个簇,然后逐渐合并这些簇形成较大的簇,直到所有的对象都在同一个簇中,或者满足某个终止条件。分裂的层次聚类与之相反,它首先将所有的对象置于一个簇中,然后逐渐划分为越来越小的簇,直到每个对象自成一簇,或者达到了某个终止条件,例如达到了某个希望的簇数目,或两个最近的簇之间的距离超过了某个阈值。
分层聚类的优点:
(1)距离和规则的相似度容易定义,限制少;
(2)不需要预先制定聚类数;
(3)在不同粒度水平上对数据进行探测,可以发现类的层次关系。
哪些情况下使用分层聚类?:
(1)因为层次聚类算法对时间和空间需求很大,所以层次适合于小型数据集的聚类。
(2)在不清楚数据集不清楚聚成几类的情况下,分层聚类可以在不同粒度水平上对数据进行探测,期望能发现类之间的层次关系。】利用构成PAM50签名的典型50个基因的基因表达来识别转移性前列腺癌亚型,已经对乳腺癌、前列腺癌和其他癌症进行了检查。DNA改变和临床数据没有被用于聚类。DNA改变和临床数据没有被用于聚类。层次聚类采用nonsquared Euclidean distance方法和ward.D2聚类方法,实现了Ward聚类准则。根据管腔和基底型标记物表达的增加和降低,识别出的两个簇被识别为管腔型和基底型,这些类别被用于随后的分析。再用GSEA评估腔内样本和基底膜样本中富集的途径。
结果:
【小编解析:生信分析类的文章一般都会有一些固定的思路和行为模式,作者在收集完需要的数据,并做了处理。第一步就是需要确定mCRPC的管腔和基底型亚型,在这里作者先使用层次聚类确定了管腔和基底型亚型。但是怎么去证明这是正确的呢?于是作者都使用了t-SNE来把高维数据压缩到2维空间上来证明算法的有效性。通过视觉直观验证算法有效性。也就衍生出结果一的思路与内容。】
作者收集并分析了4个队列中总共634个mCRPC样本的RNA测序数据。图1A描述了所有样本中PAM50基因的表达。样本的等级聚类确定了两个不同的簇:一个有346个样本(55%)的基底型组,表明基底型标记的表达较高(PTTG1,CDC20,ORC6L,KIF2C,UBE2C,MELK,BIRC5,NUF2,CEP55,EXO1,CENPF,NDC80,TYMS,UBE2T,ANLN,CCNB1,RRM2,和MKI67),管腔组288例(45%)基础基因表达较低,管腔标志物表达较高至混合(ESR1,PGR,BCL2,FOXA1,CDC6,CXXC5,MLPH,MAPT,NAT1,MDM2,MMP11,和BLVRA)。对文献中的管腔和基底型前列腺癌基因进行的基因集富集分析进一步证实,管腔基因在管腔亚型中富集(GSEA,P<0.001)。基底型基因在基底亚型中富集(GSEA,P=0.001)。作者的结果显示,转移性前列腺癌中只有2个不同的簇与管腔A肿瘤的低转移倾向相一致,与原发性前列腺癌中发现的3个簇相反。接下来,作者检查了被归类为小细胞/神经内分泌前列腺癌(SCNC)的样本(96个样本缺少这些数据)。59例SCNC肿瘤中,53例(90%)为基底肿瘤。然后,作者使用了t-distributed stochastic neighbor-embedding (TSNE)图,它降低了RNA测序数据的维度,使得具有相似RNA表达谱的样本在二维图中彼此接近。图1B中的tSNE图确定了不管使用的是哪种非监督方法,两个主要的样本聚类--基底样本和管腔样本--确认作者的分层聚类结果是相似的。然而,沿着管腔-基底轴的分布似乎更连续,而不是两个明显不同的亚群。SCNC肿瘤是沿着这条轴线最基本的肿瘤。大多数被归类为管腔的SCNC肿瘤出现在管腔和基底交界处附近。这些结果提示mCRPC确实存在管腔亚型和基底亚型。
【小编解析:分子特征是癌症生信的一个重要分析思路,也具有最重要的临床意义。结果二中作者根据RNA测序数据富集的通路,以及关键前列腺癌致癌基因和肿瘤抑制基因的突变和拷贝数变化,评估了这两组之间的分子差异。作者使用GSEA来分析通路,并得出结论:雄激素反应途径是管腔型富集最显著的途径。另外,其中关键前列腺癌致癌基因和肿瘤抑制基因的变化建立在如此庞大的数据上,其可信度不言而喻。】
GSEA (Figure 2A和2B)确定雄激素反应途径是管腔型富集最显著的途径,与之前发表的原发性前列腺癌数据和基底细胞癌SCNC一致。
基底型富集最显著的通路为细胞周期和细胞分裂有关,这与增殖基因(如mki67)的表达增加一致。然后,作者检测了前列腺癌中3个最常突变或拷贝数改变的肿瘤抑制基因(PTEN、RB1和tp53)和癌基因(AR、FOXA1和myc)的体细胞突变和拷贝数(Figure 3)。
作者在基底型样本中发现了明显更高的2rb1改变率。PTEN和TP53缺失在两种类型中,无明显差距。在检查主要前列腺癌致癌基因时,作者发现foxa1在基底肿瘤中有显著较高的变化率。与myc相比,AR无显著差异。
【小编解析:生存差异与临床息息相关,也是生信分析与临床相联系的纽带。目前,大多数文章都会使用Cox比例风险模型,或者KM生存曲线来进行生存分析。在这里作者使用Cox比例风险模型分析患者接受了雄激素信号抑制剂(ASI)治疗,比较了管腔亚型和基底亚型之间的生存情况。】
接下来,作者检查了80例ECDT患者和123例WCDT患者的总生存期、亚型和首次活检后治疗。在ECDT队列中检查的所有患者均为紫杉素原,并在活检后接受了一线ASI治疗。在Cox比例风险分析中,ECDT中管腔型肿瘤患者的总生存期优于基底型肿瘤患者,中位总生存期为33.1个月,中位总生存期为18.7个月。在WCDT队列中,有活检后接受ASI治疗和非ASI治疗的患者。在ECDT中,与基底肿瘤相比,腔内肿瘤活检后ASI治疗的总生存期更好,中位总生存期为21.7个月,而基底肿瘤为32.0个月。但在未接受ASI治疗的患者活检后,差异无统计学意义(Figure 4B)。
在腔内肿瘤患者中,作者发现使用ASI治疗的患者生存率明显优于未使用ASI治疗的患者。而在基底部肿瘤患者则不再显著。提示ASI治疗对腔内肿瘤的疗效可能高于基底肿瘤。接受活检后ASI治疗的ECDT患者和WCDT患者的中位总生存期相似。因此,作者合并了2个队列进行Cox比例风险交互分析,并对活检前ASI治疗暴露进行了调整。作者发现与真正的预测性生物标志物相一致,亚型和活检后ASI治疗之间的交互项具有统计学意义。当作者对早期ASI治疗的队列进行亚组分析时,在从未接受过ASI治疗的患者中,腔内肿瘤患者比基底肿瘤患者有更好的总生存率。然而,当作者检查之前接受ASI治疗的患者时,腔内肿瘤和基底肿瘤之间的差异消失了。
【小编解析:作者下载的数据分析中还有633名患者中有关于转移部位的信息。作者开发一个相似性评分,发现活检部位的luminal-basal评分有显著差异(补充图2)。】
在所有4个队列的633名患者中有关于转移部位的信息。
在进一步的两两比较中,与原发部位的样本相比,淋巴结样本中lumal -basal评分显著增加,表明更基底样的样本。这一结果与作者的发现一致,即基底亚型具有更强的侵袭表型。FHCRC队列是一个快速尸检队列,对每个患者的多个肿瘤部位进行了分析。这个独特的数据集允许对亚型的个体内变异进行分析。Figure 5描述了FHCRC队列患者之间和患者内部的luminal-basal评分的变异性。42例患者中只有7例(17%)同时存在腔内和基底型肿瘤,这表明这些亚型在个体患者中相对稳定。
本文小结:
这些发现代表了迄今为止对mCRPC样本进行的最大的综合临床、转录组学和基因组分析,并且是基于肿瘤分子信息更好地为mCRPC患者提供个性化治疗的重要一步。