导读:
癌症之间都有共同的特征,但癌症这种疾病没有特效药。在识别肿瘤的动态发生以及肿瘤的诊断、预后和治疗中,不同癌症类型之间的差异和相似之处的研究提供的信息至关重要。我们现在知道癌症在起源和基因改变方面都有很大的不同。与此同时,关键驱动基因突变、通路改变、免疫和微生物特征等方面存在共性。随着大家越来越重视针对癌症间共性的治疗方法。作者在这里总结了泛癌研究的各个方面,并介绍它们如何推动个性化医学的进展。
文献阅读:
临床迫切需要确定分子生物标记物和药物靶点,这促使我们探索癌症进展、转移和复发以及与治疗耐药有关的基因。泛癌症分析可以精确描述单一癌种的基因和多种癌症相关的基因。泛癌研究需要足够大的队列来进行有统计意义的分析。在早期的泛癌研究中,科学家们确定了ARID1A、TP53、KRAS、PIK3CA和PTEN是许多不同癌症类型中最频繁突变的基因。随着TCGA和其他项目的扩大,泛癌症分析的范围和力量也越来越大(图1)。驱动基因的数量达到299个成员。TP53在27种癌症中扮演着重要角色。PIK3CA、KRAS、PTEN和ARID1A也是重要的驱动基因,每种都至少与15种癌症有关。另外,泛癌全基因组分析(Pan-Cancer Analysis of Whole Genomes , PCAWG)增加了研究非编码突变的能力,揭示了PGR、ERBB4和PTPRD中频繁突变的3‘非翻译区(图3)。同样,儿科癌症的驱动基因呈Pareto-like分布,其中TP53再次位居榜首,其次是H3-3A、ATRX和CTNNB1。作者认为,虽然大多数高频的泛癌基因已经被识别出来,如TP53和PIK3CA,但仍然有大量的低频基因有待发现。
Hoadley等人将12种癌症分成11个亚型,其中只有5个亚型起源于同一组织,后续的COX分析提示不同亚型的生存和预后不同。在TCGA中,将这些分析扩展到33种癌症类型,得到了28种分子亚型(图2)。肿瘤类型可分为四个系统:pan-gynecological,pan-squamous, pan-gastrointestinal和pan-kidney,其中最多样化的类别可以涉及25种肿瘤类型。通过PCAWG,将这种亚型分析方法应用到转移性实体肿瘤,建立不同癌症类型之间的联系。泛癌方法还便于对特定器官中的癌症亚型进行直接比较。举个例子,肾透明细胞癌(KIRC)和乳头状细胞癌(KIRP)分别起源于近端肾小管和较远端肾段。然而,分子研究表明,KIRP与KIRC和肾脏近端小管有高度相似的基因表达特征,这暗示了两者共同起源于近端小管。KIRC和KIRP的突变和转录特征与肾嫌色细胞癌(起源于远端肾单位)的突变和转录特征不同。这些例子表明,基于起源和组织病理学的传统癌症分类可以通过分子特征来修改和改善(图2-4)。当然,目前泛癌研究还有不足,如样本量在不同肿瘤之间分布不平衡;一些样本处理方式,如福尔马林和树脂包被也可能会对检测造成影响。样本的纯度也会影响检测的准确性。
体细胞发生突变的特征在癌变的过程中发挥重要的作用。外源性的致癌因素和内源性的缺陷都可以导致突变在细胞内积累。外源性因素,如吸烟或紫外线(UV) 。内源性缺陷,如DNA错配修复(MMR)或APOBEC酶。如在皮肤癌中,紫外线促进了嘧啶二聚体的产生,而且是以 C>T为主导的突变。而烟草中的多环芳香烃则常造成C>A突变,这种特征在肺癌、头颈部肿瘤中被发现。内源性DNA损伤修复和MMR缺陷相关的突变特征强调了基因组稳定性会增加患癌症风险。例如,肿瘤抑制基因BRCA1和BRCA2参与了基于同源重组的DNA双链断裂修复。具有BRCA1和/或BRCA2突变的癌症会在双链断裂点出现大量的微同源缺失。这些突变及其相关特征在乳腺癌、卵巢癌和胰腺癌中显著存在,携带有此类突变的肿瘤对PARP抑制剂有较好的抗肿瘤应答。相反,MMR这一组基因的缺陷会导致微卫星不稳定性(MSI)突变特征。在癌症中,MMR缺陷和高MSI会导致新抗原的增加有关,从而增强了使用免疫检查点阻断的免疫治疗的效果。MSI在结直肠癌、子宫内膜癌和胃癌中最为常见,但MSI阳性存在于十多种癌症中。这可能与频繁的细胞更替有关,而在与紫外线或者芳香烃相关的肿瘤中MSI则较少,提示MSI可能与肿瘤病因相关。测序技术的进步使MSI检测更为精确、成本更低。相信在不远的将来,这些指标可能会进入广泛的临床应用。根据中心法则,遗传信息需要经过转录、翻译、翻译后修饰才能形成蛋白质,目前大规模的蛋白质组学研究如CPTAC有望揭示更多肿瘤的蛋白质组学特征。
虽然在所有类型的癌症中,癌细胞与肿瘤微环境(TME)之间的相互作用着引导肿瘤发展的作用,但TME中细胞和非细胞成分的组成在各种癌症之间存在很大差异,这可能会导致肿瘤进展的速度、侵袭力或治疗反应的差异。例如,在胰腺导管腺癌(PDAC)中,TME通常构成肿瘤的大部分。PDAC的TME包含不同数量的癌症相关成纤维细胞(CAF),包括肌纤维母细胞CAF、炎症性CAF和抗原递呈CAF,而细胞毒性自然杀伤细胞和CD8+T细胞却并不常见,这些动态变化创造了一个免疫抑制和促进分裂的微环境。尽管PDAC的TME具有高度的异质性,但与其他类型的癌症相比,发现大量的细胞外基质是很常见的。单细胞组学正在成为识别不同癌症基质细胞亚群的重要工具。针对肺癌、结直肠癌、卵巢癌和乳腺癌的单细胞研究确定了68种基质细胞亚群,其中46种是不同癌症类型之间共有的,22种是独有的。TME中的免疫细胞塑造肿瘤进展,并代表免疫治疗的靶点。Thorsson等人通过分析TCGA数据库,定义了6个免疫微环境亚型:wound healing, interferon (IFN)-γ dominant, inflammatory, lymphocyte depleted, immunologically quiet and transforming growth factor (TGF)-β dominant。免疫亚型的分类可能有助于预测疾病的结果。对肿瘤免疫环境的泛癌分析揭示了肿瘤和免疫细胞之间相互作用、免疫编辑史、细胞毒性水平和肿瘤特征以及肿瘤炎症标志物(由多基因表达组反映)在预测免疫治疗反应方面的潜在临床应用。TME和癌症转移相关。转移灶较原发灶VAF(Variant Allele Frequency,变异等位基因频率)更高,且全基因组复制的发生率更高,约96%的驱动基因被克隆。这些发现表明,在实体肿瘤中,异质原发肿瘤中的亚克隆通过与TME的特殊相互作用而转移是很常见的。尽管不同的肿瘤发生转移的部位不同,泛癌研究仍有可能揭示亚克隆的分子特征和转移部位微环境之间的相互作用,以及不同肿瘤的转移倾向。
泛癌的发现可能会对临床产生深远的影响。例如,Berger等人在TCGA妇科-乳腺癌队列中识别了分子亚型,这些亚型预示出5年生存率的显著差异(图2)。Chen等人发现了一种以SYK为靶点的增强子,可以作为六种癌症类型预后不良的指标。Wang等人发现,由YAP1和TAFAZZIN的改变锚定的Hippo通路中的特征可以预测多种癌症类型的预后。这方面的研究和数据积累非常迅速。如公共数据库CIViC和OncoKB进一步推动了这一进展,这些数据库将驱动基因突变的临床意义和相关的信息系统化。
不同癌症类型但携带共同驱动基因突变的患者可能受益于相同治疗(图4)。例如,针对致癌BRAFV600突变的药物现在是治疗黑色素瘤的中流砥柱。BRAFV600突变上调MAPK激酶途径。然而,BRAFV600突变在许多其他类型的癌症中也存在,包括多发性骨髓瘤、结直肠癌和非小细胞肺癌,但频率较低。一项basket研究借用了vemurafenib,一种通常用于黑色素瘤的选择性BRAFV600激酶抑制剂,用于治疗携带BRAFV600突变的非黑色素瘤癌症。在携带BRAFV600突变的非小细胞肺癌队列中,vemurafenib治疗的有效率远高于标准二线多西紫杉醇治疗。然而,在同一项研究中的BRAFV600结直肠癌队列中,vemurafenib的单一治疗显示出很小的治疗效果。因此,这种“basket”疗法的有效性似乎会受到特定癌症类型的特征影响。
basket试验可能为“顽固性癌症”(包括没有标准治疗、治疗反应低或副作用难以控制的癌症)提供治疗方案。Molecular Analysis for Therapy Choice (NCI-Match)计划验证了这一方法,该计划旨在系统地利用测序结果来指导标准治疗后进展的癌症患者和罕见癌症患者。NCI-Match将治疗与基因异常而不是癌症类型联系起来,但规模比单独的篮子basket大得多,并推动治疗显示出更明确的研究前景。ComboMATCH思路类似,计划从临床前研究中寻找合适的药物组合(图4)。这些技术的成熟有望促进个体化治疗方案的进步。
泛癌分析目前面临了各种挑战,比如需要大量的数据、复杂的生物信息学分析。反映了当时的技术,TCGA样品主要通过整体外显子组和全转录组测序以及单核苷酸多态性微阵列进行分析,另外还有亚硫酸氢测序、microRNA配对以及蛋白质阵列。这些数据就形成了癌症基因组分析的概要,包括(1)突变和识别变体以推断对肿瘤发展的影响。(2)基因组和表观基因组对转录组和蛋白质组的影响。(3)靶向治疗和免疫治疗的疗效预测。
展望癌症基因组学的下一阶段,单细胞和单细胞核测序更为亮眼。因为他们能够更细致地解析肿瘤对异质性(图1)。单细胞和单核测序可以增大数据量,以获得更完整的驱动基因突变动态图,目前正被应用于研究化疗耐药性、转移、免疫治疗的意义等。总之单细胞组学正在迅速成为分析癌症分子变化和生物标志物的常用工具。多组学研究、数据分析和生物信息学的进展也被广泛用于泛肿瘤研究。实验工具也促进了将泛癌症分析向临床的转化。像PDX目录包括各种分子亚型和基因突变图谱,这对于药物或联合疗法的临床前测试是非常宝贵的(图4)。另有Cancer Cell Line Encyclopedia(CCLE)、Cancer Dependency Map(DepMap) 这些资源可以加强基因组突变和癌症代谢动力学之间关系的研究,以找出癌症类型中可用药的靶点。
总结和展望
癌症基因组学的研究已进入泛癌时代,随着包括HTAN和CPTAC项目的不断扩大,单细胞组学、空间组学、整合多组学和多重成像的应用将会有更多、更高分辨率的泛癌多维数据。基础和临床前泛癌的研究为正在进行的临床试验奠定了基础,除了组织起源以外,应该更多地关注潜在的分子改变。总之,在测序技术和生信分析进步的支持下,泛癌症研究将继续发现并利用不同癌症类型间共性和差异,以实现医疗的最终目标。
参考文献:
1. Chen F, Wendl MC, Wyczalkowski MA, Bailey MH, Li Y, Ding L. Moving pan-cancer studies from basic research toward the clinic. Nat Cancer Sep 2021;2(9):879-890.doi:10.1038/s43018-021-00250-4 .