结直肠癌进展史的强化遗传模型10+
生信干货
zary ·2019年9月1日 22:17
今天,小编跟大家分享的是一篇今年八月份发表在Genome Biology杂志上的文章:结直肠癌进展史的强化遗传模型,其影响因子10+。
结直肠癌经典的遗传模式是APC, TGF beta, KRAS和TP53的先后突变,这一时序来源于小鼠模型以及不同肿瘤阶段的突变频率。本文利用全基因组测序数据,通过整合多类型突变信息( SNVs、染色体异倍性、基因重组、克隆扩增以及chromothripsis和kataegis等),对结直肠癌突变事件的顺序做出了新的推断。下面让我们看一下作者具体都做了什么。
注:chromothripsis和kataegis是两种突变模式,前者是指一次细胞危机引起几十个或数百个基因重排时就有可能导致癌症突发,后者指在小区域基因组中出现数量异乎寻常的突变,引起癌变。1、结直肠癌遗传突变图谱。本文所用数据为63个结直肠癌患者的肿瘤样本和配对正常样本的全基因组测序数据,每个肿瘤样本平均检测到20,867个 somatic SNVs, 4020个small indels, 45 个SVs, 和18个转座元件插入(TEIs)。突变模式如图1,其中,有10个肿瘤样本的错配修复基因被扰动从而表现出MSI(微卫星不稳定性)表型;有7个肿瘤样本发生POLE外切酶结构域缺陷,其突变率要高于MSI组;其余46个肿瘤样本则有大量的CNVs和SVs,同CIN(染色体不稳定性)肿瘤的特征一致。此外,作者发现MSI肿瘤的体细胞TEIs显著多于其他两种类型。
2、体细胞SNVs揭示的突变史。 作者综合考虑了体细胞SNVs的mutant allele fractions (MAFs)和杂合SNPs的最小等位基因频率,以及肿瘤与正常样本的copy ratios来推断肿瘤纯度、染色体倍性和亚克隆结构。MAF值的预测公式为p × n1/(p × (n1 + n2) + 2 × (1 − p)),p代表肿瘤分数,n1和n2分别代表主等位基因和次等位基因的染色体数目。最终,该研究基本重建了63个案例的所有主要事件,并进行手工检查以保证准确性。图2.a以样本crc3913为例展示了其拷贝数变异、杂合SNP的最小等位频率和体细胞SNV的MAFs值,其中,染色体臂3p和5q都具有杂合复制中性缺失(CN-LOH)的特征;图2.b表明根据等位基因分数,3p和5q上的SNVs都可分为三组:CN-LOH之前发生的clonal SNVs,CN-LOH之后发生的clonal SNVs和subclonal SNVs;图2.c-f分别是中性复制、单拷贝增益、双等位拷贝增益和三拷贝增益的MAFs图谱,红色的SNVs发生在拷贝增益之前,蓝色的发生在单拷贝和双拷贝之间,绿色的发生在双拷贝之后;图2.g为crc3913样本的肿瘤进展图(76%为肿瘤细胞,24%为基底细胞),粉红色线表示点突变发生的时间窗口;图2.h-i 是肿瘤样本CRC2683的突变谱和进展史,染色体2和9具有相同的拷贝数和杂合SNP分布,但体细胞SNV分布不同。由左图作者得出结论:两条染色体都有四个拷贝,并且同源。作者重建了绝大多数肿瘤的进展史,发现CIN肿瘤的纯度显著高于POLE-mutant和MSI肿瘤,POLE-mutant肿瘤的克隆扩增早于CIN和MSI。但是由于样本间的突变率不一致且不稳定,他们所估计的时间只是遗传变异与克隆扩增发生的相对顺序。 

3、中性进化 图3.a以样本crcA5EK的10号染色体为例,展示了它们根据等位基因分数来区分克隆和亚克隆的结果,可知用作者的方法将0.06-0.21区域定为亚克隆突变要比按照另一方法选择0.12-0.24更优化。最近一项研究表明,很大一部分结直肠癌在最初的克隆扩增后会发生中性进化,依据是中性进化的肿瘤,其亚克隆SNVs的等位基因分数会服从幂律分布。但作者在所有肿瘤非整倍体染色体上选择合适的亚克隆SNVs并进行同样的幂律分布试验后,却发现只有6个CIN肿瘤符合中性模型(图3.b)。此外,研究又将SNVs分为两类:亚克隆扩增前(图3.c的Peak1)和亚克隆扩增后(图3.c的Peak2),然后根据亚克隆扩增前后SNVs的比例,估算亚克隆扩增的时间。总之,本文的结果表明,在绝大多数结直肠肿瘤中,肿瘤的生长在最初的克隆扩增后并不是中性的,而是常会出现亚克隆的附加选择。
4、不同机制作用于不同基因组区域以优化基因剂量 图4是结直肠癌肿瘤样本的拷贝数图谱。在CNV分析过程中,常出现的问题是基因组复制(GD),作者将超过一半的基因组同时复制的时间定义为GD,在所有肿瘤样本中,只有43%的CIN肿瘤发生了GD事件。值得注意的是,作者发现了作用于不同基因组 区域的三种机制,第一种是在CIN肿瘤中,染色体17p和18经常发生缺失和CN-LOH事件,在图4所列样本中,对于染色体17p,只有non-GD肿瘤样本发生了拷贝缺失(蓝色条),GD肿瘤样本则大多发生CN-LOHs事件而无缺失,对于18号染色体,只在non-GD肿瘤中发现了拷贝缺失,CN-LOHs则只在GD肿瘤样本中出现。CN-LOH和GD间的关系表明大多CN-LOH的发生经过两步:删除和复制(通常是GD);第二种是GD肿瘤在GD发生前后都可能出现多重缺失(以图4中8号染色体为例,蓝色区域);第三种是一些染色体即使在发生GD后,剂量仍然较低,因为它们没有参与GD,故没有发生扩增。
5、染色体碎裂(chromothripsis)和局部超突变(kataegis)的多次独立发生 chromothripsis是指一条或多条染色体发生大量基因组重排的突变表型,kataegis是指与APOBEC酶活性和基因组重排相关的C>G和/或C>T SNVs聚集发生的突变表型。作者从13个肿瘤样本的23条染色体上识别出了chromothripsis,大多是亚克隆,其中12个肿瘤是CIN型,一个是MSI。此外,该研究发现chromothripsis可在一个肿瘤中独立发生多次,如肿瘤样本crcA01S中,染色体2, 4,13上发生的chromothripsi被证实是独立的。研究表明,两个克隆和一个亚克隆染色体碎裂事件是独立发生的,并且两个事件发生在同一染色体的不同片段。Kataegis存在于8个CIN肿瘤的12号染色体上,除了C > G和C > T突变外,作者还发现了大量的C > A突变,kataegis也可在同一肿瘤中独立发生多次。6、结直肠癌的强化遗传模型 通过对63个全基因组测序案例的分析,作者总结了结直肠癌基因组突变史的时序,图5列出了该遗传模型中常出现的事件。图5.a是CIN肿瘤的突变谱,右半部分沿箭头从上到下表示随肿瘤发展而依次发生的各层次的突变事件;MSI和POLE-mutant肿瘤由于拷贝改变较少,难以准确预估。同结直肠的经典遗传模式相比,该模式增加了许多突变事件,拓展了我们对肿瘤发生过程的理解。
最后,依旧是一句话与大家共勉:Whenever there's any doubt, there is no doubt!大家好,首先感谢关注生信人。生信人目前拥有超级预后,超级可变剪切,突变+表达,表达+突变,DNA甲基化,自噬,ceRNA、经典预后、m6A、可变剪切、肿瘤微环境,免疫浸润,多组学,驱动基因,突变,耐药,CNV肿瘤干细胞等多种经典和新潮分析思路和方案。
在此开工季,欢迎大家预定分析服务。
开工季,套路上新
(8.29-9.30)期间签订项目
赠送生信人网课一套
