Hello,大家好啊,春天到了,是不是心情变好了,科研劲头更足了呢?那就快快和小编一起开始今天的文献解读之旅吧。今天小编想和大家分享的是一篇发表在Cell Reports上的DNA损伤修复通路缺陷的Pan Cancer研究文章。思路简单粗暴,换个通路,换组基因,高质量SCI文章发发发。赶快学起来吧!
为了对DNA损伤修复相关基因(DDR)有更深入的了解,研究者对TCGA数据库33种癌症类型中DDR基因的突变,拷贝数,甲基化等基因组和表观组特征等数据进行整合,将基因和通路水平的改变与因组不稳定性和功能缺陷相关联,并结合患者预后,评估DDR缺陷得分在预后中的作用。
以下是文章的大概流程:
图1:工作流程
1. 确定核心DDR基因集合。
研究者对其他人工作中确定的DDR基因进行整理和总结,共得到276个DDR通路或DDR相关核心通路的基因。其中,208个可以富集到DNA特定修复通路(如同源重组修复,错配修复等)中,68个可以注释到核心DDR相关通路(如调控催化核苷酸还原酶的亚基(RRM1/2),重要的DNA损伤修复激酶(ATM,ATR等))。对276个DDR基因进行筛选,最终得到了71个DDR通路特异基因,9个DNA损伤反应基因,使得通路中基因更为精简和具有代表性,便于后续分析。
2. Pan Cancer中DDR基因改变(体细胞突变,拷贝数改变)情况
通过整合体细胞突变数据,GISTIC定义的拷贝数改变数据,确定泛癌研究中DDR基因改变状态。最终获得9125个Pan Cancer样本的276个DDR基因的改变状态,以二进制显示,改变为1,不改变为0。数据分析表明,在子宫内膜癌,结直肠癌中DDR基因突变频率更高。在卵巢癌,肉瘤,食管癌,胃癌中DDR基因拷贝数改变频率更高。除了TP53和POLE外,其他DNA修复相关基因的突变频率和所有基因的突变频率成正比。
附图1:DDR基因在不同癌型中改变状态
3. DDR基因表观沉默分析
12个DDR基因在甲基化-转录沉默方面表现出很强的一致性,沉默频率最高的DDR基因为核心DR (direct repair)通路基因MGMT(突变频率11%)和ALKBH3(突变频率8%) ,其次为错配修复(MMR)核心基因MLH3(5%)和MLH1(4%)。HR和FA通路中的基因,如BRCA1、RAD51C、NSMCE3和FANCF发现的表观沉默则比较少。甲基化沉默占MGMT所有改变的92.4%,与突变特征sig15显著相关。EXO5沉默占其基因改变的94.5%,在 GBM中占46%,而在LGG中仅为4.5%。在IDH野生型GBM和LGG中EXO5沉默分别占50%和27%。另外,GBM患者IDH基因野生状态和EXO5沉默之间的一致性表明EXO5沉默可能在GBM的IDH野生亚型致癌机制中发挥重要作用。
在特定DDR基因表观沉默状态分析完成之后,研究者又将研究重点放在通路层面的表观沉默中。在胃肠道肿瘤(ESCA、COAD、STAD和READ)、HNSC和GBM中可以观察到核心DR、HR和MMR通路基因的沉默频率较高。另外,从23个DDR基因表达数据的改变和有限的蛋白阵列(RPPA)数据中可以看出,在OV、UCS(子宫癌肉瘤)、CESC(宫颈癌鳞状细胞癌和宫颈内腺癌)、TGCT(睾丸生殖细胞癌)也表现出较高频率的DR和HR通路沉默。
图2:DDR基因和特定DDR通路表观沉默状态
4. HR缺陷和预后与基因组不稳定有关
研究者们计算了所有样本的六种SCNA改变评分(用于描述Pan Cancer Atlas样本中非整倍体、LOH和同源重组缺陷的程度),六种SCNA改变评分之间存在正相关关系。另外,在12种癌症类型中突变负荷与SCNA改变评分之间也可以观察到统计上显著的正相关关系,而在此前报道中,SCNA改变与突变频率之间一直被认为是负相关的。
HRDscore评分是六种评分中较为常用的一个。研究者发现在不同癌症类型中的HRDscore差异很大,在OV中评分最高,KICH(肾嫌色细胞癌)、KIRP(肾乳头状细胞癌)、LAML和THCA(甲状腺癌)中评分最低。另外,许多癌症类型也有部分高HRD得分的样本。高HRDscore 的癌症包括卵巢癌、子宫癌、肺癌、食道癌、肉瘤、膀胱癌、肺腺癌、头颈部癌和胃癌等。根据HRDscore对33种癌型进行预后分型,结果表明,在8种癌症类型中,HRD评分与无进展间隔(PFI)显著相关。在GBM,OV中HRD评分越高,患者生存越好,符合HRD缺陷的OV样本对铂类药物和PARP抑制剂等药物敏感的假设。另外,GBM预后较好则可能是IDH基因突变的结果。在其他癌型中, HRD评分越高,PFI越差。基于Bayesian ridge regression模型预测其他基因对HRDscore的影响,HR基因BRCA1, BRCA2,RAD51B, and RAD51C的改变与HRDscore成正相关,MMR and NER(MLH1, TCEB3, and MSH2)中基因与HRDscore负相关,表明HR和MMR,NER通路之间可能存在潜在的互斥改变。
图3:HR缺陷与预后关联
5. 常见DDR突变对蛋白质结构的影响。
通过蛋白质结构分析和建模,研究者分析了22个DDR基因改变对蛋白质的潜在影响。根据突变对蛋白质结构的影响,将突变分为destabilizing(不稳定,破坏的)和non-destabilizing突变。26.8%的突变被预测为使得蛋白质结构不稳定,1.9%的被认为对结构影响不大。destabilizing突变可能通过改变或限制DDR功能影响突变负荷和拷贝数负荷,大部分被预测为destabilizing的突变与拷贝数改变或者突变负荷成正相关。许多基因在拷贝数改变和突变负荷之间存在不同程度的负相关关系,如POLB的destabilizing突变与高突变负荷和低拷贝数改变负荷相关;PARP1与低突变负荷和高拷贝数改变负荷相关。
图4:DDR基因突变改变蛋白质结构的稳定性
6. 基于表达特征预测TP53失活
许多癌症类型中TP53功能缺失会造成基因组不稳定,有较高的SCNA负荷和较高的HRD评分。为了更好地预测TP53失活状态和识别潜在的TP53失活患者,研究者们开发出一个基于RNA序列表达数据预测TP53失活状态的分类器,该分类器具有较高的敏感性和特异性。TP53分类器(基于表达数据)识别出10个负权重(权重为负表明在TP53野生型样本中该基因表达上调)最高的基因,其中9个为已经证实的TP53靶基因。剩下那个基因MPDU1位于TP53下游约80kb的位置,对TP53的拷贝数缺失比较敏感,从而被识别出来。与CDKN2A 或MDM2野生型样本相比,发生缺失或者扩增样本中TP53 score更高。
图5:基于表达数据预测TP53失活
7. DDR 改变与预后的关系
研究者们基于DNA损伤定量计算了43种DDR足迹分数,并研究了分数在28中癌型中与临床结果(os,pfs)的关系。计算方法包括突变负荷和拷贝数负荷,修复能力评分(RPS)等。与基于突变和表达的DDR打分相比,基于拷贝数的打分与生存结果的相关性更强。在ACC, BRCA, ESCA等癌型中LOH负荷与HRD-LOH打分, NtAI得分显著相关。除GBM和OV外的其他癌型,HRD或LOH负荷打分越高,预后越差。
好了,文章大概内容就是这些啦,让我们来总结一下吧:首先定义核心DDR基因集合,并系统地展示了TCGA 33种癌型中DDR通路的突变,拷贝数改变和表观沉默状态,分析HR缺陷和与基因组不稳定之间的关系,评估常见DDR突变对蛋白质结构和不同癌型预后的影响,并开发了一种可以预测TP53失活的分类器。同学们换个通路,换组基因,进行相似的分析,也可以发出不错的文章。本工作思路简单粗暴,通篇生物信息学分析,不需要进行任何实验研究,但是工作量真的好大,足以看出研究者丰富的知识储备。所以说,想要发好文章的同学还是要多看文章,丰富自己的知识储备,开拓自己的科研思路,千万别想着一条路走到黑,很危险的!话不多说,我们下次再见吧。
更多生信分析套路,请加微信13621202201