肝癌CpG甲基化表型(CIMP)相关预后模型开发和验证
Development and validation of a CIMP-associated prognostic model for hepatocellular carcinoma
大家好,首先感谢关注生信人。生信人目前拥有超级预后,超级可变剪切,突变+表达,表达+突变,DNA甲基化,自噬,ceRNA、经典预后、m6A、可变剪切、肿瘤微环境,免疫浸润,多组学,驱动基因,突变,耐药,CNV肿瘤干细胞等多种经典和新潮分析思路和方案。
在此开工季,欢迎大家预定分析服务。
Abstract
背景:CpG甲基化表型(CIMP)是基因同时甲基化的子集特征,对多种癌症的发生发展有影响。然而,CIMP在肝癌中的潜在机制及其临床相关性仍未清晰。
方法:使用TCGA的肝癌甲基化数据将HCC患者分为不同CIMP亚型,并评估它们与临床特征的相关性。此外,突变,CNV和转录组谱也用于评估与CIMP相关的独特基因组模式。最后,使用4个独立的数据集训练、验证CIMP相关的预后模型CPM的预测效能。
结果:识别了一个病人OS、DFS预后相关的CIMP-H病人子集。富集分析显示在CIMP-H亚组中富集到“具有EPCAM的肝癌”,“肿瘤侵袭性向上”,“甲基转移酶复合物”和“翻译起始”。值得关注的是体细胞突变分析表明CIMP-H子集具有较高的BRD4,DDIAS和NOX1突变负荷。4个CPM模型关联的基因在训练集和3个测试集中能够显著的区分出高低风险组。在研究的最后我们基于4种mRNA,病理性M分期和CIMP状态构建了列线图,结果显示出良好的鉴别能力,有助于HCC的临床决策。
Result
一、识别HCC中CpG甲基化表型(CIMP):
1、使用TCGA 377个HCC和50个正常样本甲基化数据识别了与HCC患者OS相关的95个易甲基化的CpG位点用来进行k均值无监督聚类:这些CpG位点有很强的稳健性,这一点在GSE56588数据集中得到验证。(见下图a)样本被分成3类表型CIMP-H、CIMP-M、CIMP-L。,其中CIMP-H(红色)在几乎所有CpG位点呈现高甲基化模式,被认为是CpG岛甲基化表型。
2、为了研究CIMP表型与OS的相关性,使用K-M方法和log-rank analysis进行生存分析:如下图b所示,具有不同CIMP表型的HCC患者有显著的OS差异
3、同样也研究了CIMP表型与无复发生存期(RFS)的关系,同样发现不同CIMP表型的HCC患者有显著的RFS差异(见下图c)
综上,CIMP-H表型集有最坏的OS和RFS,CIMP-L 表型集有最好的OS和RFS
3、CIMP表型与临床特征之间的关系(见Table1)
二、CIMP在肝癌发生过程中潜在作用机制:
基于TCGA RNA-seq谱对不同CIMP表型的HCC患者进行GSEA富集分析以研究CIMP潜在机制:与其他两个表型相比CIMP-H表型的病人富集到了“复发性肝癌向上”,“肝癌存活率下降”,“肝癌伴EPCAM上升”,“肿瘤侵袭性上升”,“甲基转移酶复合物”和“转化起始”条目。(见下图)GSEA分析中也证实了CIMP与预后之间的负相关关系。
三、不同CIMP表型患者肿瘤浸润免疫细胞的情况:
使用gsva R包计算三种不同CIMP表型患者24种免疫细胞比例来表征HCC免疫浸润情况:大多数免疫细胞在不同亚型间没有统计学上的显着差异。肿瘤浸润性免疫细胞类型之间的相关性仅为弱或中度。但,CIMP-H表型亚组的细胞毒性细胞,树突细胞,交叉细胞,巨噬细胞,中性粒细胞,γδT细胞(Tgd)和1T型辅助细胞(Th1)细胞的比例明显低于其他组(见下图)。这些结果表明,与其它亚型相比,CIMP-H亚组中的患者具有独特的免疫表型,有较少的免疫浸润以及较低的细胞毒性潜力和免疫激活,免疫疗法更可能在CIMP-H表型中不太有效。
四、不同CIMP表型中突变和CNVs分析:
1、在不同CIMP相关亚组中的患者中,肿瘤突变负荷(TMB)没有显着差异,但,CIMP-H组患者的DDIAS和NOX1中的体细胞突变负担明显较高(见下图a)。他们是关键癌基因和有潜力的治疗靶标,并在CIMP-H亚型中显着富集。
2、使用GISTIC 2.0评估具有不同CIMP表型的患者之间的体细胞拷贝数变化的差异,在158个基因在染色体区域内,在CIMP-H亚组中呈拷贝数显著扩增或缺失。2号染色体扩增和,9号染色体缺失富集在CIMP-H亚组中。在CIMP-H患者中鉴定出焦点扩增峰,包括成熟的驱动因子如CRIM1(2p22),NBAS(2p24),同时在9p21处发现了局灶性缺失峰(见下图b)。
五、构建基于CIMP的预后模型CPM:
1、基于TCGA HCC表达数据筛选差异基因,使用单因素cox回归分析筛选得到与HCC预后相关的137个基因;接着进行lasso回归分析得到与HCC最具预后效能的4个基因:PLEKHB1, ESR1, SLCO2A1, and GNA14 。其中GNA14的表达与大多数映射到它到CpG位点的甲基化水平显着负相关,其他3个基因显著的正相关。
2、实验:在使用5-Aza-2-deoxycytidine处理后HCC 细胞系 (LM3 and Huh7 cells)。发现4个基因都过表达。95个CpG位点中有39个呈现高的DNA甲基化水平,特别是甲基化变化最大的7个CpG位点,可能影响PLEKHB1,ESR1,SLCO2A1和GNA14的表达。(见下图)
3、基于TCGA数据最终构建了基于4个基因的HCC风险预测模型CPM:
risk score = 0.16 × PLEKHB1(Expression)–0.08 × ESR1(Expression)–0.13 × SLCO2A1(Expression)–0.21 × GNA14(Expression)
OS and RFS生存分析(分别见下图a、b):可见高风险得分有更差的OS和RFS预后
预测效能评估:模型在0.5、1、2、3年的OS ROC曲线(见下图c);单因素和多因素cox回归分析显示OS相关CPM预测模型是独立于CIMP表型的预测因子(见下图d)。
六、CPM风险预后模型在GEO、ICGCM、Tongji队列中的验证 :
1、使用TCGA HCC队列构建的模型和临界值将GEO、ICGC、Tongji HCC样本分成高低得分组,计算模型在0.5、1、2、3年的OS ROC曲线AUC值(见下图)。结果表面模型在不同的队列中都有稳定的预测效能。
2、CPM预测模型与其他研究预测模型的比较:结果表明CPM在不同的分子水平,平台和数据集中有稳健的预测效能。
七、高低风险组中的生物学过程和通路分析:
GO和KEGG分析基于CPM模型揭示HCC生物学机制:高风险得分的相关基因(基于皮尔森相关系数>0.5 and P<0.05)显著富集到了“蛋白质靶向膜”等,KEGG分析则富集到了”核糖体色氨酸代谢“等通路(分别见下图a、b)
八、CPM是独立于临床特征的预后因子:
基于TCGA队列使用单因素和多因素cox回归分析研究CPM与HCC性别,年龄,病理TNM,病理分级,病理分期等因素的独立OS预后因子,显示了其强大的预测能力。(见下图a),此外也验证了它是RFS独立的预后因子。(见下图b)
九、基于CPM预测模型构建列线图:
为了建立HCC预后的定量方法,有助于医生的临床决策,整合了CPM和独立的临床风险因素(CIMP表型和病理学M)来构建列线图估计患者1、3、5年生存率(见下图a)结果显示CPM在所有点中有最大的权重。校准曲线的结果表明预测结果和实际观察结果之间存在良好的一致性(见下图b)
参考文献
Development and validation of a CIMP-associated prognostic model for hepatocellular carcinoma
其实这样的分析套路还是比较简单的,基于某一类组学数据或者多组学数据进行分组,然后研究不同分组直接的免疫浸润,肿瘤符合,CNV ,表达,预后等等各种关系。如果您也有分析需求,欢迎扫码咨询。