公开数据发5+,该省省该花花
生信干货
Eric ·2020年7月8日 01:16
今天跟大家分享的是今年五月份发表在Molecular Oncology (IF: 5.962) 杂志的一篇文章,这是一篇关于宫颈癌中基于甲基化数据对HPV感染宫颈癌的预后以及亚型分析的研究。基于HPV相关的甲基化对宫颈癌的重新分类和风险分层HPV‐related methylation‐based reclassification and risk stratification of cervical cancer 人乳头瘤病毒(HPV)是宫颈癌(CC)的主要诱因。本文主要利用HPV相关的甲基化标记识别宫颈癌的亚型并预后分析。首先从TCGA获取DNA甲基化谱,对HPV相关甲基化位点进行无监督聚类识别不同的亚型。将宫颈癌患者分为甲基化-H,甲基化-M和甲基化-L簇。与甲基化-M和甲基化-L相比,甲基化-H的具有更好的总生存期(OS)。且GSEA分析发现,甲基化-M和甲基化-L组富集在KRAS信号传导等癌症相关hallmark。且发现在甲基化-H中检测到MYC,Notch,PI3K‐AKT的突变、扩增和缺失。此外,肿瘤微环境分析表明,甲基化-H的免疫细胞浸润程度相对较低。最后,使用六个HPV相关的甲基化位点作为signature进行预后分析,这些位点能够对宫颈癌患的预后预测。从UCSC xena下载了309例宫颈癌样本的450K数据。对于每个CpG位点,其beta值范围从0到1,并下载病人的临床数据,提取其中HPV感染状况。下载TCGA获得306、289和297例宫颈癌患者的RNAseq、体细胞突变和CNV数据。使用maftools分析体细胞突变数据。使用GISTIC 2.0检测体细胞CNV,识别基因的扩增或缺失。使用ChAMP R包,识别宫颈癌和正常样本、HPV阳性和HPV阴性宫颈癌的差异甲基化探针。Deltabeta > 0.2和P.adj < 0.05的探针认为是高甲基化,deltabeta < -0.2和P.adj <0.05认为是低甲基化。使用具有预后价值的HPV相关甲基化位点的β值进行层次聚类,用来识别宫颈癌患者的亚型。筛选294例有生存数据的患者,随机分为两个数据集(训练集和测试集)。首先进行单变量Cox回归分析,识别具有预后价值的HPV甲基化位点。接着,使用R包“glmnet”进行LASSO回归分析,以进一步筛选甲基化位点。进一步,利用逐步多元Cox回归分析筛选甲基化位点。使用以下公式:Risk score=β值1×系数1+甲基化位点的β值2×系数2+…甲基化位点的β值n×系数n。根据风险评分的中位数将宫颈癌患者分为高风险组和低风险组。使用survival R包进行生存分析,并使用timeROC R包计算AUC。使用了“ fgsea” R程序包进行GSEA富集分析,并对每个分析的参数进行了10000次扰动,筛选P.adj<0.05认为是显著的。使用gsva R包进行ssGSEA分析,评估24种不同免疫细胞类型标记基因的免疫浸润水平。使用ESTIMATE方法估计肿瘤组织中的基质细胞和免疫细胞得分来评估肿瘤微环境细胞的浸润。在肿瘤和正常组织之间,使用ChAMP 筛选出35678个差异甲基化探针(图1A)。在HPV阳性和HPV阴性宫颈癌之间筛选了48190个差异甲基化探针(图1B)。进一步取交集,得到9249个共同的HPV相关的甲基化位点。

通过使用HPV相关的甲基化位点进行单变量Cox回归分析。识别191个与HPV相关的甲基化位点(P <0.05),用于无监督聚类分析,将294例宫颈癌患者分为三类(图2A)。且不同组之间生存差异(P = 0.009,图2B)。使用PCA分析比较三个簇之间的转录组数据,发现三个簇的样本分离(图2C)。
对不同的簇之间进行基因集富集分析。发现在KRAS信号传导与甲基化L正相关(图3A)。此外,干扰素γ反应等与甲基化M显著正相关(图3B)。
进一步研究三个簇中的基因组改变情况。图4A–C显示了三个簇中最常见的前30个突变基因。并计算三个聚类中10个常见致癌通路的突变频率(图4D)。MYC等的突变频率在甲基化H组中较高(图4D)。CNV分析表明在甲基化H簇中8q24.21(MYC)发生扩增(图5A,B)。此外,在甲基化M簇中11q22.1(YAP1)扩增等均与癌症相关(图5C,D)。最后,甲基化-L中发现11q22.1扩增(YAP1),13q14.2缺失(RB1)(图5E,F)。

单变量Cox回归分析识别20个具有预后意义的甲基化位点。经过LASSO回归分析后,识别到11个。针对这11个甲基化位点进行了逐步多元Cox回归。鉴定六个甲基化位点(cg23170347,cg16376000,cg13759702,cg01727408,cg05008070和cg07227049)构建预后模型(表1)。cg13759702的DNA甲基化水平与高风险相关,其他五个探针的DNA甲基化水平与低风险相关。
在训练和测试数据集中进行了Kaplan–Meier生存分析,将宫颈癌患者分为高危和低危组。这两组的生存显著差异(图6A)。六个DNA甲基化标记的5年AUC为0.899,3年AUC为0.888(图6B)。在测试数据集和整个数据集中都观察到了相似的结果(图6C,6D)。训练集和测试集一起,整个数据集中同样也具有好的预测性能(图6E-6F)。
针对某些临床病理变量是否对生存有一定的影响,包括年龄,病理分期,临床分期等。为了评估这种HPV相关甲基化信号的独立性,根据不同的临床病理特征对宫颈癌患者进行了重新分类(表2)。结果表明,signature与年龄,临床分期,组织学分级,T分期,淋巴结转移和肿瘤状态无关。
为了比较宫颈癌患者之间24个免疫细胞比例的差异,使用ssGSEA估计了24个免疫细胞相对比例。热图展示TCGA的294例样本的肿瘤浸润(图7)。
与其他两个簇相比,甲基化-H簇显示出较低的ESTIMATE评分和较高的肿瘤纯度。这些结果表明,与其他两个簇相比,甲基化H具有不同的免疫表型。总而言之,该工作利用HPV相关的甲基化标记识别宫颈癌的亚型,分析了不同亚型的预后状态、基因突变差异以及免疫浸润水平的差异,从甲基化的角度研究宫颈癌的分型,具有不错的创新性。有分析需求
也可以添加小姐姐微信沟通哦
