小编最近在阅读文献的时候,发现一个比较新颖的生物信息学套路,就迫不及待地来给大家分享啦。
大家都知道癌症预后具有很大的研究价值,同时也存在不少挑战,比较好的突破口就是癌症患者预后生物标志物的识别。DNA甲基化早已已被证实与癌症预后相关,DNA甲基化是啥?小编那就啰嗦一句,它是基因组DNA的主要表观遗传修饰形式,能够调节基因组功能。这项研究的亮点就在于利用DNA甲基化位点之间的相互作用去识别癌症的预后标记。
对于所用到的数据,是从TCGA获得了卵巢癌,乳腺癌和多形性胶质母细胞瘤的数据集,包括癌症患者的临床数据,DNA甲基化数据,miRNA表达谱和基因表达谱。其中DNA甲基化数据中,卵巢癌605例,乳腺癌343例,多形性胶质母细胞瘤295例。
要想达到作者的研究目的,到底是个什么套路呢?别着急,小编带大家慢慢看。
第一步,系统地评估了三种癌症中每种癌症的microRNA表达值,基因表达值和DNA甲基化数据的稳定性,这样做的目的是确定哪种数据去识别癌症的预后标记效果更好。首先将样本数据集分组,应用Cox回归来选择表达水平与肿瘤样本预后显著相关的基因(或miRNA)。然后,进行超几何分布检验评估两组中挑选出来的基因重叠是否显著。结果表明,与mRNA和microRNA数据相比,DNA甲基化数据中挑选出来的基因在这三种癌症中都更加稳定,换句话说,根据DNA甲基化数据从不同样本中选择的基因重叠程度更大。因此,DNA甲基化数据去识别预后标记的效果可能更好。
第二步,当然是构建DNA甲基化相互作用网络啊。由于肿瘤样本中DNA甲基化位点的DNA甲基化水平不服从正态分布,该怎么办呢?于是乎采用斯皮尔曼秩相关的方法计算每两个DNA甲基化位点之间的DNA甲基化水平相关系数。基于斯皮尔曼相关系数,使用基于秩的简单方法构建DNA甲基化互作网络。并对于网络拓扑属性进行了分析,这三种癌症的DNA甲基化互作网络节点的度数都符合幂律分布,属于无标度网络,选择网络中节点度数最高的前10%的节点作为中心节点。
第三步,是对中心基因的功能注释,使用GSEA(一种基因集富集分析方法)来分析中心基因所涉及的通路。小编发现,三种癌症最显著的都是富集到“Pathways in cancer”通路,并且它的许多子通路也被富集,表明中心基因能显著富集到许多癌症相关通路。
第四步,网络构建完了,功能也进行注释了,该从中心节点选择预后基因了。假设DNA甲基化互作网络中的中心节点在癌症预后中可能扮演重要角色,那么与肿瘤样本结果显著相关的中心节点可能是良好的预后基因。为了证实这一假设,作者应用单变量Cox回归筛选出其DNA甲基化水平与患者预后显著相关的中心节点,作为相应癌症的预后基因。最终筛选到了76个卵巢癌中心节点,69个乳腺癌中心节点和88个多形性胶质母细胞瘤中心节点,作为相应癌症的预后基因,更重要的是通过查询发现这些预后基因确实与癌症有关。
第五步,通过生存分析评估预后标记。为了评估这些预后标记,对所选基因分别计算三种癌症训练数据集和测试数据集中的肿瘤样本的风险评分,为了方便比较,还应用Cox回归来挑选那些DNA甲基化水平与肿瘤样本预后最相关的位点作为对照标记,结果如下。
(1)在卵巢癌中,预后基因在训练集中分类的两组样本的生存分析显示这些基因可以区分肿瘤样本的预后。然而,在测试集中,患者的预后风险除以对照标记的差异不是那么显著。
(2)在乳腺癌中,基于69个预后基因(DNA甲基化位点),可以计算患者的风险评分。测试集中的生存分析显示两类肿瘤样本之间的总存活率存在显著差异。对照标记也用于预测乳腺癌中肿瘤样本的预后,对照标记在训练集和测试集中都表现良好。然而,所选的预后基因在两个数据集中表现更加理想。
(3)对于多形性胶质母细胞瘤, 生存分析显示所选的预后标记可以很好地区分训练集和测试集中肿瘤患者的预后。基于对照标记计算患者的风险评分,结果显示对照标记可以区分训练集中肿瘤样本的预后,这是因为对照标记是从该数据集中挑选出来的。但是在测试集中,对照标记结果却不太好。
从以上所有结果中可以表明,本文所用方法选择的预后标记在所有三种癌症中表现良好,不仅如此,所选的预后标记优于对照标记。由于所选的预后基因是从DNA甲基化相互作用网络中的关键节点筛选出来的,从而证实了DNA甲基化互作网络可以促进癌症预后标记的筛选。
好了,今天就到这里了!有兴趣的小伙伴可以去阅读一下这篇文章噢,希望对你有所帮助!
参考文献:Identification of prognostic signature in cancer based on DNA methylation interaction network
更多套路,生信分析需求,请加微信:13895744602
欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史