肿瘤:DNA甲基化-TF-基因预后标志物
生信干货
海饼干 ·2020年9月27日 02:37
小伙伴们大家好呀,今天要为大家介绍的是于2020年7月15日发表于Frontiers in genetics(IF=3.258)的文章,题目为Identification of Transcription Factor/Gene Axis in Colon Cancer Using a Methylome Approach,作者单位是吉林大学第三医院胃肠大肠肛门外科。
本研究的研究重点是从DNA甲基化挖掘结肠癌新的候选标志物。结肠癌是全球最高发癌症之一。DNA甲基化被认为是用于癌症预防、诊断和治疗潜力标志物。在结肠癌中,DNA甲基化介导的调控事件的检测对于挖掘新型生物标志物至关重要。已有研究表明DNA甲基化可以通过多种机制促进癌症的进展。研究发现 DNA甲基化的变化会抑制或促进转录因子(TFs)的结合,并进一步干扰基因调控。本文想通过TF-CpG-基因三联体的研究,筛选新可能用于结肠癌预后的新生物标志物。DNA甲基化联合TF和基因筛选新型癌症预后标志物
结肠癌是全球发病率和死亡率的主要原因之一。结肠癌的致病性被认为是一个多阶段且复杂的过程。基因表达的异常改变在结肠癌的发展中具有重要作用。先前的研究强调并表征了转录因子(TFs)在结肠癌中的作用。DNA甲基化是广为人知的表观遗传修饰之一,已显示出可以在时间和空间上特定的方式调节基因表达。甲基化组的改变可以通过通路模块促进癌症的发展。在结肠癌中,抑癌基因的高度甲基化通过沉默转录促进癌变。异常的DNA甲基化位点可能参与与TF的串扰并影响下游转录调控。先前研究报道也发现了TF与基因启动子区域的未甲基化位点结合。因此,检测结肠癌中激活的TF,结合DNA甲基化状态和TF-基因调控关系,将有助于结肠癌研究。(1)首先,研究研究了基因表达谱。在健康样本和疾病样本之间,使用t检验和FC在结肠癌数据集中检测到明显失调的基因,设置筛选条件是FDR<0.05,| log2fc="">1。结果发现了有623个上调,有816个下调(图1A)。然后,为了进一步探讨了临床作用基因和结肠癌相关基因的表达模式,采用TARGET和MalaCards数据库分析。结果发现,在这些失调的基因中,有19个是临床可操作基因,有25个与结肠癌有关(图1B,C),并且在这些功能基因组中上调和下调的基因之间没有明显差异(图1D)。(2)接下来,试图探索甲基化位点和失调基因之间的关系。研究发现针对1,439个失调基因,有14,066个CpG位点映射到1,314个基因。接下来,使用这14,066个CpG位点进行了主要成分分析(PCA),并根据前三个主要成分进一步检查了结肠癌和邻近粘膜样品的特征(图2A)。根据PCA结果,结肠癌和邻近的粘膜样品具有明显的甲基化特征(图2B)。这表明与邻近的粘膜样品相比,失调的基因启动子内的DNA甲基化在癌症样品中具有不同的模式。然后,使用相关统计数据鉴定了甲基化基因对(图2C),并将显着相关的对标记为emQTL(表达-甲基化定量性状基因座)。在14,185个甲基化基因对中,将近24%(3,402)对具有显着关系(图2D)。此外,大多数(90%)emQTL显示出负调控,这与以前的发现一致,即DNA甲基化可以阻断启动子活性并抑制基因表达。
(3)DNA甲基化位点已显示在调节TF结合事件中起重要作用。紧接着,研究探讨了emQTL中TF的出现,结果在754个CpG位点中识别出721个TF基序。然后,在计算了这些基序的比值比后,在373个CpG位点中鉴定出223个TF基序。通过皮尔森相关性研究,研究了每个TF和相应的CpG位点之间的关系,结果获得了33对TF–CpG对,包括23个TF和31个CpG位点,并确定了29对TF基因对(图3A)。最后,基于已识别的TF,CpG位点和基因之间的关系构建了一个网络(图3B)。结果显示,GFRA1启动子中有两个CpG位点(cg06298519,cg25617725),cg06298519与TF E2F7相关,而cg25617725与TF NR3C2和NR3C1相关(图3B)。cg06298519和cg25617725的甲基化水平与GFRA1的表达呈负相关。TF NR3C2和NR3C1均与GFRA1正相关,而E2F7与GFRA1负相关(图3C)。这表明NR3C2和NR3C1可能相互配合来调节GFRA1。接下来,测试了E2F7,NR3C2和NR3C1之间的表达相关性。E2F7分别与NR3C2和NR3C1负相关(图3D)。因此,尽管TF E2F7与NR3C2和NR3C1相比对GFRA1表现出相反的调节作用,但它在结肠癌中没有竞争性作用。该网络中基因失调可能是由DNA甲基化位点和其启动子中的TF结合之间的协同作用引起的。因此,确定它们在癌症样品中的联合作用将对结肠癌的治疗和预后有益。
(4)先前的研究已经确定了许多癌症的预后标志物,包括DNA甲基化位点和编码基因。但是,这些研究中的大多数仅限于一种分子水平。为了更全面地评估患者的预后,这里联合分析了DNA甲基化位点,TF和基因对患者生存时间的影响。对于每个三元组,我们使用训练集基于风险系数通过应用多元Cox比例回归模型构建风险模型。在训练集中,GLIS1_cg22444507_ITIH5三联体与生存时间显着相关(图4A,B)。同样,在测试集中,使用与训练集相同的模型为患者分配风险值,并且还可以将其显着分为低风险和高风险组(图4C,D)。此外,考虑到治疗对生存的影响,我们在仅接受化疗的部分患者中测试了GLIS1_cg22444507_ITIH5三联体的效率。结果表明,GLIS1_cg22444507_ITIH5与仅接受化疗的患者的生存率相关(图4E,F)。这些结果表明,GLIS1_cg22444507_ITIH5三联体是结肠癌预后的潜在生物标志物。(4)获得了四个与患者生存时间显着相关的TF-CpG-基因三联体,基于此,文章设计了一个框架来评估结肠癌样本的预后风险评分。一个三联体TF-CpG-基因GLIS1_cg22444507_ITIH5可以成功地将结肠癌样本分为低风险和高风险组。在该三联体中,GLIS1可能识别相应的基序并结合cg22444507周围的DNA序列(图5A)。GLIS1的结合反应可能导致cg22444507的DNA甲基化水平降低(图5B)。此外,cg22444507的DNA甲基化可能负面调节ITIH5的表达(图5C)。而GLIS1可以促进ITIH5的表达(图5D)。因此,GLIS1和cg22444507可能相互配合并影响ITIH5的表达。ITIH5(α-胰蛋白酶抑制剂重链5)已被鉴定为由启动子高甲基化介导的新型乳腺癌预后标志物,并且是结肠癌中的新型候选肿瘤抑制基因。图5. GLIS1_cg22444507_ITIH5三联体的生物学解释本文探讨了位于差异表达基因启动子区域的CpG位点的影响,并使用表达-甲基化定量性状基因座鉴定了甲基化与基因的关系。研究结果发现启动子甲基化位点主要是负调控相应的基因,还确定了可以与序列依赖的方式绑定到这些站点的候选TF。通过整合转录组和甲基化组图谱,本文构建了结肠癌的TF-CpG-基因调控网络,该网络用于确定TF和甲基化在转录过程中的作用。最后,基于TF-CpG-基因之间的关系,设计了一个评估患者预后的框架,该框架表明一个TF-CpG-基因三联体与患者生存率显着相关,并且可能用于结肠癌预后的新型生物标志物。研究证明了TF和DNA甲基化之间的合作在结肠癌基因调控中的作用,并确定了TF-CpG-基因事件可能为结肠癌的预后和治疗提供指导。生信人提供正规,可复现
的生信分析,对本研
究感兴趣可扫码