前言
m6A是作为最近的热点方向,已经有了各种方向的研究。如何在众多文章中让读者眼前一亮呢?或者说,对于同种数据类型的同种癌症,怎么推陈出新,让这个研究具有故事性?今天这篇文章可能可以给大家一些启发。Identification of Two m6A Readers YTHDF1 and IGF2BP2 as Immune Biomarkers in Head and Neck Squamous Cell Carcinoma【Frontiers in Genetics IF:4.27】
研究m6A的常规思路,可以概述为“分型+预后”思路。m6A只有20多个基因,没有必要进行降维,可以直接使用二十多个m6A基因,进行聚类,聚类将患者分为两类后,进行差异分析,然后找相关基因,进行预后分析。但如果说,所有的m6A去参与聚类,聚类相关并不好的话,课题开展就遇到了瓶颈。常规思路的后面,得到模型之后,可以和免疫、免疫检查点、铁死亡等热点进行关联。
这篇文章则巧妙的设计了一个新的思路——将m6A基因与患者的免疫得分计算相关性,得到几个与免疫相关的m6A基因,使用这些免疫相关的m6A基因对患者进行聚类。这个时候,患者往往可以较好的被分为两类。可以说这篇文章思路精巧,另辟蹊径,将原本可能无法进行的研究思路打通。可谓是,“山重水复疑无路,柳暗花明又一村”。 现在我们来正式看一下这篇文章吧。
数据和代码
结果
一、鉴定与 HNSCC 免疫谱相关的 m6A调控子
为了探究m6A调控子的表达是否影响HNSCC免疫谱,首先,对来自TCGA的HNSCC患者进行过滤,使用具有生存信息的499名HNSCC患者;然后应用 ESTIMATE 工具和 CIBERSORT 算法这些患者的ESTIMATE 评分和免疫细胞浸润;使用21个m6A修饰调控子[Table.1],计算这些调控子的表达与 ImmuneScore 的相关性[Fig.1]。
接下来,对21个m6A 调控子和ImmuneScores相关性的绝对值进行排序。 相关性最大的两个调控子(YTHDF1、IGF2BP2)构建免疫相关特征。
二、基于YTHDF1和IGF2BP2对HNSCC患者进行一致性聚类
选择499例HNSCC患者的YTHDF1和IGF2BP2的表达数据进行一致性聚类,患者被分为两个不同的cluster[Fig.2a]。其中,Cluster1包含294名患者,Cluster2包含205名患者。去除106个没有分期和等级信息的患者后,分析两个cluster中剩余患者的临床特征[Table.2]。
同时,PCA分析证实一致性聚类效果良好[Fig.2b]。YTHDF1和IGF2BP在Cluster1表达更高[Fig.2c],而T分期和病理学等级也在cluster1中进展更显著。 比较肿瘤组织和正常组织中YTHDF1和 IGF2BP2 的表达水平,明显在肿瘤组织中的表达水平较高[Fig.2d]。使用Kaplan-Meier分析cluster1和cluster2的生存情况,cluster2具有更高的生产率[Fig.2e]。
三、基于YTHDF1和IGF2BP2的cluster的免疫图谱
通过GSEA分析两个cluster之间的通路富集。确定cluster1和m6A修饰相关,而cluster2与HNSCC的免疫调节密切相关[Fig3a]。接下来,为了理解cluster1和cluster2之间免疫浸润谱的差异,分别进行CIBERSORT、ssGSEA分析。cluster2表现出更活跃的抗肿瘤免疫细胞聚集[Fig.3b]。比较关键免疫相关基因的表达,结果表明两个cluster都参与了抗肿瘤免疫细胞失效,但cluster2的TGF-β和FAP水平更低[Fig.3c]。
四、基于YTHDF1和IGF2BP2的聚类与HNSCC相关基因的关联
使用几个公认的影响HNSCC生物学行为和免疫治疗反应的基因,分别比较来自TCGA和GEO的两套数据中两个cluster的表达水平[Fig.4ab]。结果表明,cluster1可能与更差的生物学行为有关。
五、通过DEG分析和WGCNA识别Hub基因
使用499个患者的原始count数据,计算两个cluster之间的差异表达基因(Fig.5ab)。然后通过WGCNA将识别到的差异表达基因划分模块,识别和两个cluster最相关的模块[Fig.5c]。
六、Hub基因的功能富集分析和PPI网络分析
为了理解WGCNA识别的最相关的模块,对该模块进行富集分析,并构建PPI网络。功能富集分析表明,该模块和免疫调节有关,包括淋巴细胞活化、免疫反应的阳性调节、免疫效应器过程的调节和B细胞活化[Fig.6ab]。通过MCODE算法将整个PPI网络进一步划分为两个主要MCODE,其中,MCODE1与Gα(i)信号事件、GPCR配体结合相关;MCODE2与第二信使分子、T细胞受体信号通路的产生密切相关[Fig.6c]。
七、在GEO数据库中基于YTHDF1和IGF2BP2聚类验证免疫特征
为了验证基于基于m6A聚类的显著性,从GEO数据库中获得额外数据。使用“ConsensusClusterPlus”对来自GEO的270名患者进行一致性聚类[Fig.7a]。PCA分析证实上述聚类效能良好[Fig.7b]。其中cluster2的YTHDF1和IGF2BP2基因具有更低的表达[Fig.7c]。同时,使用CIBERSORT和ssGSEA来估计肿瘤微环境的组成[Fig7.de]。总之,上述结果表明基于YTHDF1和IGF2BP2的聚类识别了不同的免疫谱。
总结
本篇文章在众多m6A研究中,算得上是另辟蹊径。整篇文章的亮点在于第一部分,后面的六个部分都建立在第一部分基于相关性找到的两个免疫相关的m6A基因,这两个基因可以将患者聚为较好的两个类。后面的分析也就一通百通了。小编看了两个基因和免疫得分的相关性,分别是-0.318和-0.285。单看起来,相关性并不高,不过依据它在两套数据中都可以将患者较好的分开,且具有预后意义,这两个基因还是极具鲁棒性的。