EBioMedicine|泛癌miRNA基因突变
生信干货
啧啧啧 ·2020年10月22日 02:53
今天跟大家分享的是今年十月份发表在EBioMedicine(IF: 5.736)上的一篇文章, 主要是基于TCGA中的Pan-cancer数据对miRNA基因体细胞突变进行分析,是一篇比较基础的Pan-cancer分析文章,简单套路有条理。
Pan-cancer中miRNA基因的体细胞突变分析
本篇文章主要基于TCGA中超过10000例样本的全外显子组测序数据,对miRNA基因的体细胞突变进行分析,发现miRNA基因可以在Pan-cancer和/或特定癌症中发生过突变,并对这些过突变的miRNA基因与相应miRNA表达,生存时间,分期和分级等临床因素之间的关联进行分析。(1)TCGA中基于四种突变算法(Mutect2,Muse,Varscan和SomaticSnipper)处理后的全外显子测序的体细胞突变数据。主要对miRBase数据库中注释的1918个miRNA基因编码区域的突变数据进行分析,将在miRBase中被注释为高置信度或保存在MiRGeneDB数据库中的编码miRNA前体的基因作为高置信度miRNA基因。研究者首先对Pan-cancer数据中1918个miRNA基因的突变状态进行研究,发现不论是在Pan-cancer,还是在特定的癌症类型中,患者携带miRNome突变个数与全外显子测序数据中的突变负荷成正相关(图1A-B)。在各个癌型中至少携带一个miRNA基因突变的样本比例如图1C所示,相应癌型中每个样本携带miRNA基因突变个数如图1D所示。
图1. TCGA数据中miRNome的突变概述为更好了解miRNA前体区域中序列改变信息,研究者将识别出的改变信息叠加在共有的miRNA前体结构上,并根据miRNA基因子区域中的定位将它们分类(图2A)。分析表明,突变一般发生在miRNA基因的所有区域, miRNA前体中的突变定位也较为平衡(图2B)。当分别对高置信度的5p-miRNA和3p-miRNA的前体进行分析时,可以观察到相似的突变分布(图2B)。4. Pan-cancer中最常见的miRNA基因突变和热点突变在完成对Pan-cancer中miRNA基因突变概况和定位分析后,研究者将目光锁定在突变频率相对较高的这些miRNA基因上。至少在20个样本中发生体细胞突变的miRNA基因如图3A所示。在考虑miRNA长度的背景下,研究者基于二项分布检验(p<0.01)识别出与整个mirnome相比,突变频率相对较高的81个mirna基因。由于mirna突变位置不同,研究者为识别出与功能更相关的突变,赋给不同区域的突变mirna不同的权重,权重越高,代表其突变更有可能发生在序列的功能区域。基于功能权重分析,研究者识别出108个在pan-cancer和特定癌型中发生过突变的mirna基因(图3b),其中有很大一部分与二项分布检验识别出的过突变结果一致(图3b中带黑边的方框)。为更好确定突变发生的具体位置,研究者对mirna的高频点突变进行研究,至少在10个样本中发生某一位置点突变的mirna如图3c所示。图3. Pan-cancer中最常见的miRNA基因突变和热点突变在这一部分,研究者主要对hsa-let-7d, hsa-miR-411等几个发生过度突变的miRNA基因进行细致分析,包括TCGA和ICGC中相应miRNA突变发生位置,miRNA前体结构,成熟的miRNA和种子序列,UCSC基因组浏览器中miRNA相关信息,以及突变型种子和野生型种子中预测靶点的交叠(图4)。在这里我们就不一一介绍,感兴趣的同学可以自己了解下。为研究miRNA突变对表达的影响,研究者首先对miRNA表达数据进行标准化以消除不同癌型间存在的样本差异。最终识别出10个突变的miRNA会在Pan-cancer或特定癌型中导致其表达水平下调(图5A-B)。miRNA下调与大多数miRNA突变为功能缺失突变的观点一致。7. miRNA突变对生存时间/分期/分级等临床信息的影响研究者发现在Pan-cancer或者特定癌型中,一些miRNA基因的热点突变会显著影响患者的生存时间,分期或分级等信息(图5C-F)。图5. miRNA突变对表达/生存时间/分期/分级等临床信息的影响为研究突变频率较高的miRNA基因所参与的生物学通路,研究者基于miRPath数据库对这些热点miRNA进行KEGG富集分析,富集结果如图6所示。Pan-cancer分析似乎存在着某种约定俗成的套路,无非是先看下Pan-cancer中相关课题的整体概括,再锁定一些在Pan-cancer或者特定癌型中表现出共性或者特异性的标志物,对这些标志物进行细致分析,包括对预后,免疫浸润,生物学过程等的影响。这样的分析看似简单,但其实存在的问题也很多。很多Pan-cancer工作都只是按照套路的泛泛分析,像工厂流水线下出来的商品,初看可能觉得内容丰富,花团锦簇,但是仔细回味又总觉得差点儿意思。所以我们在做Pan-cancer分析时候一定要注意这个问题,要让自己的工作有灵魂,而不只是简单的重复和模仿。