N6 -甲基腺苷(N6 -methyladenosine, m6A) RNA甲基化已被证明参与很多重要的生物学过程,是mRNA和lncRNA上最普遍的表观遗传标记。最近研究也发现人组织中具有不同的m6A甲基化模式,不过这些组织特异性m6A甲基化和相关通路仍然没有被详细阐明。因此小编今天和大家分享一篇刚刚发表在Genomics Proteomics Bioinformatics(IF:6.409)杂志上的文章,文章介绍了一个关于研究特定组织及癌症类型中m6A的在线平台m6A-TSHub。接下来小编就对平台的组成、功能以及应用进行介绍,对m6A感兴趣的小伙伴不要错过呀。
m6A-TSHub: Unveiling the Context-specific m6A Methylation and m6A-af‐
fecting Mutations in 23 Human Tissues
m6A-TSHub:揭示23个人类组织中特异性m6A甲基化和m6A相关突变
一. 摘要
该工作开发了一个全面的在线平台:m6A- TSHub,该平台能够用来揭示可能调控m6A表观遗传标记的环境特异性m6A甲基化和基因突变。m6A- TSHub由4个核心组成部分组成,分别为 (1) m6A-TSDB :是一个包括23种人体组织的184554个功能注释的m6A位点和25种肿瘤组织的499369个功能注释的m6A位点的综合数据库;(2) m6A- TSFinder:是一个从RNA序列中高精度预测特定组织中m6A甲基化位点的web服务器;(3) m6A- -TSVar:是一个用于评估遗传变异对组织特异性m6A RNA修饰影响的web服务器;(4) m6A-CAVar:是一个包含TCGA 27种癌症的587983个癌症突变的数据库,这些突变被预测会影响癌症原发组织中的m6A修饰。
二. 平台主要部分
1. m6A-TSDB
m6A-TSHub的总体设计如图1所示。首先介绍的是m6A-TSDB,这是一个m6A位点的综合数据库,其中包括从GEO数据库下载的78例m6A-seq样本的原始测序数据,这些样本涉及23个健康人体组织的表观转录组谱。平台利用深度神经网络预测了组织特异性RNA甲基化模式。此外为了评估癌症体细胞变异对其起源组织中m6A甲基化的影响,平台也从TCGA中收集了来自27种不同癌症的2587191个癌症体细胞变异以及对应17种组织类型的25个癌细胞系的155个m6A-seq样本用于验证变异对m6A甲基化的预测影响。
2. m6A-TSFinder
接下来介绍的是m6A-TSFinder,这部分是一个从RNA序列中高精度预测特定组织中m6A甲基化位点的web服务器,其使用一个弱监督进行学习的框架WeakRM(图2),该框架能够将序列级别的标签作为输入,并预测最有可能包含RNA修饰的子区域。
3. m6A-TSVar和m6A-CAVar
文章的这一部分对m6A-TSVar和m6A-CAVar进行了介绍。m6A-TSVar:能够用于评估遗传变异对组织特异性m6A RNA修饰的影响。m6A-CAVar则包含了TCGA 27种癌症中预测的会影响癌症原发组织中m6A修饰的突变。研究将会导致特定组织中m6A甲基化的增加或减少的突变定义为组织特异性m6A变异,其中组织特异性推断是由m6A-TSFinder实现的,且这些预测的组织特异性m6A变异会被进一步划分为低中高三个置信水平(图3)。
三.平台的应用
1. 从m6A- TSDB检索23个正常人体组织和25个癌细胞系的m6A位点
m6A-TSDB中包含从23个正常人体组织和25个癌症样本中收集了184554和499369个含有m6A的峰。此外,所有含m6A的峰都标记了这些位点受癌症体细胞变异的影响和潜在转录后调控的信息,且m6A-TSDB中收集的所有数据都可以免费下载或共享。因此,该平台可以用来检索23个正常人体组织和25个癌细胞系的m6A位点。
2. m6A-TSFinder预测组织特异性m6A位点的性能评估
该平台使用10倍交叉验证和独立测试评估预测组织特异性m6A位点的性能。对于每个不同的人体组织,研究随机选择实验验证的15%的m6A位点,并将其作为独立的测试数据集。将训练数据随机分为10组进行10倍交叉验证,结果观察到大多数组织的预测的ROC曲线下面积在0.8 - 0.85之间,表现出良好的预测性能。
3. 通过m6A- TSVar评估基因变异对组织特异性m6A位点的影响
m6A-TSVar web服务器能够利用深度神经网络评估基因变异对组织特异性m6A RNA甲基化的影响。该平台将从23个人体组织中收集的经实验验证的m6A峰整合,计算突变影响m6A甲基化概率的变化,返回突变对m6A甲基化影响的极端值。m6A- TSVar是首个通过整合组织特异性m6A模式来探索特定组织内变异影响m6A的web服务器。
4. 通过m6A- CAVar筛选影响原发组织中m6A的癌症变异
m6A-CAVar中包括TCGA中提取的27个癌症的体细胞变异,平台评估了它们对相应健康人体组织中m6A RNA修饰的影响,并用17个配对的正常和肿瘤样本进行了验证,结果共有587983个癌症体细胞变异被预测会影响其起源组织中的m6A甲基化状态。因此m6A- CAVar可以用来筛选影响原发组织中m6A的癌症变异。
5. 解析癌症m6A变异的组织特异性
m6A-TSHub也可以用来解析癌症m6A变异的组织特异性。平台计算了在不同数量组织中发挥功能的m6A变异体的比例,结果发现大多数m6A相关癌症变异是组织和癌症特异性的,只有约1.17%的m6A相关癌症变异在三种以上癌症起源组织中发挥功能(图4A),不过基因水平上具有较高的一致性(图4B),平台也分析了两种不同组织之间共享m6A突变携带基因的比例,结果观察到皮肤、胃等大部分组织之间存在很强的相关性。然而,心脏、睾丸和甲状腺等组织与其他组织的关联相当弱(图4C)。
6. web界面和应用程序交互
m6A-TSHub具有用户友好的web界面,具有多种功能,包括数据库和在线服务,用户能够快速查询数据库,上传自定义作业,并下载所有m6A在组织层面的相关信息。用户可以根据组织(图5A)、不同癌症类型以及其他过滤条件(如基因类型、m6A状态、置信度和疾病关联等(图5B)),查询包括TCGA项目名称、肿瘤生长组织、基因、染色体区域、COSMIC ID和疾病表型等信息(图5C)。m6A- TSDB(图5D)和m6ACAVar(图5E)中也收集了组织特异性m6A峰和癌症m6A相关变异(图5E)的详细信息并查看(图5F)。此外,在线服务器也允许用户在定义的区域内识别m6A位点和m6A相关变异体,并选择组织(图5G和H)。
7. 实用研究案例
文章最后介绍了三个利用该平台研究m6A的案例。案例1:结肠癌中的PIK3CA变异。以往有研究报道m6A RNA修饰在结肠癌中发挥重要作用,目前尚不清楚哪一单基因变异可能导致m6A失调。作者在m6A-CAVar中发现3号染色体的PIK3CA体细胞变异被预测能够消除3号染色中一个区域的m6A甲基化。案例2:胶质母细胞瘤中的PLEC变异。胶质母细胞瘤(GBM)是最具侵袭性的脑肿瘤类型,之前已经有研究指出m6A在这种疾病中具有关键作用。作者在该研究中发现PLEC上的一个体细胞癌症变异被预测与大脑中一个m6A位点有关。案例3:肺癌中的EGFR变异。大量研究已经发现m6A RNA修饰与人类肺癌相关。有研究发现在肺鳞状细胞癌中m6A 会调节EGFR表达并促进人肺癌细胞侵袭。因此作者在m6A-CAVar数据库首页以基因名称“EGFR”进行搜索,然后对结果进行筛选,只保留与肺组织相关的记录,结果得到来自两种肺癌的共10种癌症m6A相关变异(图6A和B)。作者也通过简单地单击人体图中的相关位置(图6C)查询到了在肺组织中起作用的m6A相关改变记录(图6D)。
到这里这篇文章的主要内容就介绍完了,文章介绍了一个研究特定癌症类型或组织中m6A的数据库资源,小编奉上该数据库的网址:www.xjtlu.edu.cn/biologicalsciences/m6ats。小编查询发现近两年m6A相关文章的数量一直在增长,可见m6A是目前的一个热点方向,而该数据资源能够帮助小伙伴探索人类组织特异的m6A以及癌症中m6A相关的基因组变异,是一个很有用的数据资源。