背景介绍:
基因测序数据分析了许多,致病变异位点也找到了不少。可是如何解释这些变异的作用,仍然是一个巨大的挑战?如果你知道蛋白翻译后修饰(PTMs),则多了一种研究突变-疾病的利器。PTMs对于发挥其正常的生物学功能是十分重要的,已经成为医学研究中的热点问题。目前,已发现的翻译后修饰形式有400种之多,其中在人体蛋白中主要为:磷酸化(Phosphorylation), 泛素化(ubiquitination),乙酰化(acetylation)和甲基化(methylation)。在已报道的致病位点中,大部分的变异位点为错义突变,其改变主要在蛋白层面;其中,又有21%的错义SNVs位于蛋白翻译后修饰位点(protein sites of post-translational modifications (PTMs))区域,对于这些突变,将PTM信息纳入到分析中,对理解致病机制及预测致病性是很有意义的。
ActiveDriverDB数据库介绍
1)数据来源:ActiveDriverDB整合了大量不同类型的数据库。在基因层面,有来自于TCGA的34种外显子测序的约9000个肿瘤样本的体细胞突变信息、Clinvar数据库的遗传病突变位点信息以及KG和ExAC等大规模的基因组学测序数据。在蛋白层面,有经实验确定的来源于PhosphositePlus、Phospho.ELM和HPRD数据库的人类PTM位点信息,四种主要PTM(磷酸化、乙酰化、泛素化和甲基化)的蛋白信息,位点特异性的蛋白-蛋白信息(底物蛋白和上游的酶,来源于DrguBand数据库的药物-酶信息等。最终,整合了>385,000已报道的PTM sites 和 ∼3.6 million 错义突变位点。
2)突变对PTM位点的影响
采用一定的方法,将基因坐标转换为蛋白坐标,进而将相关突变mapping 至PTM区域。其中,位于PTM区域的突变称之为direct mutations,在PTM区域的附近突变称之为indirect mutations(其中,距离1-2个氨基酸距离称之为proximal ,3-7称之为 distal);数据库采用机器学习算法MINP来预测与PTM 相关的突变位点是否会破坏原有的激酶结合motif(或形成新的motif),进而预测突变对细胞信号网络的影响。
3)可视化
主要有两个方面的可视化:(1)Protein sequence view: 包括突变对PTMs的影响,序列特征和网络重塑。如下图A,突变在蛋白序列上的分布,以及与PTM(蓝框)的关系,Y轴表示突变的数量,图B表示 R282W突变破坏了与AURKB的结合motif;图C表示与疾病相关突变影响PTM motif的具体情况。
(2) Interaction network view,包括PTM位点特异性互作, 上游酶和药物靶标;提供的网络有两类:高置信的实验结果和计算机预测结果。如图D表示TP53蛋白互作图及其PTM位点与上游酶的特异性互作。
4)搜索功能:
(1)Searching for genes, pathways, and diseases
(2)Searching for mutations
(3)Browsing top disease-associated genes and pathways
(4)Analyzing custom datasets of mutations
(5)Application programming interface (API)
ActiveDriverDB数据库使用
该数据网站网址: https://www.ActiveDriverDB.org,页面如下图。
其使用简单,多为傻瓜式操作,我们以最为关心的“分析变异位点”为例来展现其操作。
1)进入页面(下图),点击SEARCH,选择MUTATIONS:
进入如下页面(下图)
2)变异数据上传(注:右上角有Login的标示,请注册账号登录)
将要预测的变异位点上传至数据库有2种方式:1)如下图标示1所示,上传VCF文件;2)如标示2所示,直接在方框中输入变异信息,其格式为:一个位点一行,每行可以为 [基因名称,空格,氨基酸替换信息] 的格式,也可以为 [染色体,空格,位点,原始碱基,空格,突变碱基] 的原始变异格式。之后点击Search(标示3)
3) 结果
而后我们会得到如下图所示的结果,主要的有用信息为两列:1)is PTM? 表示该变异是否是PTM ;2)Impact 表示该变异的影响,主要是对分子网络的影响,进而有助于我们评估该突变是否对表型有影响。当然,也可以点击右侧的mutation details 查看更多的具体信息。
总结
总之,ActiveDriverDB数据库在分析变异对蛋白翻译后修饰的影响上是一个不错的工具,该数据库包括了遗传病和肿瘤两类与基因关系最密切的病种,数据来源较广,且维护较好;对于我们扩展变异的功能研究上,提供了新的视角。
参考文献:Krassowski M, Paczkowska M, Cullion K, et al. ActiveDriverDB: human disease mutations and genome variation in post-translational modification sites of proteins[J]. Nucleic acids research, 2017, 46(D1): D901-D910.