好久没有写数据库的推送了,于是今天小编向大家推荐一个干货满满的数据库——TCSBN,也就是组织与癌症特异性生物网络数据库。这篇数据库文章于2018年1月发表在NAR上面,影响因子11+哦!
先来简单介绍一下这个数据库,该数据库允许科研宝宝们通过特定的方式使用共表达网络来探索基因和给定组织/癌症中的生物功能之间的关系。每个基因与人类蛋白质图谱(HPA)连接,用户可以在此查找主要人类组织中的蛋白质和mRNA表达以及蛋白质的亚细胞定位。此外,用户可以通过在人体组织中使用INs(整合网络)和CNs(共表达网络)来研究功能和物理相互作用之间的重叠,所以它的主要优势是探索各种人体组织和癌症的共表达图谱。
这个数据库搭建的目的是什么呢?作者通过整合代谢,调节和蛋白质-蛋白质相互作用网络,为肝脏,肌肉和脂肪组织生成组织特异性整合网络,还为46种正常组织和17种癌症生成人类共表达网络,以探索基因之间的功能关系及其与生物功能的关系。这些网络可用于组学数据的分析,通过识别关键生物组分来提供对疾病机制的详细了解,并最终可用于制定有效的治疗策略。此外,网络的比较分析可以识别用于开发对其他人体组织具有最小毒性作用的组织特异性药靶。基于这些目的,所以搭建了一个平台即TCSBN,展示了这些网络。
话不多说,小编带大家上车熟悉使用这个数据库。用户可以在每个生物网络中探索用户所查询基因的邻居,识别与查询基因直接互作或共表达的基因。首先,选择网络类型,分别是正常组织/癌症人类共表达网络和正常组织整合网络。然后输入所要查询的基因,用户可以选择所查询基因的邻居的方向:从源节点到目标节点,或者从目标节点到源节点。对于综合网络来说,用户若想查找基因的调节因子,选择“target to source ”选项;若是查找基因的靶基因,选择“source to target”选项。在下图中,举例使用“target to source”选项在肝脏整合网络中查找FASN的调节因子。
另外,用户可以设置参数用来描述查询基因的邻居的最大节点数,限制网络大小以达到最优化可视化目的。该数据库包括另一个参数,称为边缘修剪参数,意思是显示用户自定义的统计重要性的边,默认P值设置为0.01,但用户可以在全范围的P值中自定义更改。
结果展示部分根据绝对相关系数对相邻基因进行排序,并给出相应的相关系数和P值。因此,用户可以根据自己的研究需要选择具有期望统计意义的基因邻居。
该数据库还在“Search Genes”和“Related Genes”表中显示了所选组织中基因的表达量:每个组织样本中带有标准偏差的平均表达值,最小和最大表达值。
对于整合网络,该数据库使用了来自相应组织的GTEx RNA-seq的基因表达信息,用户可以点击基因的超链接(Ensembl ID)去查看该基因在HPA(人类蛋白质图谱)中的蛋白质表达。
例如,当我们通过超链接查看CPT1A的邻居时,发现载脂蛋白A-V(APOA5)是HPA数据库中的肝组织富集基因,而CPT2在所有人组织中表达。总之,用户可以通过到HPA的超链接来查看基因的组织特异性。
所有网络图像和表达值以及边列表都可以分别作为图像文件和CSV文件下载。此外,保存为CSV文件的边列表可以导入Cytoscape作进一步分析。如有需要,该数据库还提供所有网络类型相关数据的下载。
好了,今天就介绍到这里吧!有兴趣的朋友可以通过http://inetmodels.com访问该数据库了解一下!
参考文献:TCSBN: a database of tissue and cancer specificbiological networks
更多套路,生信分析需求,请加微信:13895744602
欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史