COXPRESdb v7:由23个共表达平台支持的11种动物的基因共表达数据库,用于技术评估和进化推理
Hello,大家好,最近小编看见一篇有关基因共表达的数据库,简直是做共表达研究的小伙伴们的福音啊~特此分享给大家----COXPRESdb v7: a gene coexpression database for 11 animal species supported by 23 coexpression platforms for technical evaluation and evolutionary inference
该文章于2018年11月20日发表在NAR杂志上,影响因子11.561
通过阅读摘要小编简单了解到RNA测序和微阵列技术的出现导致在各种细胞,器官和个体条件下为多种生物体产生的转录组数据的快速增加。此处画重点,也就是共表达的含义,它指的是在各种条件下基因表达模式的相似性,例如疾病状态,组织类型和发育阶段。由于基因共表达数据的质量取决于转录组数据的质量和数量,因此及时使用不断增长的数据是促进分子生物学个体研究的关键。
COXPRESdb(http://coxpresdb.jp)是一个为11种动物提供共表达信息的数据库。COXPRESdb的一个特征是它能够比较来自不同转录组学技术和不同物种的多个共表达数据,这极大地减少了单个基因共表达数据中的假阳性关系。在这里,作者总结了该数据库的当前版本,包括迄今为止具有最高级别质量的23个共表达平台。利用COX-PRESdb中的各种功能,新的共表达数据将支持从分子生物学到医学科学的更广泛的研究领域。
数据库内容
下表列出了COXPRESdb中提供的最新共表达数据集
该数据库提供了所有11种物种的23个共表达平台的信息。为了从给定的基因表达矩阵中检索与条件无关的共表达信息,应该减少样本冗余。在COXPRESdb版本7中,作者采用主成分分析作为部分或完全冗余样本的降维技术来解决样本冗余的问题。
接下来作者描述了用于评估来自不同方面的共表达数据的质量的三种方式:
(1) 通过通路注释对共表达数据进行质量评估
作者检查了共表达数据与通路注释的一致性。在这里作者使用KEGG通路注释,不仅能够比较物种内的共表达数据质量, 还允许对不同物种进行粗略比较。COXPRESdb中先前和当前共表达数据的KEGG得分如下图所示,表明共表达数据通常持续改进。这些改进主要是由于公开可获得的转录组数据的数量增加以及共表达计算方法的改进。
(2)共表达平台之间的相似性
多共表达数据的比较是评估和提高共表达数据可靠性的核心思想。在这里作者使用16 110个基因对比较了四个共表达平台(Hsa-m2,Hsa-r,Mmu-m和Mmu-r)。如下图所示,显示了人和小鼠四个平台的MR值比较。
为了掌握23个共表达平台之间的全局关系,作者使用Spearman相关系数构建平台的相似性矩阵。如下图所示,其显示了COXPRESdb中当前共表达数据之间的相似性。
(3)评估每个共表达的基因列表
为了提供共表达基因列表的再现性信息,作者将基因列表中的每个共表达关系与相同物种中的相同基因对和其他物种中的直系同源基因对进行比较。为了在视觉上总结共表达基因列表中强共表达的重合程度,作者引入了可支持性,其指的是共表达基因列表的前1%的顺序与直系同源指导基因的顺序的相似性。相似性等级表示为4个分位数等级(等级0到等级-3)。如下图所示
下面小编以数据库自带的例子简单看下数据库的搜索,浏览,绘图,以及下载功能
搜索:此工具栏可通过基因列表,EdgeAnnotation,CoExSearch等三个方式进行搜索,我们以基因列表搜索为例:
结果包括基因Symbol,物种信息,基因共表达,UniProt ID号等等
点击共Gene expression得到:
绘图:该工具栏可通过NetworkDrawer,HCluster,CoexViewer绘制基因共表达网络,我们以NetworkDrawer为例:
浏览:此工具栏可以查看49种组织提供组织特异性网络
下载:这里我们可以下载感兴趣的数据,包括共表达数据,蛋白质亚细胞定位信息等。
比如要下载基因共表达信息,选择相应的物种就可以将进行下载了
好啦,小编只是简单介绍了下该数据库,更多精彩还请感兴趣的宝宝们自己操作啦!网址:http://coxpresdb.jp
过年了,送给大家一个喷雾吧~
更多生信分析需求,请联系电话(同微信号):13120220117