知识中心 - 北京概普生物科技有限公司(GapTech)

做表观遗传药物研究的你，不能错过这个数据库

生信干货 captain ·2018年11月15日 00:31

HEDD：人类表观遗传药物数据库

HEDD简介

表观遗传学已经成为药物发现中一个新颖而重要的研究领域，但用于药物或化合物的资源很少，一般药物数据库包含大量化合物，用户搜索药物相关信息将非常耗时。HEMD等表观遗传学数据库虽不提供某些数据类型，如高通量数据集，并且它们不支持对表观遗传药物相关实验数据的灵活查询。为了克服这些难题，一个相对全面的人类表观遗传药物数据库—HEDD诞生了。HEDD可作为一种研究表观遗传药物在表观遗传修饰重塑中的潜在作用的资源，它侧重于从实验室实验和人工整理信息中获得的表观遗传药物数据集的存储和整合，共包含五种数据集：药物、靶点、疾病、高通量、复合体。HEDD中构建了灵活的搜索选项以便于数据获取，允许用户使用药物名称，疾病和实验类型对特定种类的数据集进行多条件组合查询。采用示意图来解释药物，药物-靶标复合物的结构和结合物的相互作用，并提供了3D结构的视觉功能。

数据资源

目前版本的HEDD由64种表观遗传药物组成，主要来自以下公共药物资源：PubChem Compound，DrugBank和ZINC。相关实验数据（临床试验，结合常数，高通量实验数据和药物-靶标复合物的共晶体结构）从以下公共数据库获得：ClinicalTrials.gov，BindingDB，OMIM，GEO和PDB。这64个药物数据集提供了表观遗传药物的基本信息和结构，571个疾病数据集描述了表观遗传药物治疗疾病的应用，根据研究阶段的不同，疾病数据集分为：批准型、临床试验型和临床前型。

HEDD提供的功能

（1）数据集列表浏览器：HEDD是一个高度模块化的数据库，便于数据的搜索和获取。下图显示了五个数据集列表浏览器的出发点（即药物，靶点，疾病，高通量和复合物）。

数据集列表浏览器的开发是为了根据数据集类别快速浏览数据集。以药物列表浏览器为例，点击“Drug”按钮，用户可以浏览一种表观遗传药物的基本信息，包括药物名称、化学成分、CAS编号、分子式和重量，数据集列表浏览器显示每个页面20条记录，并提供翻页功能(如下图)，用户可以通过单击药物名称（蓝色图标）进入药物数据集页面。

靶点、高通量、复合体的数据集列表浏览器提供了各种数据集的简洁信息。通过浏览这些信息，用户可以决定是否访问相应的数据集并下载相关的实验数据。此外，浏览器页面提供了有用的链接，包括Pubmed（带有PubmedID）和HEDD中的药物数据集（带有药物名称），

而疾病列表浏览器提供药物名称，病症（疾病名称或健康状况），状态（完成或终止），NCT编号（用于临床试验）和阶段。通过点击“NCT number”可以链接到临床试验数据库ClinicalTrials.gov，如下图所示。

（2）使用搜索工具检索表观遗传药物的数据集：HEDD通过提供五种搜索选项支持对各种表观遗传药物和相关数据集的灵活查询，以DRUG搜索为例，用户可以指定他们的查询选项，如药物名称，类别和疾病。如果用户对一种特定的表观遗传药物感兴趣，他们应该按药物名称(同义词)查询。例如用户可以选择选项搜索DRUG并在标有“Drug Name (synonyms):”的文本框中输入“SAHA”，然后单击搜索按钮。“suberoylanilide hydroxamic acid”数据集是此搜索的结果，如下图所示。为了在视觉上理解搜索结果，HEDD提供与搜索结果和数据集列表浏览器相同的组织形式，用户可以输入相应的数据集并下载相关的实验数据。

疾病检索是展示表观遗传药物在临床中应用的一个板块。用户可以单独或共同使用药物名称下拉菜单和疾病文本框来执行疾病搜索过程。使用“suberoylanilide hydroxamic acid”和“breast cancer”作为输入，将返回五个数据集摘要的结果，如下图所示。

TARGET搜索和COMPLEX搜索是研究表观遗传药物抑制剂作用机制细节的两个版块。TARGET搜索侧重于定量描述，COMPLEX搜索侧重于解释空间结构的相互作用。用户可以单独或共同使用药物名称下拉菜单和目标文本框来执行靶点搜索和复合物的搜索过程。使用“suberoylanilide hydroxamic acid”和“histone deacetylase 8”作为输入，TARGET搜索和COMPLEX搜索的结果将分别包含62和4个数据集，如下图所示。

高通量搜索是研究高通量实验在表观遗传药物研究中应用的专用版块。例如对DNA甲基化感兴趣的用户可以从下拉菜单“Methylation profiling by array”中选择“5-Azacytidine” 或其他选项，其他选项为默认值。在这种情况下，将返回使用5-Azacytidine和DNA甲基化摘要注释的三个高通量数据集的结果，如下如所示。

（3）用辛二酰苯胺异羟肟酸的数据解释数据集页面：如下图所示，该页面有三个部分，即介绍、结构和数据集列表。介绍部分提供了药物的基本信息，包括药物种类、CAS号、同义词名称、分子式和重量、简化分子线性输入规范和药物作用的简要描述。为了研究药物的结构，将来自PubChem Compound的一组结构数据整合到药物数据集中，可以通过单击“Structure File Download”按钮 (download format: .sdf)下载。在结构部分，用户可以在Jmol.php的弹出页面中查看3D结构（以CAS编号作为参数），允许使用鼠标来完成Jmol的操作，如旋转，显示和隐藏分子等。数据集列表部分提供了suberoylanilide hydroxamic acid 相关数据集的摘要，可以通过单击相关链接查看这些数据集。

高通量数据集如下图所示，想要在本地分析高通量数据的用户可以通过单击“Download”图标下载原始数据，当原始数据不可用时，将给出指向GEO的链接。

复合物数据集如下图所示，该页面包含标题，PDBID，药物名称和PubmedID链接等信息。为了研究药物-靶标复合物的结构，数据库将PDB的一组结构数据整合到复合物的数据集中，可供用户下载。在结构部分，用户还可以在Jmol.php的弹出页面中查看3D结构（以PDBID作为参数）。此外，还采用了示意图来解释药物与靶点相互作用。

好了，对于这个数据库的介绍和使用就介绍到这里了，想要了解更多的信息的宝宝们，自己进入去看看吧！传送门：http://hedds.org/（阅读原文）

欢迎关注生信人

TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue

基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图

舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史