PolySearch:一种用于提取人类疾病,基因,突变,药物和代谢物之间的关系的基于网络的文本挖掘系统
Hello,大家好,由于小编最近手里要读的文献太多,好久没有写稿子了,今天为大家分享一个搜索神器———PolySearch
该文章发表在NucleicAcids Rearch杂志上,影响因子为11.561
看过了摘要小编了解到:作者考虑到目前科学界的信息量极大但却无法有效地处理,还有目前研究的基因组学,蛋白质组学或代谢组学涉及很多全面的搜索的,但是还没有开发有用的工具来支持这些搜索,因此,作者开发了PolySearchWeb服务器。
在简单的了解了PolySearch后,小编发现它真的是很强大啊,它支持针对近十种不同类型的文本,科学摘要或生物信息数据库的50种不同类别的查询。它支持的典型查询是“给定X,找到所有Y”,其中X或Y可以是疾病,组织,细胞区室,基因/蛋白质名称,SNP,突变,药物和代谢物等等。PolySearch还可以利用文本挖掘和信息检索中的各种技术来识别,突出显示和排列信息摘要,段落或句子。它已经在基因同义词鉴定,蛋白质 - 蛋白质相互作用鉴定和疾病基因鉴定等任务中进行了评估,使用了各种手工组装的“黄金标准”文本资料库。
该服务器的网址:http://wishart.biology.ualberta.ca/polysearch
我们先来看下Polysearch的简介,特点以及内容:
简介:PolySearch,顾名思义,是一种工具,支持多种('poly')类型的数据库中的多种('poly')类型的生物医学文本搜索。它还旨在促进疾病相关人类多态性(SNP)的搜索,检索和编译。PolySearch利用了文本挖掘的最新进展,以及各种生物医学数据库和生物医学词库的易用性,从而允许在许多生物医学领域进行各种各样的复杂或扩展的文本搜索。
特点:PolySearch是一种可通过Web访问的工具,专门用于提取和分析人类疾病,基因/蛋白质,突变(SNP),药物,代谢物,通路,组织,器官和亚细胞定位之间的文本派生关系。
与其他生物医学文本挖掘工具相比,PolySearch的一个显著特点是它不仅提取和分析PubMed数据,还提取和分析来自多个数据库(DrugBank,SwissProt,HGMD,Entrez SNP等)的文本数据。当前文献文本和数据库“factoids”的这种整合允许PolySearch提取和排列仅在数据库中或仅在期刊中不容易找到的信息。
内容:PolySearch由七个基本组件组成:
(i)用于构建查询的基于Web的用户界面;
(ii)内部和外部生物医学数据库的集合;
(iii)生物医学同义词的集合(自定义词典和所有实体列表);
(iv)用于从数据库中提取数据的通用文本搜索引擎;
(v)用于选择,排名和整合内容的模式;
(vi)用于显示和同步结果的显示工具;
(vii)PCR引物设计工具,以促进SNP和突变研究。
下面主要为大家介绍下PolySearch的使用,也就是搜索功能,它包括快速搜索以及高级搜索,我们先来看一下快速搜索:
PolySearch的查询界面是用标准HTML和Perl编写的。比如我们搜索结直肠癌相关的基因或蛋白质相关的研究:
结果得到109个结直肠癌与基因或蛋白质有关的研究,并且按照相关性的排序顺序列出与结直肠癌相关的最可能的基因或蛋白质。
点击PubmedHits得到与结直肠癌相关的COX-2基因的详细描述,包括所在文献的题目,以文献中相关的描述语句:
点击Details得到文献中详细描述:
高级搜索:
在这里可以限定数据库,关键词等等,比如我们限定OMIM数据库:
点击提交后得到:
下面是服务器的“CheckResults”栏:
在此工具栏我们可以使用job ID号来检索以前的搜索结果:
“Thesaurus”栏搜索:
好啦,该服务器就介绍到这里啦,目前已经更新到了PolySearch2.0版本,感兴趣的童鞋可以尽情操作啦!最后送给大家一个喷雾哈
欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史