充分的利用公开数据库设计,分析,挖掘自己的课题已经成为最具有性价比的选择。
但是往往有一些自己关注的疾病,组织,临床信息公开的情况下,没有办法第一时间知道。
如果点灯熬油的去紧跟生信热点,自己倒没什么,但是一旦有了黑眼圈,那就麻烦了。
后台好多小伙伴问我们如何捕捉到最新数据的更新的,其实这个操作比较简单。
首先打开GEO数据库,当然好多小伙伴会说,现在貌似打不开,小编建议你手机开热点,电脑连上打开
。
然后点击这个红框中的dataset Browser 进入选择series,进入如下页面
这个页面中就是数据更新的日期,提供方,物种信息,组学信息,我们可以选择homo ,然后选择样本数大于30的,进行筛选,或者下载excel,本地进行过滤。当然这样其实还是拿不到一些临床和分析上关注的指标,比如来源是什么组织,是否有预后信息,检测的探针有多少个等(太少了,不能用于分析)。对于这些只能是通个这个页面再次打开去看下,这样最为保险。如果是用于调研数据和评估,其实还有一个简单的方法,就是爬虫进入去获取这些信息。
考虑到大家缺少爬虫的能力,主要为了让大家告别黑眼圈,从此轻松做科研,我们内部设计并开发了一个简单的GEO数据检索工具。支持windows环境,双击就可以运行,支持两种操作模式:第一种是检测过去20天内GEO中更新的人类的数据,然后筛选掉样本量小于25的,同时爬虫探针数据,组织来源,预后信息等,并最后以表格形式呈现。对于快速获取最新数据并进行调研,非常具有帮助。现在该工具,免费分享给大家使用