百迈客云平台,讲良心话,是小编认为为数不多的几个国内可以用的平台(为老东家打Call)。一不小心,小编拿到了他们内部的测试数据,大家赶紧抢先围观吧。
基因组学研究已成为21世纪生命科学研究领域中非常重要的一部分,且随着近年来高通量测序技术的快速发展,基因数据也呈现出指数增长。如何在基因大数据时代利用好这些数据资源成为生物科研新时代的重要议题。
基因科技研究已迈入2.0时代得益于百迈客云平台BMKCloud的普及带来的便利和高效。百迈客云平台2015年上线,这是一个集大数据挖掘、共享、管理和科研协作的整合平台。无需具备生信编程知识,只需通过简单培训,就可以自主完成标准分析和个性化分析,提升分析效率。还可结合云平台上高达12PB的海量公共数据,进行深入挖掘和对比分析,加速科研成果产出。
小编也拿到了BMKCloud在2017年内孵化的文章,也在BMKCloud上体验了一把,下面由小编和大家细细解析分享。
BMKCloud在2017年内孵化的19篇SCI文章,其研究对象涵盖了粮食作物、经济作物、人、家禽家畜、水产、林木、花卉、瓜果等。植物类占比52.63%,动物类占比42.11%,医学类占比5.26%。(小编认为医学的用户可以深入的了解下)
图1 研究范围分布
发表的杂志有Archives of Toxicology(IF=5.905)、Frontiers in Plant Science(IF=4.298)、Scientific Reports (IF=4.259)等。累计影响因子为65.3。
图2 SCI杂志分布
从通讯作者所属地域来看的话,这些作者主要分布在全国12个省、直辖市,17年产出最多的单位是南京农业大学,有3篇SCI(累计IF 13.23),短期连发多篇文章的老师也不少,南海水产所喻达辉老师4个月内连发两篇(累计IF 6.298),南京农业大学的张艳丽老师在短短2个月内连续发了两篇(累计IF 7.329)
图3 部分科研单位的地理分布
从这些SCI文章中使用的主要分析平台(APP)的来看,使用频率最高的是有参转录组分析平台,占比63%,lncRNA分析平台和小RNA分析平台占比11%,医学外显子分析平台、微生物多样性分析平台、甲基化分析平台各占比5%。
图4 平台使用热度
小编也浏览了一下主页http://www.biocloud.net,分析平台还真不少呢,有真核生物有参转录组、真核生物无参转录组、小RNA、长链非编码RNA、微生物多样性、重测序、ChIP-Seq、CircRNA、全转录组联合分析等非常全面。
图5 BMKCloud分析平台页面
小编也按照提示跑了1个真核有参平台的极速体验,点击进入后,技术应用、平台介绍、技术背景、成功案例、课堂等模块内容一应俱全,特别是课堂里的转录组培训,听完之后,感觉受益匪浅。
1、操作界面交互性做得很好,图形化也非常容易理解和操作,还有贴心的操作提示,培训直播,技术流程指导,简单易学。
2、数据导入、参数设定、任务投放、结果查看&整理均可在平台网页界面完成,不需要Linux命令行界面。
3、BMKCloud的线上培训较全面(有RNA系列、DNA系列、生物信息软件使用和大家讲坛等系列课程),感觉对于小编这种一脸懵逼的科研汪来说,还是很实用滴,等小编有空再一一学习。
除了主流程APP之外,小编也在BMKCloud上看到了100+个分析工具、3款工具集的介绍。涵盖12大功能类别(基因分析、遗传进化、ncRNA、质控、组装、比对、数据提取、突变、统计、表格处理、绘图、序列分析等)。
图6 BMKCloud小工具界面
图7 BMKCloud个性化分析示例
从这19篇SCI内容来看,使用次数最高的分析依次是GO分析、热图、KEGG分析、韦恩图和COG分析。其中热图和GO分析使用率最高,均达到52.63%;此外共表达趋势分析,蛋白互作分析等分析也应用较多。
图8 BMKCloud个性化分析热度一览
4、个性化和小工具模块可以在BMKCloud上切换调用,嗯,这个平台集成化程度挺高的,主流程跑完之后,还可以在“我的任务”栏点击进去,再进行进一步的个性化分析,或者在小工具模块进行后续分析,快速完成数据深度挖掘,效率杠杠滴!
公共收录测序数据12,086,234Gbase,覆盖1100个属,收录数据量top25(人除外)的属如下:
图9 测序数据top25数据量的属
小编也试着检索了一下玉米相关信息,一键导入APP,so easy~
图10 BMKCloud数据库界面
图11 文献库检索过程
5、公共数据库检索还比较好用,过滤栏非常贴心和人性化,可以不下载数据一键导入BMKCloud APP,这样就避免了批量下载数据解压等一系列操作。
6、在文献库里检索研究对象或自测数据的相关文献,可直接勾选有测序数据的文献进行后续公共数据整合分析。
图12 文献库界面
图13 文献库界面
可以选择PMID号/标题/摘要/关键字/基因/作者等多种方式进行检索,另外还可以按匹配度和更新日期按顺序排列已检索到的文献,按发表日期远近、影响因子高低、数据完整度情况、文章类型来进一步精准过滤,轻松捕获热点文献。
7、文献库检索模块设计非常精细和人性化,比直接在NCBI去搜索要方便很多,效率倍增。
BMKCloud多个分析平台以及个性化小工具,可从多角度进行分析挖掘。除此之外,多次挖掘也很容易实现。像小编一般喜欢对同一批样本做好几次分析挖掘,以免漏掉分析关键点。在BMKCloud上实现对同一批样本进行2-4次分析和挖掘,只需要修改参数、阈值或更换参考基因组等后重新投递任务就可以了。
这一点和传统科技服务模式的多环节沟通、多次收费不太一样,当然也能避免沟通环节因信息不对称导致的出错率。
8、不限时间不限地点,随时随地抓住分析灵感,非常方便。
小编也投递了自己的数据,24个样本180G数据,3天跑完,这速度也是没谁了!
9、速度快,另一方面也反映出这种计算资源使用方式比传统本地服务器模式更加经济与高效~!硬件、软件、运维系统都省了,而且貌似还可以弹性扩展呢!
比~