最近,大家都说纯生信不好发了,大环境不好了,虽然我们不是做文章服务的,我们只是做生信数据个性化挖掘服务,但是小编还是可以负责的告诉你,不是纯生信不好发了,是你的纯生信不好发了,马云家的纯生信就做的很好。
数据挖掘其实是一个发现和探索的过程,属于发现,不属于发明。
你不管通过自测数据,还是公开的数据进行挖掘完毕,你只能说你发现了一个或者找到了新的marke,但是你不能说你发明了一个marker。
首要的共识有了,数据挖掘是一个发现过程。有了这个共识,更深入的理解就是面对某一种疾病,以及其对应的现有的数据,在开始挖掘之前,结果好坏冥冥之中是注定的,该有的技术都加上的情况下,不会存在漏网的情况。当然也得接受这批数据就是没有金子,即使耗费再多的人力物力财力,该没有还是没有。
这好比生信人就是矿工,甲方爸爸就是煤老板,煤老板花了钱,说在这个地方给我打个井,势必也考虑过没有煤的情况。
也就是说打个井,挖不出煤,或者挖出金矿,对煤老板是有机遇和风险的,但是对于矿工来说挣的就是挖土的钱而已。不应该因为没有煤或有金矿,接受奖惩。
ok,为矿工开脱完毕,继续说大环境的问题。现在纯生信分析不是不好做了,是到了纯生信分析下半场(蹭热点)。之前的纯生信挖掘过于生猛,简单粗暴。数据整合较多,但是挖掘部分,如蜻蜓点水,四处出击,但始终不能深入其中,断其一指。整体的结果就是数据满目疮痍,但是都是点到为止。
小编认为接下来的纯生信转型有两个方向,第一个转型生信人由粗放型的挖掘转为精细型工种,不求面面俱到,只求某一个点可以做到深入。这个需要生信技术跟临床医生或者科研工作者,紧密结合起来。信息互通有无,不存在利用信息不对称忽悠的成分,这样纯生信才能更好的融入集团军,发挥更大的作战优势。第二个转型是数据端的,对于一些之前挖掘过的数据,进行二次挖掘,但是请注意这次挖掘一定要忘记见好就收的目的性。而是不达目的不放弃的深挖,将数据吸干,然后丢掉。为啥有第二个观点,是因为从小编看来公开的数据库远远没有挖掘干净,金矿无处不在。
可以参考的案例有很多,就举19年的案例,三连发的结直肠癌可变剪切,层出不穷的预后分析,ceRNA分析,核心基因分析等等,都是一个套路33种癌型,一次又一次。
简单的通过结题报告就能发文章的时代一去不复返,生信分析下半场,更多的在于谁能更为深入,我还是看好整个生信行业的发展的。
当然生信是一个服务行业, 离不开甲方爸爸们观念的转变,最重要的转变应该还是能接受结果不好的事实,能不是谈结果色变,将自己的预期稍微佛系一点,毕竟如果自己挖掘,结果也不一定好,而且很累,而且很耗时,能接受自己做结果不好,也应该接受代做结果不好。
生信作为服务业服务客户,我觉得有一个非常合适的例子,就是好比双方结婚,客户说你能不能生孩子一样。我其实也不知道能不能生,但是我会努力。
毕竟谋事在人,成事在天。
更多生信分析套路,请加微信13621202201
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史