最新的Scallop软件介绍
首先跟大家汇报下,生信人驻场小编主要有sxr、sxr1、sxr2等,还有一些其他的间歇性小编。在此一并感谢。
这一天sxr1找到我sxr,让我解读下17年11月nature biotechnology上的一篇转录本组装的文章。
Accurate assembly of transcripts through phasepreserving graph decomposition
这是一篇关于算法的文章。
算法的文章,之前小编也还在研究基因预测的时候,还是写过几篇关于算法的文章。
今天跟大家介绍的这篇是基于参考基因组来进行转录本组装的软件或者算法。
软件名字Scallop,这个软件通过preserving graph decomposition方法能够在多个exon或者表达量较低的转录本上实现较为高准确性的组装。
文章称在10个人的RNA-seq样本中,通过5个样本训练,对其他的5个样本数据进行组装(模式识别,人工智能),在都外显子识别时效果比StringTie和TransComb提升30%多,在低表达的转录本中更是超多50%以上。
这个软件需要的数据是read和参考基因组比对的结果文件,也就是说他需要跟tophat、STAR、HISAT2等软件进行结合使用。下图是其利用三种不同的比对软件,跟StringTie和TransComb比较的图,可以看出Scallop确实更准确,更敏感。
这个是这个软件的算法流程图
彩蛋*新的有参转录本组装流程
依照文章中讲的,这个SCALLOP软件在跟Tophat2结合的时候效果最好,另外其定量的时候还可以跟Salmon或者Kallisto结合使用。也就是说可能存在一套新的有参转录本组装流程:
Tophat2+Scallop+Kallisto 小鲜肉
说到这里,大家温习下目前有参转录组定量的流程,希望大家补充。
Tophat2+Cufflinks 经典
HiSAT2+StringTie 16年爆款
Kallisto 单干,更快哦
除此之外,还有一种就是2+3,也就是三代测全长转录组+二代定量。
这个虽然是一个技术,但是他不需要组装,也就是说不需要Scallop。
那么问题来了,目前您用的是那套流程啊。去投票吧。
用了其他的流程的,欢迎留言~~