Tophat中mate-inner-dist的介绍
随着转录组项目的火爆,tohat软件的应用也越来越多,但是对于tophat中角落的一个参数mate-inner-dist这个参数默认是(50),你了解多少呢,据我所知大多数的同学对这个参数的选择就是默认,不管我的插入片段是多少,我都默认。这里可能会对项目的分析造成影响,具体的影响有多大,我暂时没有评估。
官网中这个参数的描述如下:-r/--mate-inner-dist <int> This is the expected (mean) inner distance between mate pairs. For, example, for paired end runs with fragments selected at 300bp, where each end is 50bp, you should set -r to be 200. The default is 50bp.
比如说回溶片段为300 ,read的长度为75(双端),那么我的mate-inner-dist是150。如果read是125,那么我的mate-inner-dist是50.
如果我的毁容片段是200,read长度是100,那么这个mate-inner-dist,可以选择10 ,就不要写50这么大啦,不过这里选择默认也不会影响很大。
当然单纯的依靠均值来做并不是十分的稳妥,同时tophat提供了另外一个参数 --mate-std-dev default:20 inner距离的标准偏差。
例如:
对一物种的两个样本A和B使用Illumina Hiseq2000分别进行了转录组测序,得到了结果文件A.reads1_1.fastq, A.reads1_2.fastq, B.reads1_1.fastq 和 B.reads1_2fastq。测序文库的插入片段长度为200bp,reads长度为90bp。物种的基因组文件为species.fasta。请用Tophat分析该物种的转录结合位点,indel信息?
bowtie2-build species.fastq species $ tophat --read-realign-edit-dist 0 -o ./tophat_out -r 20 --mate-std-dev 20 --coverage-search --microexon-search -p 24 --library-type fr-unstranded species A.reads1_1.fastq,B.reads1_1.fastq A.reads1_2.fastq B.reads1_2fastq
如果你中枪啦,就麻利的关注一下吧!