小编最近在帮助别人解决问题的时候,发现了一个大问题。
就是那个童鞋的基因蛋白文件和基因的核酸序列文件不配套。
首先大家下载物种的pep和cds序列的时候。建议首选JGI。
因为JGI的gff、pep、cds是配套的。
JGI如果没有的情况下,去NCBI,但是去NCBI一定要注意:
NCBI不提供CDS序列的。千万别把transcript(转录本)当成CDS序列。
这两的区别在于transcript=UTR+CDS+Intron.
中枪的小朋友们,默默点赞吧。我敢说肯定有不少人会犯这个错误。
话说回来,如果JGI没有,我还想要,怎么办,只能自己根据gff进行提取啦。
注意提序列的时候注意非3倍数、序列中间出现终止、起始密码子、终止密码子哦。
还有:负链上的记得取反向互补。
欢迎关注生信人