今天到现在才更新的是因为小编上午去考科目三去了,再经过5次机会之后,终于过了。谢天谢地啊。不多感慨,干货送给大家。
Interpro是一个数据库,它里面有蛋白功能,蛋白家族等信息。而Interproscan就是可以将你的蛋白序列跟这个这个数据比对,从而给你的序列功能注释。
Interproscan5新增了一些功能
Phobius用来预测跨膜和信号肽
可以把结果map到上传的数据上
寻找蛋白可能的生物学代谢途径
新的输出格式XML和GFF3.0
提升了图形界面,下面咱们一起来一步一步的完成Interproscan5的本地化安装
1、系统环境及配置
环境:centos
查看系统使用
[AppleScript] 纯文本查看 复制代码
1 | uname - a |
2、数据下载
要下载三套数据分别为:
一.interproscan5 主程序,命令:
[AppleScript] 纯文本查看 复制代码
1 |
|
注意如果是32位的系统请选择32位,如果怕数据丢失需要MD5验证可以下载MD5文件命令:
[AppleScript] 纯文本查看 复制代码
1 2 |
md 5 sum - c interproscan -5.22 -61.0 -64 - bit.tar.gz.md 5 |
二.下载Panther Model,这是一个interproscan子模块,需要单独下载,命令:
[AppleScript] 纯文本查看 复制代码
1 |
|
注意MD5,和第一步一样
三.下载interproscan5本地Pre-calculated Match Lookup服务器,命令:
[AppleScript] 纯文本查看 复制代码
1 |
|
注意版本对应起来
3、数据解压和环境配置
一.查看系统java是否安装如果没有安装,先安装java(安装方法和设置环境变量请自行谷歌),并设置环境变量,查看java版本命令:
[AppleScript] 纯文本查看 复制代码
1 | java - version |
二.解压
[Bash shell] 纯文本查看 复制代码
1 2 3 | tar -xzvf interproscan-5.22-61.0-64-bit. tar .gz tar -xzvf panther-data-9.0. tar .gz tar -xzvf lookup_service_5.22-61.0. tar .gz |
三.配置
1、将panther-data-9.0下的panther文件复制到interproscan-5.22-61.0的data文件夹下,文件名为panther
2、编辑interproscan-5.22-61.0文件下的interproscan.properties文件,修改两处地方如下:
注意修改第一处是将panther文件文件路径配置进去,第二处是将本地服务配置进去,这里注释了远程服务加入本地服务,本地服务端口为8081,当然更多的配置都在里面可以慢慢研究,这里不做过多介绍了
3、启动本地服务
[Bash shell] 纯文本查看 复制代码
1 2 | cd lookup_service_5.22-61.0/
|
四.运行与问题
下载一个fasta文件测试一下是否能够运行文件名为identify.fasta
[AppleScript] 纯文本查看 复制代码
1 2 | cd interproscan -5.22 -61.0
|
一段时间过去出现如下错误:
别慌,这个错误是由于是因为64位系统中安装了32位程序而导致的(这里有些教程很坑爹,重新搞个ncoils把以前的给替换掉没有作用),最有效的方法如下:
[AppleScript] 纯文本查看 复制代码
1 | yum install glibc.i 686 |
如果还报错就再按装:
[AppleScript] 纯文本查看 复制代码
1 | yum install libstdc + + .so. 6 |
最后再运行上述命令:
[AppleScript] 纯文本查看 复制代码
1 2 | cd interproscan -5.22 -61.0
|
完毕!!!-转载请注明生信人
欢迎关注生信人