现如今测序文章越来越多,因此很多老师都需要将数据上传。可是怎么操作呢?不要着急,今天小编借此机会,以微生物基因组为例,手把手教大家上传数据。心动不如行动,快跟小编一起来操作吧,包你学会!
首先第一步:先注册NCBI账号:这一步很简单先打开NCBI的主页(见下图1),注册账号信息,然后邮箱激活账号,完事!
图1
第二步:为项目创建一个Bioproject,跟着小编点起鼠标来,如果你实在觉得困难,参见下图2、图3、图4.小编已经用红色标记为你指引了方向,一目了然!
图2
图3
图4
第三步:创建Biosample。创建完Bioproject,您先别歇着,喝口水,咱们继续为这个项目创建所包含的样本信息。直接点击图5红色正方形的文字,然后按着NCBI的指示,填写跟咱样本有关的信息,就齐活了。然后将创建完成将得到的Biosample编号填入上图空白处。如果创建成功后将返回一个Bioproject的编号,如PRJINAxxxxxx,见图6。
图5
图6
第四步:当进行到这一步的时候,万里长城就成功了一半啦!这一步我们要做的是,序列文件编辑和格式转换( 将*.fa 转换成*.sqn),这一步需要使用软件Sequin (https://www.ncbi.nlm.nih.gov/Sequin/index.html)对提交序列进行格式转换。在这里给大家介绍一种最简单的方法(只上传基因组序列)。软件界面如图7:
图7
选择Start New Submission后界面如图8;
图8
根据上述标题填写完作者基本信息后,点击Next Page后如图9:
图9
此处根据序列的情况进行选择,如果是细菌基因组直接选择默认即可,然后点击Next,如图10:
图10
然后根据序列的类型进行选择,细菌基因组选择Single Sequence和FASTA,点击Next Form,见图11:
导入序列和填写完测序及组装方法后,点击Next Page后点击Add organism,Locations,and genetic codes后填写组织名,序列属性(基因组或者质粒,线粒体等)和遗传密码编码方法,见图12:
图12
随后就是基因组注释信息,这部分可以不填,当我们的序列提交成功后NCBI可以自动帮我们注释。之后直接Next选择GeneBank格式导出.sqn格式序列就可以了。
第五步:填写上传信息表。打开网址:http://www.ncbi.nlm.nih.gov/projects/GenomeSubmit/genome_submit.cgi(见图13),把我们千辛万苦整完的信息按着下图所示填写完毕。就等着好消息吧。一般情况下提交完序列信息,GenBank会自动回复一封邮件到你的邮箱。他们收到你提交的序列信息,会在三个工作日内给你答复。
图13
好了,以上就是数据上传的方法了,各位get到了吗?
文章转载自百迈客
欢迎关注生信人