广告:
最近公众号有人咨询我,让我推荐下好的资料和培训课程,小编最近找了下相关的资料,有一个课程特别适合生信初学者,于是小编就申请了代理,详情请见第二条消息
正文开始:
关于转录组测序和分析通常是为了做基因功能的,常规意义上转录组分为有参考基因组和没有参考基因组两种类型。当然存在参考基因组的质量相对会高一些,但是如果参考基因组质量很差的话,说实话,还不如直接用无参效果好。
关于转录组的研究,重点在于所要研究的问题和根据问题相关的实验设计,转录组设计这里一定要做好质控,尽量减少不相关因素的干扰,尽量做到有重复(推荐三个),这样的结果才有统计学意义(因为相关不一定可再现)。
根据好的实验设计,然后测序和分析,常规分析中一般的结果包括:组装结果、功能注释结果、mRNA表达量计算、差异基因筛选、功能和通路富集分析、时间序列分析、共表达网络分析等。
此时,要进入整理分析结果写文章的环节了,但是我们发现面对分析报告,不知如何下手。今天,小编教你如何整理出一篇5分转录组文章主体框架。
1、整体介绍
文章第一部分是介绍实验方案,如实验目的、实验材料、测序方法等,以及对转录组测序数据的一个整体评估和分析,包括原始数据量、数据过滤、数据组装等。以无参转录组为例,可以用下表呈现结果:
2. 差异表达基因的筛选
根据实验方案,选择不同样品筛选差异表达基因,分析比较不同分组间相同表达和差异表达基因数目,同时也可以按照上调和下调对差异基因进行进一步分类。根据不同样品间差异基因数目初步分析样品间的生物学关系。此部分一般用样品间差异基因维恩图来显示结果:
3. 差异基因功能富集和通路分析
为了解析生物学过程的具体机理,需要对不同样品间的差异基因进行功能富集和通路分析。此部分可以根据功能富集和通路分析结果详细讨论样品间共有和特异性状的具体机理。结果呈现方式如下:
4. 时间序列分析
该分析使用于2个以上的时间序列样本,分析随时间推移基因表达变化模式,针对不同模式的基因集可做表达模式图及GO分类图、KEGG通路分析,从而揭示该生物学过程的具体机理。结果呈现方式如下:
5. 共表达网络模块分析
用WGCNA进行基因共表达网络分析,WGCNA适用于复杂的数据模式,推荐5组以上的数据。例如:器官发育的5个时期;胁迫或病原菌侵染前后的5个时间点。用WGCNA提取出不同基因模块,分析模块与表型的关联性,并对模块进行生物学功能鉴定,分析模块间的相互作用关系,且找到每个模块的关键基因,结果呈现方式如下图:
6、其他分析
为了让结论更具有可行性,让文章更丰满,可以考虑结合其他方法进行联合分析,从而使文章更上一层楼。
主要有三种方式:
一、为与lncRNA、circRNA、小RNA、甲基化进行联合分析;
二、为结合公共数据库,下载相关数据,如同一物种不同材料相同处理的原始数据,进行如上转录组数据分析,从而总结出同一物种某种处理的核心保守基因;
三、为结合蛋白组、代谢组以及其他实验方法对找到的核心关键基因进行功能验证。
综上所述,一篇转录组文章的主体框架已经出现,思路清晰,结果明确。
参考文献
Fu Y., Poli M.., (2016) Dissection of early transcriptional responses to water stress in Arundo donax L. by unigene-based RNA-seq. Biotechnology for Biofuels. DOI 10.1186
Sun Q., Du X., (2016) To be a flower or fruiting branch: insights revealed by mRNA and Small RNA transcriptomes from different cotton developmental stages. Scientific reports. DOI: 10.1038
Vlasova A., Capella-Gutiérrez S., (2016) Genome and transcriptome analysis of the Mesoamerican common bean and the role of gene duplications in establishing tissue and temporal specialization of genes. Genome Biology. DOI 10.1186
根据原文作者:BMK-Cloud文章整理,文章有删改
欢迎关注生信人