
生信人之前推过很多的课程,但是课程都侧重于套路的复现和思路的复现,或者就是过于基础的课程。这次我们推出的课程更加侧重于分析技能和技巧的讲解,相信客户能够更好的进行复现和重复。2、所涉及的代码操作,参数全部外置,客户可以不用读懂代码也可以操作。4、所有的课程都提供demo数据测试,并经过了内部审核。





以下是视频的word版本
小编给大家介绍几种对于分析结果展示的方式以及外部验证的方法。方法一:利用R包(ggpubr)绘制直方图,小提琴图或箱线图。利用不同的图形,表现疾病marker在case和control中的表达差异,并添加P值。


圆圈图中,我们可以清晰的看到基因和基因之间表达的关系,这个R包最大的优势就是利用高级函数把低级函数组合起来。
方法三:在线生存分析工具(https://kmplot.com/analysis/)KM-plotter是一个在线进行生存分析的网站。目前网站可以针对54,675 个基因、18,674个癌症样本展开研究,涉及了乳腺癌、肺癌等等;数据类型有芯片数据、高通量测序数据,涉及mRNA和miRNA,并且在不断丰富之中。
根据自己的数据类型和所需要的背景数据,选择要进入的界面,然后输入基因:
选择自己需要的参数设置,点击绘制km生存曲线,就可以得到结果:

方法四:在线多功能富集(http://amp.pharm.mssm.edu/Enrichr/)Enrichr是一个基于网页端的综合性的基因集富集分析工具。富集分析是用于分析由全基因组实验产生的基因集合的流行方法。 Enrichr目前包含大量可用于分析和下载的基因组库。 Enrichr总共包含来自102个基因集库的180 184个注释基因集。 Enrichr增加了新功能,包括提交模糊集,上传BED文件,改进的应用程序编程接口以及将结果可视化为簇的能力。我们需要输入特征基因,进行功能富集,查看和疾病的关系
进入主界面,输入基因,点击submit,就可以进行运算,得到功能、疾病等相关富集结果。

大型的国际项目如TCGA,GTEx创造出了大量的转录组数据,为人们提供了数据挖掘、理解基因功能的机会。为了让没有生物信息学背景的研究人员也能够轻易获取、分析生物大数据,北京大学张泽民教授实验室的唐泽方等人通过 R 、Perl等语言对数据进行处理、可视化,设计了癌症大数据分析网站GEPIA 。
选择单基因或者多基因分析,输入特征基因,选择相关癌症: 

方法六:toppgene(https://toppgene.cchmc.org)网站通过和训练集相似的功能注释对测试集基因列表进行优先级排序。


方法七:在线基因分析(https://www.cbioportal.org)cBioPortal提供了这样一种网络资源:探索,可视化和分析多维度癌症基因组数据。这个门户网站把癌组织和细胞系还原成分子表达谱数据,再到可以理解的遗传的(基因的),表观遗传的,gene expression和蛋白events。查询交互界面整合用户的数据可以使研究者交互探索不同samples,genes,pathways的遗传学上的改变,假如暗含的数据可行,还可以联系到临床结果。这个网站还提供gene水平的图形总结,从多平台,网络可视化分析,生存分析,病人为中心的查询,和软件编程入口。直观的网站交互界面使得复杂的癌症基因组profiles对没有生物信息学专业只是的研究者和临床工作者可行,这样就促进了生物学发现。



利用R包(e1071),将疾病相关marker作为特征,对case和control进行分类,根据ROC曲线,查看分类效果:
欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史
