上周我们推广过一个免疫治疗会一直火的文章,后台很多粉丝留言,这个思路太复杂,学都学不会,烦死了。
于是今天我们直接整理成生信可执行方案,bia给你们。
下载TCGA、GEO相关数据集(3套),选择TCGA数据做为训练集数据
一、对训练集数据非负矩阵拆分(NMF),提取 agene factor matrix W of (n genes × k factors)。
二、ssGSEA筛选免疫相关的NMF factors。
三、选择top150(暂定)基因进行 NMFConsensus聚类 分组为immune and non-immune类。
四、利用NTP对immune-group二次聚类分为 immune-suppressed and immune-activated subtypes。免疫相关分为:免疫激活,免疫抑制两个亚型。(分析中聚类情况会进行调整)
五、模型效应评估(训练集)
六、三个聚类组基因集富集分析,确定聚类组的其他标签属性。
七、两个聚类组(三个聚类组)免疫浸润情况评估。
八、三个聚类组的驱动基因,TMB、CNV瀑布图展示。
九、不同分组的特定临床特征、TIL、mRNAsi、或者特定指标的对比分析。
九、外部数据验证效应