纯生信20+:免疫预后特征识别与验证
生信干货
zezeze ·2019年9月5日 19:32
早期非鳞状非小细胞肺癌个体化免疫预后特征的研究与验证Hello,大家好啊,好久不见,甚是想念呢!新的学期开始了,学习和生活可还顺顺利利,一帆风顺?如果顺顺利利,就和小编一起开启今天的文献解读之旅,让自己的学业生活更上一层楼;如果曲曲折折,那就更应该和小编一起学习新的文章,用文化知识和专业素养武装自己的头脑,努力打败生活中的小怪物吧!今天小编想和大家分享的是一篇关于免疫预后特征识别与验证的文章,是17年7月6号发表在JAMA Oncology上的文章,文章的思路超级简单,但是影响因子可是高达20.871哦。赶快get起来吧!

非小细胞肺癌(NSCLC)约占肺癌的85%,是美国和全世界癌症死亡的主要原因。因此预测可靠的疾病预后和患者生存的生物标志物对指导肺癌的治疗具有巨大的价值。大多数I期NSCLC患者在局部治疗后并没有接受全身的辅助治疗,因为对很多早期患者来说,全身辅助治疗带来的毒性作用可能远远超过得到的潜在益处。因此,通过构建预后特征识别到那些复发和死亡风险最高、最需要额外全身治疗的患者对早期非小细胞肺癌治疗来说有很大的意义。1. 数据收集:共收集来自19个NCLS研究的冰冻肿瘤组织的基因表达谱,其中包括TCGA肺腺癌的测序数据以及18个芯片数据集。作者只纳入有临床信息的非鳞状非小细胞肺癌样本。共收集到2414例非鳞状非小细胞肺癌样本,并将其分为meta训练集(729),meta验证集(716),以及3个独立验证集(TCGA,439;DCC,323;GSE30219,207)。要求所有样本均接受手术且手术切缘阴性,没有接受过辅助或者新辅助治疗,并且有公开可用的基因表达和生存信息。数据收集从2016年7月22日至9月8日。数据集信息如下图所示。
2. 从Immport database上下载免疫相关基因(IRGs ):共有1443个IRGs,其中只有524个在所有平台的数据中都被测量,因此只保留这524个基因并将其纳入下一步分析。3. 构造免疫相关基因对(IRGPs):524个基因两两组队共构造了137 026 个免疫相关基因对(IRGPs),其中126 615个 IRGPs (92.4%)的基因对在任一套训练数据集中保持恒定一致的秩次关系,文章认为这些在任一数据集中保持一定秩次关系的基因对不具有区分患者生存的能力,因此只保留余下的10 411 IRGPs,作为候选基因对并将其纳入下一步分析。4. 构造预后相关免疫基因对:基于cox比例风险回归模型分别评估10411个候选免疫相关基因对与预后的关联,得到281个预后相关免疫基因对(p<0.05)。5. 预后相关基因对降维:基于glmnet这一R包的lasso cox模型对281个预后相关基因对进行降维,随机1000次对基因对进行鲁棒性评估,最终识别到25个预后相关基因对。6. IRGPI预后分型:接下来只要基于这25个基因对分别对meta训练组,meta验证组,以及三个独立数据集进行高低风险组分型就可以啦。分类效果如下图所示,是不是效果还不错呢!另外,文章还比较了TCGA高低风险组样本中坏死和中性粒细胞浸润的比例差异。我们发现,在高风险组样本中,不管是组织bottom位置和top位置都有更高的坏死和中性粒细胞浸润的比例,从侧面验证了模型分类的可靠性。

7. 评估在不同临床条件(grade,stage,年龄,性别等)下,25个预后相关免疫基因对的高低风险组分型能力,下图主要分别在一期和二期样本中进行预后分型。

8. 与另外两种基因表达预后特征进行比较。不难看出文中识别到的IRGPI特征具有更高的cindex指数,分类效果更好。
9. 构造ICPI模型:将IRGPI特征与临床特征结合,基于多因素cox模型进一步构造预后特征,cindex值更大,分类效果更优。 模型如下:(0.0265 × age) +(0.267 × stage) + (1.917 × IRGPI score) cutoff为0.116。
今天的文章大概内容就是这些,让我们来总结一下吧:文章共收集了19套非小细胞肺癌数据集,并将其分成meta训练集,meta验证集和三套独立验证集。首先,识别在任一数据集中不稳定的基因对,基于单因素cox分析识别到预后相关的不稳定基因对,通过glmnet包的lasso cox模型对不稳定预后基因对进行降维,共识别到到25个特征基因对,基于特征基因对对样本进行高低风险组分型,评估预后分类效果。最后,文章又将部分临床特征纳入特征分型,开发出分类效果更好的ICPI模型。通篇文章思路都很简单,不管是单因素cox分析和glmnet R包都是我们生物信息学中较为常用的统计方法或工具,比较复杂的就是数据收集过程。你今天学会了吗?别害怕黑暗,别害怕独行的灵魂,逆行的人群。别害怕追求让你理想燃烧的事物。
生信人目前拥有超级预后,超级可变剪切,突变+表达,表达+突变,DNA甲基化,自噬,ceRNA、经典预后、m6A、可变剪切、肿瘤微环境,免疫浸润,多组学,驱动基因,突变,耐药,CNV肿瘤干细胞等多种经典和新潮分析思路和方案。
在此开工季,欢迎大家预定分析服务。
开工季,套路上新
(8.29-9.30)期间签订项目
赠送生信人网课一套
