小编今天开始上班啦!临近假期结束大家也要收收心咯!今天小编给大家带来的是有关肿瘤干性指数的新思路,干性指数是评估肿瘤细胞与干细胞相似性的指标。它与干细胞中活跃的生物学过程以及更高的肿瘤去分化程度有关。一些研究已经发现前列腺癌干细胞(PCS)会影响肿瘤的进展、复发及耐药。然而,对于前列腺癌(PRAD)中干性指数与免疫的关系仍然缺乏系统性的评估,所以今天跟大家分享的是今年8月发表在Briefings in Bioinformatics杂志(IF:8.99)上的一篇文章,文章主要研究的就是基于大规模前列腺癌队列刻画肿瘤类干性特征与风险免疫浸润的关系。在文章中也会有关于干性指数评估的介绍,感兴趣的小伙伴不要错过咯。
生信人提供新颖、正规、可复现
的干性指数生信分析思路
感兴趣的,扫码报名

基于大规模前列腺癌队列刻画肿瘤类干性特征与风险免疫浸润的关系
前列腺腺癌(PRAD)是最常见的泌尿科恶性肿瘤,在全球范围也是男性肿瘤相关死亡的主要原因,同时也会有部分患者不可避免地进展到晚期,出现难治性复发和不良预后。而干性(Stemness)是指正常细胞从起源细胞分化成各种细胞类型构成人体有机体的可能性。据报道,细胞分化能力的逐渐丧失和干细胞样特征的获得是驱动肿瘤进展的主要原因。同时,由于PRAD包含不同的背景,它们共同构成了肿瘤微环境(TME)的复杂性,如正常肿瘤细胞、PCS、浸润性免疫细胞、肿瘤相关成纤维细胞和内皮细胞。因此,这篇文章将研究目光放在了前列腺癌类干性特征与肿瘤免疫浸润的关系上。1.PRAD队列数据:研究总共获得了七个初治PRAD队列(DKFZ-PRAD 、SU2C/PCF-PRAD、 CPC/GENE-PRAD、MSKCC-PRAD 、GSE70769、 GSE116918 及 TCGA-PRAD 队列),作者收集了队列的表达数据、甲基化数据、体细胞突变数据、拷贝数改变数据及临床信息。2.评估PRAD的干性指数及筛选预后CPG岛及PCS相关特征:在这里作者利用一类逻辑回归(OCLR)这种机器学习算法,为每个TCGA-PRAD样本计算PCS数,推断和匹配mRNAsi、mDNAsi、EREG-mRNAsi。干性指数的计算概括来说就是使用一类逻辑回归(OCLR)对来自PCBC数据集的多潜能干细胞样本(ESC和IPSC)建立了预测模型。然后把这个模型应用到TCGA等训练集中,计算每一个样本干性评分,最终评估出每个样本的干性程度。2018年发表在Cell上的文章[Machine learning identifies Stemness features associated with oncogenic dedifferentiation]中详细介绍了干性指数的预测方法。作者使用K-M分析评估预后显著性,文章也使用了差异表达分析、功能富集分析及GSEA分析等生信方法。3.评估TCGA-PRAD队列中mRNAsi及TMB:作者下载了带有突变注释格式(MAF)的体细胞变异,并进行了可视化。接着作者结合体细胞基因改变、替换、插入及缺失分析肿瘤突变负荷 (TMB) 。作者也根据Pearson相关系数计算mRNAsi和TMB数据之间的相关性,并对高TMB及低TMB进行了生存分析。4.基于PCS相关特征进行一致性聚类和预后分析:作者利用elbow及gap statics两个方法识别出最优K类,同时研究PCSclusters和生存结局之间的相关性。作者使用ConsensusClusterPlus,总共重复1000次,以确保分类的稳定性。然后,作者通过Kaplan-Meier分析评估各PCScluster的预后,同时运用OCLR算法计算了1474例PRAD患者的PCS指数,并进行生存分析。还分别计算和比较了PCScluster中PCS指数的比例。5.在PRAD-TME中评估免疫浸润和PCS的相关性:作者使用CIBERSORT算法和LM22基因特征分析RNA-seq 数据来推断肿瘤样本中免疫细胞的比例。作者也对这5个PCScluster进行了聚类分析,并分析了免疫细胞的分布。作者也使用ABSOLUTE基于TCGA-PRAD队列的CNV结果分析了肿瘤纯度及倍性。6.筛选靶向PRAD干性特征的潜在化合物:CMap数据库是一个探索基因、化合物及生物条件潜在关系的综合数据库,文中作者识别高低干性指数的差异表达基因利用CMap筛选靶向PRAD干性特征的潜在化合物。研究中一共收集了7个PRAD队列的表达数据和相应的生存信息,对这些PRAD干性特征的刻画如图1A所示,而这些PRAD队列的总体特征如表1所示。在TCGA-PRAD队列中,作者使用一类逻辑回归算法得到了mRNAsi、mDNAsi和EREG-mRNAsi三类干性特征指数,指数范围为0到1。接着作者将肿瘤样本根据三种特征的中位数分别分为高组和低组,使用Kaplan-Meier分析评估三个特征的预后价值,发现mRNAsi和mDNAsi较高的患者生存更差(图1B,C),然而,EREG-mRNAsi无显著性差异(图1D)。接着作者选择mRNAsi和mDNAsi进行进一步的研究,并对各自的分数进行排序。结合体细胞突变数据,观察到mRNAsi评分越高,hallmark基因的改变越频繁,包括SPOP和PTEN突变、TP53变异以及MYC扩增(图1E),在图1F中也会观察到相似的结果。作者观察也发现mRNAsi也与较高的TN分期及Gleason评分有关,与其预后作用一致。为了评估推断的干性指数的准确性,作者选择了几个具有代表性的干性特征,并观察了mRNAsi与SOX2、CDC20、FOXM1、NANOG表达水平之间的关系(图1H)。2.识别PRAD中的PCS相关的风险CpG位点和特征作者基于OCLR算法计算了反映表观遗传特征的mDNAsi,上面的分析也发现mDNAsi评分与预后结果相关。因此,作者打算筛选PCS相关风险CpG岛,作者收集了450 K甲基化数据,并对缺失值进行了处理,最终作者在553个样本中共得到21,121个CpG位点。接下来,作者分析了正常样本、低mRNAsi前列腺癌样本和高mRNAsi前列腺癌样本中top100的差异甲基化水平(图2A)。单因素Cox回归分析显示共有21个预后PCS相关CpG岛。此外,作者在heatmap中进一步比较了低mRNAsi患者和高mRNAsi患者的差异基因(图2B)。作者在两组中筛选了总共100个差异预后基因,并使用LASSO回归模型识别了13个hub PCS相关的特征。同时,作者选取两个mRNAsi组中top300差异表达基因进行GO分析,分析结果如图2D所而及GSEA分析结果如图2E所示。图2 筛选和识别PCS相关的CpG位点和与进展相关的关键特征3.在7个PRAD队列中训练及验证13基因的PCS相关特征在这一部分,作者为了评估关键的PCS相关特征的临床预测意义,收集了七个PRAD队列,共计1474例样本来证明这一点。首先,进行多变量Cox回归分析,计算PCSS相关评分。作者将整个队列分为两组,将TCGA-PRAD队列作为训练队列,将其他队列作为独立的验证数据集。在训练队列中,根据图3A的ROC曲线,作者发现PCSS在预测进展方面具有很好的临床意义。此外,可以看出PCSS水平较高的患者比PCSS水平较低的患者预后更差,病情进展更快,这表明PCSS可能是PRAD患者风险分类的有力指标(图3H)。此外,作者也评估了PCSS在每个PRAD验证队列中的效能(图3B-G)。Kaplan-Meier分析也显示,高PCSS组和低PCSS组的生存结果在6个验证数据集中有显著差异(图3I-N)。图3 在7个独立队列中开发和验证基于13基因的干性风险模型4.高mRNAsi与基因组不稳定性、肿瘤突变负荷(TMB)相关在这一部分,作者下载504例PRAD患者的体细胞突变数据,并按公式计算每个病例的TMB,并将TMB与随访时间及生命状态合并。接着,作者使用 maftools对突变谱进行可视化及概括(图4A)。作者进一步比较了两组之间的突变差异,发现PRAD top相关特征在mRNAsi高样本中比低样本中突变更频繁(图4B)。5.在总队列中进行一致性聚类识别不同的干性预后亚群在这一部分,作者首先收集并合并了包括1465名男性在内的7个队列的表达数据,并标准化为TPM类型。作者利用13个PCS相关特征进行一致性聚类,并识别PRAD的干性分子亚群进行预后分析。作者使用ConsensusClusterPlus迭代1000次以获得稳定分类,发现当K = 5时,样本分类结果最优(图5A,B),图5C对这五类进行了刻画。接着作者使用OCLR算法计算每个样本的mRNAsi,并对5个聚类进行Kaplan-Meier分析,发现PCScluster5的预后最差,PCScluster1的预后最好,与之前的结果一致(图5D)。此外,作者结合PCScluster、mRNAsi水平和生命状态绘制了一个全面的sankey图,从中可以看出PCScluster5与高mRNAsi和进展状态的关系更为频繁(图5E)。Kaplan-Meier分析也显示mRNAsi高的患者预后较低mRNAsi差(图5F)。作者也发现高mRNAsi患者在PCScluster5中所占比例最大,而在PCScluster1中所占比例最小。相反,低mRNAsi患者表现出相反的结果(图5G)。总的来说,这些分析表明,13个PCS相关的特征可以指导分子分类。
6.高mRNAsi与低CD8+ T细胞浸润及免疫抑制相关已往研究表明,干性指数与肿瘤微环境中的免疫浸润有关,作者考虑到干性指数和免疫细胞之间的潜在关系,收集并标准化了所有PRAD队列的表达数据,使用CIBERSORT算法估计免疫细胞。作者最终纳入1000份样本,推断出22个免疫细胞在PRAD -TME中的比例。作者阐释了5个PCScluster之间不同的渗透模式,发现PCScluster5和PCScluster1之间可以观察到不同的免疫组分(图6A)。此外,作者还描述了这些免疫细胞之间的潜在关系以及与预后的关系(图6B)。图6D中可以观察到CD8+ T细胞浸润与mRNAsi水平正相关。此外,作者进一步检测到mRNAsi高组的PDL1表达水平明显低于mRNAsi低组(图6 E)。作者还估计了肿瘤的倍性,发现两个mRNAsi组之间没有显著差异(图6F)。图6 在PRAD-TME中高mRNAsi与低CD8+ T细胞浸润及免疫抑制相关7.基于CMap分析筛选潜在化合物或靶向干性特征的抑制剂在文章的最后一部分作者使用CMap分析筛选候选化合物,特别是靶向PRAD中的干性指数相关特征。首先识别了来自mRNAsi高组和低组的前300个差异表达基因。图7显示了可能针对差异基因(DEGs)的前78个化合物,以及 mode-of-action(MoA)分析得出的54种作用机制(图7)。到这里这篇文章的主要内容就介绍完了,总结一下,文章以干性为切入点将预后和免疫相结合,与一般做干性指数的文章不同涉及了聚类、甲基化、TMB、免疫浸润、化合物分析等内容。文章收集了多个数据集,采用了多种生物信息学分析方法,对前列腺癌进行了全面的分析,工作量多,且无论是研究的方法还是角度都值得参考学习。数量不多,感兴趣扫码
关注扫码报名哦!
