机器学习方法已经越来越多的应用到预后分析中。今天小编要和大家分享的是今年三月份发表在Cancer Immunology Research(IF:8.728)杂志上一篇关于机器学习分析肝癌多参数预后标记物的文章。
A Machine Learning Approach Yields a Multiparameter Prognostic Marker in Liver Cancer
机器学习方法生成肝癌的多参数预后标记物
一.研究背景
肝癌是癌症相关死亡的主要原因,大约占全世界所有癌症相关死亡的8.2%。其中乙型肝炎病毒(HBV)或丙型肝炎病毒(HCV)感染以及酒精性或非酒精性肝病都是肝细胞癌(HCC)的主要危险因素。此外,肿瘤负担、治疗方式和肝功能等都会影响肝癌患者的临床结局。如今,许多分期系统已被开发用于预测肝细胞癌的临床结局。然而,对于最优模型,目前还没有达成普遍的共识。因此今天小编介绍的就是使用能够整合多个风险因素的机器学习来分析肝癌预后标记物的文章。
二.数据及方法
1. 患者及样本的收集:分析纳入了2017年至2018年在北京地坛医院住院的HCC患者,并随机将他们分为训练集(136例患者)和验证集1 ( 56例患者)。为了进一步验证模型,作者从2016年至2017年招募105例患者作为独立验证集2 。
2. 流式细胞术染色分析:在综合治疗前收集所有患者外周血,分离外周血单个核细胞(PBMC)。接着使用流式细胞术分析,为了排除死细胞,作者在分析前在每个样本中加入7-AAD进行活性染色,接着将免疫检查点分子染色于T细胞表面。分析中CD4和CD8 T细胞亚群被分为幼稚T细胞、中央记忆T (Tcm)细胞、效应记忆T (Tem)细胞和终末分化效应记忆T (Temra)细胞群。接着使用流式细胞仪进行数据收集,然后进行数据处理和分析。
3. 数据预处理和特征选择:作者构建ML生存模型,包括数据预处理、特征选择、建模和预测。数据处理:在数据预处理中,为了缩小离群值,使数值特征近似为高斯分布,在添加伪计数1后,对所有特征值进行log2转换。作者删除了超过20%的缺失值的特征和样本。然后用每个特征的中位数来填充缺失的数据,并通过去除均值等进一步标准化。接着删除超过97%的相同值的特征,同时去除低方差特征,进一步使用六种无监督方法对特征进行排序,并使用至少一种方法支持的特征进行进一步分析。对于每种方法,只提取排名前40%的特征。在对训练集中的数据进行处理后,首先使用单因素Cox比例风险(CoxPH)模型去除不满足阈值标准的特征。然后使用交叉验证递归特征消除(RFECV)对数据进行拟合,以选择精度得分最高的特征。为了获得一致性特征,作者对分层shuffle-split交叉验证进行了20次迭代。因此,在最终模型中,通过梯度增强生存(GBS)估计器选择20个最优特征来构建最终生存预测器。
4. 模型构建和性能评估:根据选取的20个特征,使用GBS模型进行建模,训练集交叉验证13次。超参数优化是通过一个交叉验证网格搜索来调整的,并在训练集中用最优的得分参数重新调整模型。接着通过删失的c指数和AUC评估生存预测器的性能。最后通过训练测试集过程对独立验证集1和2进行预测。
三.研究的主要内容及结果
1. 患者特征
在文章的第一部分,作者首先比较了训练集和两个验证集的临床和免疫学特征。三组样本在治疗类型和肝功能方面均无差异。在训练组和验证组1中,HCC患者分别为68.4%和78.6%处于HCC早期。然而,在验证组2中,这个百分比显著下降(表1)。同样,验证组2中肝细胞癌伴PVTT患者的百分比显著高于训练组和验证组1。在病因方面,训练组和验证组1中分别有80.1%和78.6%的患者存在HBV感染,而验证组2中有93.3%的患者存在HBV感染。在三个队列中没有发现肝功能、肾功能、凝血功能或T细胞计数的差异。验证集2中CD4+TIGIT+、CD4+TIM-3+、CD4+TIGIT+TIM-3+、CD4+PD-1+TIGIT+TIM-3+、CD4+Tcm细胞、CD8+PD-1+和CD8+ Tcm 细胞的百分比均高于训练集和验证集1。CD4+ Tn, CD8+PD-1+TIGIT+TIM-3+,CD8+Temra细胞在验证组2中较低。总的来说,这些观察结果可能表明三个队列的基线数据的特点存在差异,因为患者是在不同的时间段被招募的。
2. 特征选择和GBS模型构建
在研究中作者综合分析了91个特征,包括传统的临床特征、实验室参数和反映T细胞功能的免疫参数(表1),想要构建一个鲁棒的多维生存预测器来预测HCC患者的OS。作者将训练集的三种类型的特征都输入到一个集成ML框架中(图1)。在数据预处理之后,对所有特征进行单变量CoxPH分析,并识别出48个特征作为OS相关的候选变量。在RFECV排秩的基础上进一步选取这些特征,使用13倍交叉验证训练ML-GBS模型。最终,作者构建了一个包含20个特征的GBS模型,并随后得出了一个风险评分(图1和图2)。最后选择的20个特征中仅包括一个临床特征、14个实验室参数和5个T细胞功能参数(图2)。
3. GBS模型衍生分类器的性能
接下来,在这一部分作者探索了三个队列中GBS模型衍生的风险评分与OS之间的关系,结果发现两个指标之间存在显著的线性相关性。虽然三个队列中患者的中位随访时间不同,但预测风险评分系统在训练集和验证集1、2中c -ndex值分别为0.844、0.827和0.806(图3A)。Kaplan-Meier曲线显示ML分类器可以有效地将患者分为死亡风险较高或较低的亚组。无论采用两组(图3B,D)还是三组(图3E,G)分类,在三个数据集中,低风险或中风险亚组的OS均显著优于高风险亚组。例如,在验证集1的两亚组分类中,低风险评分患者的死亡率显著低于高风险评分患者的死亡率,验证集2中也发现了类似的结果。接下来,作者进行了时间依赖性的ROC分析,以确定GBS风险评分分类器的预后和预测准确性,结果显示两个验证集的风险评分均具有较高的AUC。通过对多个预后标志物的单因素Cox模型分析,GBS衍生的风险评分的分层能力优于其他传统方法。接着作者采用多因素Cox回归分析来验证GBS风险评分的独立预后价值。在校正其他临床特征(GBS模型中未选择的特征),包括性别、年龄、Child-Pugh分级、PVTT状态、BCLC分期等,在所有三个独立数据集和联合队列中,风险评分均是OS的独立因素。
4. GBS衍生的风险评分与基本临床特征之间的相关性
在对训练集进行GBS ML分析的基础上,风险评分模型综合了20个特征作为关键因素,其中仅选取了一个临床特征:肿瘤大小(直径)。因此,在这一部分作者试图评估GBS衍生的风险评分与其他预后临床特征之间的相关性。作者首先观察到由这些临床特征定义的不同亚组中风险评分的明显分布模式。具体来说,在联合队列中,Child-Pugh C、BCLC C-D亚组或有PVTT的患者比Child-Pugh A、BCLC A-B亚组或无PVTT的患者风险评分更高(图4A,表2)。在三个独立队列中也发现了类似的趋势(表2),表明高风险评分也可以代表临床分期的进展,即使这些因素没有被纳入最终的GBS预后模型。接下来,作者也发现风险评分系统在HCC患者的不同分类亚组中可以正常发挥作用。例如,在联合队列中Child-Pugh A、B、C亚组中,低风险亚组的OS明显优于高风险亚组(图4B)。类似地,GBS衍生的风险评分可以对有或没有PVTT的HCC患者进行更好或更差的预后分层(图4C)及不同BCLC分期(图4D)。总的来说,这些观察结果支持了预后模型的鲁棒性,因为它们表明该模型可以适应不同的事件分布和临床分期系统。
5. 较高的GBS风险评分与较高的复发发生率相关
在最后一部分作者考虑到GBS预后模型在三个队列中对OS均显示了良好效能。接下来作者试图确定风险评分是否与HCC复发的发生率相关。作者对三个数据集中的无复发生存(RFS)时间进行Kaplan-Meier生存分析。分析证实,在所有队列中,低风险评分亚组的RFS时间均大于高危评分亚组。当患者被划分为低、中位和高危评分亚组时,也得到了类似的结果。研究发现在三个队列及组合队列中1年复发率在低风险和高风险患者得分分别为63.2%和85.7%,52%和95.2%,61.2%和84%,60.8%和86.7%,这表明风险评分对预测肝细胞癌复发具有潜在作用。研究的数据也证实了1年的进展与其他临床特征之间的显著相关性,包括Child-Pugh级或BCLC分期、肿瘤大小、PVTT状态和治疗策略。作者还观察到高风险评分亚组的特征是外周T细胞群上高表达抑制性分子,包括CD4+PD-1+TIGIT+TIM-3+、CD4+TIGIT+TIM-3+和CD8+PD-1+TIGIT+TIM-3+ T细胞。这些观察结果可能提示PD-1+TIGIT+ TIM-3+ T细胞在肝癌的发病机制和进展中发挥作用。
四.结论
到这里这篇文章的主要内容就介绍完了,总结一下,作者采用了GBS 机器学习的策略,构建了一个包含肿瘤大小、实验室参数和反映T细胞功能的外周免疫特征的预后模型,最终开发出一种精确和新颖的策略来指导个性化治疗。可以看出不同于多数预后文章,文章只运用患者的临床信息,以及一些实验参数等就构建出了预后模型,并没有对患者进行基因组测序,所以说不测序也可以做预后,小伙伴们可以学起来呀。