今天跟大家分享的是十一月份发表在frontiers in Oncology杂志上的一篇文章,
A Long Non-coding RNA Signature to Improve Prognostic Prediction of Pancreatic Ductal Adenocarcinoma
改善胰腺导管腺癌预后预测的长非编码RNA特征
胰腺导管腺癌(PDAC)是全球最具侵略性的实体恶性肿瘤之一。研究旨在确定潜在的最小数目的lncRNAs作为预测PDAC患者预后的特征。使用最小绝对收缩和选择算子(LASSO)算法从TCGA数据库中提取lncRNA数据,在训练或验证队列中,构建了一个与总体存活率(OS)显著相关的5-lncRNA特征。使用qRT-PCR技术在来自复旦大学的PDAC患者中验证了这种5-lncRNA特征,并评估了该特征的准确性和整个TCGA队列中的预测能力。
结果
一、PDAC患者的临床特征
该研究的流程图如图1所示,共纳入223名PDAC患者(表1),177名TCGA PDAC患者被随机分配到TCGA训练队列和TCGA验证队列,复旦大学华山医院的46名PDAC患者作为一个独立的验证队列(表1)。
图1. 研究流程图
表1. 参与研究的223例胰腺癌患者的临床特征
二、从TCGA训练队列生成预后的lncRNA
使用单变量Cox回归分析,在TCGA训练队列中确定了2208个预后的lncRNA,应用LASSO Cox回归模型,结果发现与PDAC患者OS高度相关的5-lncRNA特征,表2列出了lncRNA具体信息。在这些lncRNA中,负系数显示出较低的lncRNA表达水平。鉴定出的五个lncRNA具有完全负系数,这意味着它们与较好存活率相关。
表2. 与总存活率显著相关的lncRNA
三、5-lncRNA特征和训练队列中患者的生存
基于这5个lncRNA表达,建立风险评分公式,得出TCGA训练队列中每位患者的lncRNA特征风险评分,使用风险中位数作为临界点,将患者分为低风险组和高风险组。Kaplan-Meier生存分析表明,高风险组患者与训练队列中较差的生存趋势相关(图2A)。
四、验证队列和整个TCGA队列中生存预测的5-lncRNA特征的验证
通过使用相同的分类方法,将患者分为高风险组和低风险组,高危组的患者显示OS比其他患者差得多(图2B)。在整个TCGA队列中,5-lncRNA特征也具有相似的结果(图2C)。在复旦大学的独立队列中验证了基于风险评分的分类以及特征预测OS的能力,如图2D所示,特征还可以有效地区分OS风险。
图2. 基于5-lncRNA特征总体存活率(OS)的K-M分析
五、PDAC患者5-lncRNA特征与临床病理特征之间的关联
TCGA队列和复旦验证队列的患者被分为两组,特征的高风险评分与包括TNM分期和OS状态的侵袭性肿瘤临床病理参数有关。尽管在复旦验证队列中TCGA队列和TNM阶段的组织学分级没有统计学意义,高趋势组患者仍表现出差的分化等级和晚期肿瘤。
六、通过单因素和多因素分析研究5-lncRNA特征的预后能力
通过分析可用协变量,用单因素和多因素Cox分析组织学等级和MSI状态。在单变量Cox回归分析中,5-lncRNA特征都是与预后相关的有力变量(图3A,C)。通过使用其他临床变量调整多元分析,在整个TCGA和复旦验证队列中5-lncRNA特征仍是独立变量(图3B,D)。
图3. 总生存量(OS)分析的森林图
七、基于5-lncRNA特征根据TNM分期,组织学等级和MSI状态的亚组分析
在TCGA PDAC患者的早期阶段(TNM阶段I&II)和MSS状态进行了亚组分析,图4A显示,5-lncRNA特征可以成功预测该亚组的生存结果。TCGA PDAC患者分为高分化组(I&II级组织学)和低分化组(III&IV级组织学)。亚组分析表明,5-lncRNA特征可能有益于将患者分为每个级别的低风险和高风险组,高分化组(图4B)和低分化组(图4C)在统计学上有显著差异。图4D表明,高风险组中具有MSS状况的患者的中位OS明显短于低风险患者。这些结果表明5-lncRNA特征的预后能力与TNM分期,组织学分级和MSI状态无关。
图4. KM生存分析可评估5-lncRNA特征在TNM分期,组织学等级和MSS状态中的独立性
八、根据年龄和性别的5-lncRNA特征进行亚组分析
通过将这些患者分为≤60岁和≥60岁的亚组进行亚组分析,无论年轻组还是老年组中的患者,5-lncRNA特征仍然能够识别具有不同预后的患者。通过类似方法研究了5-lncRNA特征是否与性别无关。在整个TCGA PDAC队列中,特征的高风险评分与男性或女性患者的OS显著相关。这些结果进一步表明5-lncRNA特征不受年龄和性别的影响。
九、ROC分析评估5-lncRNA特征的预后价值
如图5A所示,5-lncRNA风险评分模型的AUROC优于TNM分期和组织学分级,与单独特征相比,5-lncRNA风险评分的AUROC与TNM分期和组织学分级显示出显著差异,在复旦验证队列中也证实了这个结果(图5B)。根据5-lncRNA风险评分和TNM分期进行了ROC分析,5-lncRNA风险评分的表现优于TNM阶段,当与TNM阶段结合使用时,模型具有更强的OS预测能力。
图5
十、与5-lncRNA特征相关的富集功能和通路
使用cytoscape插件ClueGO和CluePedia,根据分类对整个TCGA PDAC队列进行了分析。图6显示了TCGA数据集中高风险和低风险PDAC患者中前1000个显著DEG的一组富集功能和通路。在前1000个上调的DEG的分析中,发现了一组与癌症相关通路(图6A)。同样在前1,000名下调的通路中,也发现了几种药物反应通路(图6B)。基于以上分析,提出5-lncRNA特征可能在PDAC的癌变中起重要作用。
图6. 高风险和低风险PDAC患者中前1000个显著差异表达基因(DEG)的功能和通路富集
欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史