不知不觉,2019年就只剩一个月了!!!大家定的小目标还有没有希望实现呢?小编今天跟大家分享的是一篇11月末发表在Frontiers in Oncology杂志的文章,题目见下文。结直肠癌(CRC)是一种高异质性的癌症,多年来其发病率和死亡率一直居高不下。该研究基于TCGA数据,识别出了三个CRC中差异表达的lncRNAs作为预后生物标志物。此外,还构建了一个lncRNA-miRNA-mRNA网络,以研究lncRNAs在CRC中的生物学功能。An Integrated Three-Long Non-coding RNA Signature PredictsPrognosis in Colorectal Cancer PatientsCRC的RNA表达谱和临床信息下载自TCGA,包含482个CRC样本和42个癌旁组织样本。lncRNAs通过Ensembl数据库中的hg38进行注释,DElncRNAs筛选条件为|log 2FC| >1.5 & P-value < 0.05(使用R包edgeR),然后用R包pheatmap进行分层聚类分析,并绘制了火山图。此外,作者还对来自江南大学附属医院的85例CRC患者做了RT-PCR作为临床验证集。研究流程如图1所示:
作者将没有生存信息和lncRNA表达数据的样本删除后,还剩余439个CRC患者,其中42个有配对的正常样本。然后,使用单变量Cox分析评估DElncRNAs与患者总生存期(OS)之间的关系,筛选P-value <0.05做进一步分析;接下来,用最小绝对收缩和选择算子(LASSO)模型从预后DElncRNAs中识别关键lncRNAs(基于R包”glmnet”);最后,对这些关键lncRNAs进行Kaplan-Meier分析,筛选出与OS显著相关的lncRNAs。基于lncRNAs的表达水平和回归系数,作者用多变量Cox回归分析建立了预后风险公式,计算了每个患者的风险得分,根据中位数将患者分为高、低风险组。然后,利用Kaplan-Meier生存曲线评估两组的预后情况,并根据3年和5年OS概率的风险得分,通过ROC曲线来评估其准确性。该研究使用LncBOOK识别出了1,039个与三个DElncRNAs互作的miRNAs;然后基于lncRNAs和miRNAs间的得分,筛选了跟每个lncRNA相关的前30个miRNAs;接下来,利用miRDB、TargetScan和miRTarBase预测了miRNA的靶mRNAs;最后,通过Cytoscape构建了lncRNA–miRNA–mRNA网络。对于差异表达的mRNAs(DEmRNAs),作者利用R包“clusterProfiler”做了KEGG通路分析,并用SPSS23.0或R做了统计分析,P-value < 0.05认为是具有统计显著性。在439例CRC患者中,研究基于42组CRC和癌旁组织配对样本的表达数据,利用R包edgeR筛选出了580个DElncRNAs(319个上调,216个下调),图2.A-B是它们相应的热图和火山图;接下来,研究通过单变量Cox回归分析,评估了lncRNA表达谱与患者OS的预后关系,46个p<0.05的DElncRNAs被筛选出来做进一步分析,它们的LASSO系数如图2.C所示,基于最小λ法筛选出了17个lncRNAs(图2.D)。
对这17个lncRNAs的Kaplan-Meier生存分析结果表明,有10个与OS显著相关(图3);多变量Cox回归分析识别出3个lncRNAs(AP003555.2, AP006284.1和 LINC01602)作为整合的CRC患者的预后标志物(图4.A)。
利用3个预后lncRNAs构建的预后风险得分公式为:risk score = 0.2212*(the expression level of AP003555.2)+ 0.2081*(the expression level of AP006284.1)+0.1214*(the expression level of LINC01602),根据中位数患者被分为高、低风险组。患者的危险得分和生存状况的分布见图4.B-C,风险得分越高,患者预后越差。该风险模型在临床验证集中的结果与TCGA数据集一致(见图5)。

首先,作者用Kaplan-Meier分析评估了风险公式在训练集中的预后价值,发现低风险组的OS高于高风险组群(图6.A)。此外,时间依赖的ROC分析表明整合的lncRNAs特征效能优于单个lncRNA(图6.B)。验证集中的分析结果训练集中的结果一致(图6.C-D)。
最后,对ceRNA中mRNAs的KEGG富集分析发现,这3个lncRNAs参与到了一些癌症相关通路,如PI3K-Akt、TGF-b、CRC和P53通路。总的来说,研究构建了一个与CRC患者OS显著相关的整合的3-lncRNA特征,能够准确地识别低预后风险和高预后风险患者。此外,作者利用临床验证集评估了该预后特征的准确性和可靠性,表明了整合的3-lncRNA特征作为CRC预后模型的潜能。今天,送给大家的是:It's not our abilities that show what we truly are, it’s our choices. 欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史
