8-lncRNA特征预测乳腺癌患者的生存:
基于加权基因共表达网络分析和竞争内源RNA网络的综合研究
An eight-lncRNA signature predicts survival of breast cancer patients: a comprehensive study based on weighted gene co-expression network analysis and competing
endogenous RNA network
乳腺癌是世界范围内女性诊断出的最常见危及生命的癌症,随着分析技术的不断发展,许多个体和特征分子标记已被用于BRCA的诊断和预后。这篇文献基于加权基因共表达网络分析和竞争内源RNA网络的综合研究通过8-lncRNA特征预测乳腺癌患者的生存,旨在确定lncRNA特征以预测乳腺癌患者的存活率,这个分析角度和方法的确是有建设性,但是不得不吐槽的是,全文看似顺理成章水到渠成,细读下来,才发现结论纯粹牵强附会,还有!!图片和注释信息排版极其混乱,观感极差,对强迫症来说简直是噩梦。
分析工作流程如图1所示
从TCGA数据库下载BRCA病例和对照数据集,进行不同表达的mRNA的加权基因共表达网络分析以产生与BRCA总体存活状态相关的模块,并进一步构建竞争性内源RNA网络上的中枢,使用单变量生存分析和多变量Cox危险模型分析生成用于预测BRCA患者存活的LncRNA标记,用ROC曲线测量表征预后性能。单看方法还是有可取性的,奈何结果太差拖了后腿。
下面是重点讨论的结果部分
2,139个DEmRNAs中1,351个上调(图2a,d),86个DEmiRNAs中67个上调,19个下调(图2b,e),鉴定了总共1062个DElncRNA(图2c,f)。具有最高倍数变化的10种mRNA,miRNA和lncRNA显示在表1中。
图2 TCGA-BRCA组织中DEmRNA,DEmiRNA和DElncRNA的鉴定。
表1前10个DEmRNA,DEmiRNA和DElncRNA
用WGCNA构建DEmRNA的共表达网络,通过动态树切割生成模块(图3a)。在合并高度相似的模块后生成了大小为46到485个基因的15个模块,非共表达基因包括在灰色模块中图3b,c,结果显示turquoise模块与生存状态显著相关(PCC = 0.072,P = 0.04)(图3d),turquoise模块含有485个基因(图3e)。
图3加权共表达基因的网络构建及其与临床特征的关联。
对turquoise模块进行功能富集分析(图4a,b),用turquoise模块中的基因构建并可视化PPI网络(图4c),基于turquoise模块的基因集和DEmiRNA的靶基因集鉴定中枢基因。结果显示总共七个基因(CCNB1,SHCBP1,KPNA2,CCNE2,SFRP1,ELAVL2和CCL20)是中枢基因(图4d)。
图4功能富集分析,PPI,hub基因和与生存状态相关的模块的ceRNA网络。
使用DEmRNA,DEmiRNA和DElncRNA构建全局ceRNA网络,用hub基因基于全局ceRNA网络生成中枢ceRNA网络(图4e)。中枢ceRNA网络包括7种miRNA和23种DElncRNA(表2)。将这些miRNA和lncRNA定义为中枢生物标记物(图4e)。对23种DElncRNA,7种DEmiRNA和7种DEmRNA进行了生存分析。结果显示,有12个中枢DE1ncRNA的上调是预后不良,其他11个中枢DElncRNA的上调预示着更长的患者存活时间,MicroRNAs RNA miR-144和miR-429与总体存活相关,中枢基因CCNB1,SHCBP1,KPNA2,CCNE2和SFRP1与总体存活相关。
表2在ceRNA网络中保留的中枢DE1ncRNA,DEmiRNA和DEmRNA
对23个hub lncRNA进行了单变量存活分析(表3)。在通过Akaike信息标准(AIC)和多变量Cox风险模型分析逐步选择模型后,生成了lncRNAs特征模型,计算预后评分。
表3通过单变量Cox回归分析显示表达的lncRNA的预后值
使用lncRNA表达水平分析来自训练集的患者的预后评分,将患者分为高风险组或低风险组(图5a)。根据Kaplan-Meier曲线,具有高风险评分的患者的总体存活率低于具有低风险评分的患者(图5b),使用ROC曲线评估预后性能,逻辑回归,支持向量机,决策树和随机森林模型的AUC分别为0.999,0.973,0.731和0.898(图5c)。使用survivalROC包(图5d-m),显示8个lncRNA标记可以预测BRCA的预后。使用多变量分析评估单个lncRNA在8-lncRNAs特征中的独立预后表现(表4),结果与Kaplan-Meier曲线一致(图6)。
图5 TCGA-BRCA训练群组中8-lncRNA特征的诊断效率。
表4通过多变量Cox回归分析表达的异质表达的lncRNA的预后值
图6 8-lncRNA特征中单个lncRNA的独立预后能力(效率)
使用单变量Cox比例风险回归评估不同临床特征的预后表现,结果显示性别,病理分期,病理T分期,病理分期M分期,组织学类型和风险评分与总生存期相关(表5;图7)。进一步进行多变量模型回归,结果显示lncRNAs特征和性别是与总生存期相关的独立预后因素(表5)。在低风险组和高风险组中检测这8个特征性lncRNA的表达模式,AC007731.1,AL513123.1,C10orf126,WT1-AS,TLR8-AS1和HOTAIR的水平在高风险组中高于低风险组,ADAMTS9-AS1和SRGAP3-AS2的水平在高风险组低于低风险组(图8)。
表5相关临床特征和风险评分的预测值
图7 TCGA BRCA训练集患者OS临床特征的预后效率
图8低风险组和高风险组中8种lncRNA的表达水平
为了评估8-lncRNAs特征在BRCA患者预后中的表现,使用与队列相同的模型和cutoff点,将测试组分类为高风险组和低风险组(图9a)。与低风险组相比,TCGA-BRCA测试组中的高风险组具有显着更短的总体存活率(图9b)。对于测试集,8-lncRNA逻辑回归,支持向量机,决策树和随机森林模型的AUC分别为0.979,0.844,0.99和0.997(图9c)。预测BRCA中1至10年存活率的AUC在测试集中为0.656至0.748(图9d),结果证明8-lncRNA特征可以预测BRCA的预后。
图9在TCGA-BRCA测试组中的8-lncRNA特征的诊断性能
是不是看起来分析的好有道理,然而,显示这些lncRNA在BRCA进展中的作用的研究非常有限,23个中枢DElncRNA是BRCA总体存活的个体独立预后生物标志物可能性极低。生存分析显示,在中心ceRNA网络中,5种mRNA和所有23种lncRNA只有两种miRNA与BRCA的存活状态相关,这就能说明以miRNA为中心的lncRNA-miRNA-mRNA ceRNA网络能表明是鉴定与BRCA总体存活相关的lncRNA的良好工具了么?!!中心ceRNA网络模型也可能随着DEmRNA,DEmiRNA和DElncRNA相互作用数据库的更新而发生变化,结果数据一路不显著下来竟然也得出了结论,这似乎告诉我们一个道理,即使再平庸的结果,只要降低标准,往显著的堆里扎,也可以成为不平凡。
更多生信分析套路,请加微信13621202201
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史