通过分析ceRNA网络来揭示与HCC预后相关的lncRNA
小编今天要为大家解读一篇关于lncRNA的文章[Comprehensive analysis of a ceRNA network reveals potential prognostic cytoplasmic lncRNAs involved in HCC progression.IF:3.923;2019.3].如今,长链非编码RNA(lncRNAs)的异常表达在肝癌(HCC)领域已经引起越来越多的关注。而lncRNA的特定功能与其细胞内位置密切相关,并且竞争性内源RNA(ceRNA)发挥作用主要是在细胞质,所以作者不仅分析了差异基因之间的相互作用,还分析了lncRNA的分布。这篇文章就对HCC中的lncRNA进行了详细的分析。
文章的数据与方法:
主要数据:作者从TCGA获得371例HCC组织和50例正常组织的lncRNAs,microRNAs(miRNAs)和信使RNAs(mRNAs)表达谱。
主要方法:
① 识别差异表达基因
② 构建ceRNA网路
③ 差异基因的功能通路分析
④ 生存分析
⑤ 构建风险得分系统
⑥ 单因素与多因素风险回归
⑦ 差异lncRNA与差异mRNA回归分析
主要数据和方法之后我们来看下结果
结果1:识别异常表达lncRNA,miRNA和mRNA
图1
为了进一步了解与肿瘤发展相关的DEGs,作者首先将整个样本群分为三组:一组包含50个正常样本,一个包含233个中度分化的HCC样本,另一个包含136个低分化的HCC样本。然后,如图1所示,作者将不同组进行比较,使用火山图来可视化显着差异表达的lncRNA,miRNA和mRNA。
结果2:预测靶向miRNA的lncRNA
图2
图2展示了ceRNA网络的创建流程。作者首先使用miRcode数据库预测了与753个lncRNA存在潜在相互作用的miRNA。然后,得到预测的miRNA和97个DEmiRNA之间的交集。最后,作者识别了53种具有相互作用能力的lncRNA以及13种miRNA,。
结果3:预测靶向miRNA的mRNA
为了提高生物信息学预测的可靠性,作者通过筛选三个数据库(miRDB,miRTarBase和TargetScan)共有的mRNA来识别上述13种miRNA的靶基因。然后,又将候选靶mRNA与1,535个差异表达的mRNA进行比较。最后,涉及10种miRNA和26种mRNA的miRNA-mRNA相互作用对被建立,来验证ceRNA网络。
结果4:lncRNA和ceRNA网络的细胞内定位
图3
检测lncRNA的细胞质 - 核位置是研究这些lncRNA的复杂调节机制的关键步骤,因为lncRNA的内源竞争作用主要表现在细胞质中。因此,作者用lncATLAS数据库排除了仅位于细胞核中的13个lncRNA。用Cytoscape显示所有差异表达的lncRNA的分布信息(图3a)。在考虑剩余DEG之间的相互作用后,将37个DE1ncRNA,10个DEmiRNA和26个DEmRNA整合到由73个节点和142个相互作用构成的HCC ceRNA调节网络中(图3b)
结果5:GO和KEGG 功能富集分析
图3
在这一部分作者研究了新形成的ceRNA网络中26种DEmRNA的潜在生物过程和通路,使用DAVID进行了功能富集分析,并用Cytoscape进行了可视化,如图3c所示。而图3d则揭示了KEGG功能富集中的重要通路,可以看出最显著的通路是“microRNAs in cancer”。
结果6:ceRNA网络相关基因的生存分析
图4
为了识别与HCC患者预后显著相关的差异表达基因,作者对每个基因进行了K–M生存分析以及log-rank检验。最终13种lncRNA,3种miRNA和15种mRNA被识别为致癌基因,因为这些RNA的高表达与较短的生存时间相关。此外,2个 lncRNA,CLLU1和HTR2A-AS1以及它的mRNA PROK2的表达水平与HCC患者的总体生存率正相关,表明这些RNA在HCC发展中起到保护作用。基于表达水平与HCC患者预后之间的关系排名的前3种lncRNA,miRNA和mRNA的K-M生存曲线如图4a,b和c所示。
结果7:构建lncRNA相关风险评分体系
图5
lncRNA在ceRNA网络的上游部分占主导地位,并且作为miRNA和mRNA的主要影响者起作用。此外,lncRNA的表达和分布具有高度特异性,这使其成为HCC诊断和预后评估的最佳生物标志物。因此,基于与生存率显着相关的15个lncRNA,应用lasso‐penalized Cox回归和多变量Cox回归分析来选择潜在的与预后相关的lncRNA,并且它们的贡献进行加权(图5ab)。该结果表明这些lncRNA具有保护作用,且这些lncRNA的高表达延长了HCC患者的OS(图5c),而风险得分的分布如图5d所示,患者可以根据风险得分分成两组,两组有不同的生存时间(图5ef)。图5g通过热图和散点图揭示了365名具有生存时间的HCC患者的表达谱和风险得分。在多变量Cox回归分析中,血管入侵与HCC患者的预后无关。因此,来自13个lncRNA的表达水平和病理分期的系统是HCC患者生存期的独立预后指标(图5h)。
结果8:刻画lncRNAs和mRNAs之间的相关性
图6
根据ceRNA机制,lncRNAs通过直接与miRNA相互作用调节mRNA表达。为了验证HCC中的这种现象,对与生存时间显着相关的13种风险评分相关的lncRNA和16种mRNA进行了回归分析。然后,作者研究了lncRNA和mRNA之间是否存在共有的miRNA。结果显示miR-519d是参与多种ceRNA途径的关键基因,包括AL359878.1-miR-519d-POLQ,AL359878.1-miR-519d-KIF23 ,TCL6-miR-519d-POLQ。此外,lncRNA AL359878.1通过另一种常见的miRNA miR-373与mRNA PI3K相关(图6a,b)。
到这里,文章的主要内容就介绍完了,作者整合多种数据资源以及生物信息学方法,构建出了具有预后效能的ceRNA网络,其研究思路与方法都可以借鉴。
更多生信分析套路,请加微信13621202201
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史