小鼠肝脏中lncRNA和蛋白质编码基因的差异甲基化、表达和相互作用的分析
Analysis of diet-induced differential methylation, expression,
and interactions of lncRNA and protein-coding genes in mouse liver.
Scientific Reportsvolume 8, Article number: 11537 (2018)
今天要讲的这篇文章是2018年6月发表的。首先作者对小鼠高脂肪饮食和标准饮食的肝脏进行了表达(RNA-seq)和甲基化(5meDIP-seq)的差异分析,筛选了差异表达lncRNA和蛋白质编码基因,然后进行通路富集分析,再通过基因组位置信息来筛选lncRNA和编码基因对,最终具体分析几个重要的基因,进行差异甲基化分析。
摘要:
长非编码RNA(lncRNA)通过染色质修饰(包括DNA甲基化)顺式调节蛋白质编码基因的表达。在喂养12周富含胆固醇的西式高脂肪饮食(HFD)与标准饮食(STD)的小鼠肝脏的比较中,lncRNA基因是否可以调节其两侧或重叠的蛋白质编码基因的转录和甲基化。细胞类型特异基因表达的反卷积分析表明在HFD和STD肝脏中具有相似的肝细胞类型组成。通过RNA-seq和nCounter技术进行的验证揭示了14种lncRNA基因和395种蛋白质编码基因的差异表达,这些基因富集到类固醇/胆固醇合成,脂肪酸代谢,脂质定位和昼夜节律的功能上。虽然lncRNA和蛋白质编码基因在53个lncRNA /蛋白质编码基因对中共表达,但两者仅在4个lncRNA /蛋白质编码基因对中差异表达,没有一个蛋白质编码基因在过表达的通路中。此外,5-甲基胞嘧啶DNA免疫沉淀测序和靶向的亚硫酸氢盐测序中显示在过量表达的通路中的基因没有差异甲基化。这些结果表明,lncRNA /蛋白质编码基因顺式交互作用在介导脂质代谢/定位和生物钟基因的肝脏表达中起到辅助作用,以响应慢性HFD摄食。
介绍:
哺乳动物70%的基因组被转录为非编码RNA,只有1-2%的基因组被转录为蛋白质编码RNA。lncRNA可通过表观遗传、转录和转录后机制影响蛋白质编码转录物的表达。RNA-seq是用于分析lncRNA表达的通用基因组技术。功能性饮食引起的lncRNA和编码基因之间的相互作用的表征对于鉴定新的基因组生物标志物和代谢疾病的治疗靶标是有意义的。
结果1:小鼠肝脏转录组的构成
8周的雄性小鼠分别按照STD(n=6)和HFD(n=6)喂养。经过12周喂食后,对动物实施安乐死并收集其肝脏。对小鼠的肝脏进行双末端测序,通过STAR比对到小鼠基因组上,利用HTSeq比对使比对的reads匹配到小鼠mm10基因组来确定基因的read数。13365个基因中包含11993个蛋白编码基因,765个假基因和607个ncRNA基因。如下图所示:
结果2:差异表达基因分析
使用edgeR包来筛选差异表达基因。本文共计筛选出了425个差异表达基因(FDR<0.05)。差异表达基因包含了395个蛋白质编码基因、6个lincRNA、7个反义RNA基因、13个假基因和2个snRNA基因。层次聚类分析清晰地区分开HFD和STD肝脏的基因表达特征。通过nCounter技术验证了edgeR计算的大多数蛋白编码基因的fold-change值。如下图所示:
结果3:肝脏细胞类型成分的虚拟反卷积
为了排除基因表达变化与肝细胞类型组成的差异有关,作者使用数字排序算法(DSA)和CellMix1.6包中的meanProfile算法通过去卷积细胞类型特异标记基因表达来估计细胞类型频率。结果表明在HFD和STD肝脏中具有相似的细胞类型组成。如下图所示:
结果4:差异表达基因的通路分析
使用DAVID和BiNGO应用到Cytoscape3.2对425个差异表达基因进行了通路分析。如下图所示:
差异表达基因主要富集在类固醇生物合成、胆固醇代谢、脂肪酸代谢、脂质定位和昼夜节律上。
结果5:lncRNA基因的表达谱
基于所有的STD和HFD肝脏RNA的平均表达水平进行排序。丰度最高的十种lncRNA是Yam1, Malat1, Gm26870, RP23-181K4.2, B430119L08Rik, 1700020I14Rik, Neat1, Kcnq1ot1, Gm15564和 Brip1os。
结果6:顺式蛋白编码基因和lncRNA的共表达分析
对lncRNA最临近的或重叠的蛋白质编码基因做共表达分析。识别到293个lncRNA/蛋白编码基因对,并使用Pearson相关系数证明。发现共表达的lncRNA基因与VISTA中注释的已知小鼠增强子没有重叠,VISTA是高度保守的人和小鼠增强子的综合数据库,表明这些lncRNA基因可能不是增强子衍生的RNA。GO功能分析揭示了共表达蛋白编码基因在脂质代谢、细胞分裂等方面的功能。
结果7:饮食响应的lncRNA基因
EdgeR识别了14个差异表达的lncRNA基因,nCounter证实了其中11个lncRNA基因有饮食响应功能。
结果8:共表达的lncRNA/蛋白编码基因对的饮食反应性
只有4个共表达的lncRNA /蛋白质编码基因对对饮食有反应,共表达的饮食反应蛋白质编码基因在细胞分裂(Sfi1)中具有功能,可能在转录和染色质重塑(C130026I21Rik)中或具有未知功能(Gm10717)。 因此,共表达的饮食反应蛋白质编码基因没有一个在过表达的生物过程中起作用。如下图所示:
结果9:通过5meDIP-seq对DNA甲基化进行全基因组评估
本文又对STD和HFD的小鼠肝脏进行了5meDIP-seq测序,在6个肝脏的库中共检测了154664个甲基化区域,共有的的甲基化区域有36383个。这些基因内甲基化区域位于蛋白质编码基因、非编码基因和假基因中,其中,1690个甲基化区域映射到注释的CpG岛上,大多数是基因内的。
结果 10:用5meDIP-seq分析饮食诱导的DNA甲基化
本文通过t检验分析比较了STD和HFD肝脏中相应甲基化区域的平均read数,利用FWER矫正多重检验的p值,评估差异DNA甲基化。还通过DESeq2评估相应甲基化区域之间的差异来检测差异甲基化。DESeq2证实了调整p值<0.1的差异甲基化区域是不存在的。因此,5meDIP-seq显示STD和HFD肝脏之间的DNA甲基化仅有非常小的差异,并且这些在统计学方法中不显著。
结果11:靶向BS-seq分析饮食引起的DNA甲基化
本文为了评估5meDIP-seq验证的差异DNA甲基化,对10个甲基化区域进行亚硫酸盐测序,分别映射到10个基因上。STD和HFD在10个测序的甲基化区域中,有9个甲基化不存在差异。
此文章虽然较简单,但其流程套路及涉及到的软件还是值得我们学习的。
欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史