Molecular Mechanisms of Long Noncoding RNAs
LncRNA的分子机制
上个星期,青山与师兄聊到ceRNA网络的生信文章也屡见不鲜了,师兄听后,默默说了一句 “不是文章套路不新鲜了,是大家对lncRNA的了解在ceRNA就到头了。“
我顿时发现,自己对lncRNA的了解也十分有限,脱离本质,只依靠分析方法,去解释lncRNA在疾病中的机制实在是太肤浅,所以赶紧找来这篇综述学习。同时,青山也将这篇综述分享给大家。
正文开始之前,先不直接解释LncRNA的定义,首先他也是一种RNA,和mRNA有什么区别的呢?mRNA和DNA到底是什么呢?和人体的生长发育又有什么联系呢?种种问题使我不仅好奇起来,那么,让青山带大家一起探索这个既耳熟能详,又不知从何说起的大自然神奇造物。
细胞中的生物大分子有四种,分别是蛋白质、脂质、糖类和核酸。蛋白质是细胞生命活动的主要承担者,基本单位是氨基酸。脂质包括脂肪、磷脂和固醇三种,其中脂肪是细胞内的主要储能物质,磷脂是生物膜的重要组成成分,固醇包括胆固醇、性激素和维生素D三种。糖类是细胞内的主要能源物质。核酸是生物体内遗传物质,包括脱氧核酸(DNA)和核糖核酸(RNA)两种。
在基因组中,遗传信息存储在称为基因的DNA序列中,基因是含有能够影响生物体表型特征的遗传信息的DNA序列。基因内的DNA碱基序列作为模板可以合成RNA分子,在大多数情况下,RNA分子被翻译成多肽,折叠为蛋白质。 将基因的核苷酸序列复制到RNA链中的过程称为转录。
人体一个细胞含RNA约10pg(含DNA约7pg)。与DNA相比,RNA种类繁多,分子量较小,含量变化大。RNA可根据结构和功能的不同分为信使RNA和非编码RNA。非编码RNA分为非编码大RNA和非编码小RNA。非编码大RNA包括核糖体RNA、长链非编码RNA。非编码小RNA包括转移RNA、核酶、小分子RNA等。小分子RNA(20~300nt)包括 miRNA、 SiRNA、 piRNA、scRNA、 snRNA、 snoRNA等。真核生物90%的RNA分布在细胞质中,少量存在于线粒体和核仁。
首先简要概括mRNA的特点,mRNA只占细胞总RNA的2%~5%,但种类最多,并且代谢十分活跃,是半衰期最短的一种RNA,合成后数分钟至数小时即被分解。真核细胞的mRNA分子最显著的结构特征是具有5’端帽子结构(m7G)和3’端的Poly(A)尾巴。这种结构为真核mRNA的提取,提供了极为方便的选择性标志,寡聚(dT)纤维素或寡聚(U)琼脂糖亲合层析分离纯化mRNA的理论基础就在于此。
一、lncRNA概述
从原核生物到真核生物,非编码RNA随着生物体级别的增高,其在细胞的含量也逐渐升高,相较于只有2%的mRNA,人类细胞含有约98.5%的非编码RNA。这提示随着基因组复杂程度和生物体内智能化程度越来越高,非编码RNA的功能也随之增加。从长度对比,哺乳动物mRNA长度为5×102~1×105nt,而长链非编码RNA(Long non-coding RNA, lncRNA) 是长度大于 200 个nt的非编码 RNA。
LncRNA的功能
lncRNA可以作为主要研究分子的原因,就是lncRNA可以在不同的水平(表观遗传学-染色质重构,转录调控,转录后加工)调控编码蛋白的mRNA的表达[1,2]。
lncRNA可通过招募染色质重塑复合物至特定的基因组位点使其发生催化活性。如图3a,HOTAIR、Xist/RepA和Kcnqot1招募Polycomb complex至HoxD位点,使得X染色体或Kcnq1功能域的组蛋白H3第27位赖氨酸发生3甲基化(me3K27),诱导异染色质形成,从而抑制该区域基因表达。
lncRNA可通过多种机制进行转录水平调控,包括自身作为共调节因子、修饰转录因子活性、调节共调节因子的结合和活性等。lncRNA靶向基因转录过程的不同环节,如转录激活因子、阻遏蛋白,包括RNA聚合酶II、甚至DNA双链在内的转录反应成分来调节基因转录和表达。这些lncRNA可能形成一个包括转录因子的调控网络,在复杂的真核生物中精细调控基因表达。如图3b,lncRNA结合到基因cyclin D1上,招募RNA结合蛋白TLS来调控蛋白CBP和p300的组蛋白乙酰转移酶活性,进而抑制cyclin D1转录;图3c,超保守增强子转录出lncRNA-Evf2,该lncRNA能激活转录因子DLX2,进而调控基因Dlx6转录;图3d,DHFR次要启动子区域转录出的lncRNA与该基因主要启动子区域结合形成三聚体,抑制转录因子TFIID结合,从而使基因DHFR发生沉默。
互补的lncRNA与mRNA形成RNA双链体可掩盖mRNA内部与反式作用因子结合必须的主要元件,可能影响转录后基因表达的任何步骤,包括pre-mRNA的加工、剪接、转运、翻译、降解。图3e中,反义lncRNA与剪接体(splicesome)中锌指同源mRNA Zeb2的5'剪切位点结合,使内含子未被剪切掉,而该内含子序列中保留有内部核糖体进入位点(IRE位点),翻译过程中识别并结合该位点,导致Zeb2基因表达和翻译。
罗列定义是很抽象不好理解的,Mercer[3]总结了8个lncRNA调控mRNA表达的具体机制(图4):
1.编码蛋白的基因上游启动子区(橙色)转录,干扰下游基因(蓝色)的表达;
2.抑制RNA聚合酶II或者介导染色质重构以及组蛋白修饰,影响下游基因(蓝色)的表达;
3.与编码蛋白基因的转录本形成互补双链(紫色),干扰mRNA的剪切,形成不同的剪切形式;
4.与编码蛋白基因的转录本形成互补双链(紫色),在Dicer酶的作用下产生内源性siRNA; 5.与特定蛋白质结合,lncRNA转录本(绿色)可调节相应蛋白的活性;
6.作为结构组分与蛋白质形成核酸蛋白质复合体;
7.结合到特定蛋白质上,改变该蛋白质的细胞定位;
8.作为小分子RNA(如miRNA、piRNA)的前体分子。
探索非编码RNA的种类
在Chris P[4]的文章中,非编码RNA的来源有多个途径,可以由编码蛋白质的基因结构发生中断而转变成非编码RNA;也可通过染色质重排,生成含多个外显子的非编码RNA;另外,非编码基因通过反转录转座作用复制,产生有功能的非编码反义基因以及没有功能的非编码反转录假基因;再者,非编码RNA内部某段序列的重复复制,产生了新的具有相邻重复序列的非编码RNA;转座元件插入基因组中,也可产生一个有功能的编码RNA。
Massively parallel cDNA sequencing,也就是转录组测序技术(RNA-Seq),测序的结果主要依赖于现有的转录本注释,基于现有的转录本分析基因的表达水平和变异。Mitchell[5]提出了一种重建哺乳动物转录组的技术,Scripture。Mitchell通过对小鼠的胚胎干细胞测序,重新坚定了小鼠胚胎干细胞的转录组,在已知的编码RNA基因序列间发现了大量的未知区域,包括了上千个新的5 '起始位点,3 '末端和内部编码外显子。Mitchell利用Scripture测序技术,鉴定了超过1000个大型基因间非编码RNA (lincRNA)和反义位点的基因结构。目前除了少数lncRNA的功能比较明确外,大部分lncRNA的功能都还未知。非常值得去深入研究。(图6)
根据基因组上的位置关系,lncRNA主要可以分为以下三大类[6](图7所示):1、Intronic lncRNA,内含子lncRNA:主要产生于编码基因的内含子区域;2、Intergenic lncRNA,基因间区的lncRNA,也称作lincRNA:主要产生于两个编码基因的中间区域;3、Antisense lncRNA,反义lncRNA:主要产生于编码基因的反义链。进一步根据基因组位置还可细分为下面的类型[7](图8):
LncRNA的种类及在基因组的未知如此繁杂,注释起来也相对困难,目前保存lncRNA信息的数据库达十余种(不是我们生信分析预测mRNA的那种数据库),但不同数据库注释的lncRNA完整性和覆盖度不大一样。就这样看,是不是觉得目前的生信分析,还是很局限呢?那些叫嚣着生信已经玩烂的人,可能要重新审视一下lncRNA的潜力。
从Antisense lncRNA为例,展开对lncRNA功能的分析,在不改变基因核苷酸序列的情况下,antisense lncRNA能够结合DNA进行甲基化酶及染色质组蛋白修饰酶的招募,通过改变染色质状态,调控正义基因的表达,并且产生可遗传变异。像这种修饰可以小到作用于一个基因,大到影响整个染色体,比如Xist和反义Tsix二者介导的X染色体失活过程(图9)。
由于哺乳动物雌性含有两条X染色体,而雄性只有一条X染色体,为了确保雄性(XY)和雌性(XX)的X基因剂量相等,雌性胚胎会发生单个X染色体永久失活,即“剂量补偿”效应。非编码RNA Xist是X染色体失活的主要参与基因,Xist仅在失活的X染色体中表达,其通过包裹合成它的X染色体,并结合Eed/PRC2复合物形成H3K27me3组蛋白修饰,进而抑制基因转录,致使X染色体失活。而在Xist基因3'端存在antisense lncRNA Tsix,Tsix的转录可以阻止Eed/PRC2募集到Xist启动子区并且抑制H3K4甲基化,导致染色质结构发生改变,最终沉默Xist。
由于antisense lncRNA和正义链基因方向相反,单单从空间位置来说,有模型表明当正/反义链同时转录形成RNA时,RNA聚合酶会相遇产生一定的空间阻碍,从而使RNA的转录受到抑制,像这种转录调控是由于基因本身方向相反导致,并不是由antisense lncRNA本身的调控功能引起对正义链基因转录的影响。
在细胞核内,antisense lncRNA能够与正义链RNA通过碱基配对形成二聚体,二聚体的形成会导致部分外显子的剪接位点被掩盖掉,从而影响前体pre-mRNA的剪切过程,产生不同种类的mRNA成熟体。研究表明,antisense lncRNA除了通过二聚体形式调控pre-mRNA的成熟剪切,它也可以对核内mRNA的部分核苷酸进行替换编辑,如果蝇的反义Sas-10通过结合Rnp4f,将Rnp4f部分腺嘌呤替换为次黄嘌呤,从而降低Rnp4f mRNA的表达水平。
Antisense lncRNA不只在细胞核内影响正义基因的转录,正/反义链RNA二聚体同样能够在转录后水平调控基因的表达。Antisense lncRNA可以结合正义基因mRNA 3’ UTR区,封闭大量miRNA的靶位点,阻碍了miRNA对靶基因的抑制作用,从而维持mRNA的稳定性。如反义lncRNA-PXN-AS1-L能够结合PXN mRNA 3’ UTR,提高PXN mRNA的稳定性,最终促进癌基因RXN的表达和肿瘤细胞的生长3。 Antisense lncRNA同样能够吸附miRNA,进而减弱miRNA对靶基因的下调。另外,antisense lncRNA可与编码蛋白基因的转录本,形成互补双链,在Dicer酶的作用下产生类似内源性的siRNA,从而沉默编码基因的表达。下面让我们开始解读正文。
重点定义:
*等位基因:人的眼睑形态是一种性状,这种性状有不同的表现形式:双眼皮、单眼皮,其中单为隐性,双为显性。我们把它们称为相对性状。性状又是由基因控制的,控制显性性状的为显性基因(用大写字母,如A),控制隐性性状的为隐性基因(用小写字母,如a)。基因在体细胞中成对存在,所以一个个体的基因型就有:AA,Aa,aa。A和a就可以表示一对等位基因,即染色体的相同位置上控制相对性状的一对基因。
*基因座:基因座是染色体上的固定部位,在相同基因座上编码相同的DNA被称为等位基因。形象地说,一对染色体可想象为两条平行线,染色体上一个给定的位置,好比两平行线上相对应位置的一点或一段,叫做基因座。
*顺式作用:同一染色体上DNA序列直接调控其邻近基因的表达,例如,DNA对DNA。由某一基因表达后,对自身基因进行转录调控的作用;调节因子是与被调节基因同处于一条DNA链上的另一端DNA片段而进行的调节。
*顺式作用元件:顺式作用元件(cis-acting element)存在于基因旁侧序列中,能影响基因表达的序列。顺式作用元件包括启动子、增强子、调控序列和可诱导元件等,它们的作用是参与基因表达的调控。顺式作用元件本身不编码任何蛋白质,仅仅提供一个作用位点,要与反式作用因子相互作用而起作用。
*顺式or反式:在分子遗传学领域,相对同一染色体或DNA分子而言为“顺式”(cis);对不同染色体或DNA分子而言为“反式”(trans)。
*印记基因:指来自父or母方的,亲本来源的同源基因表达,而来自另方的不表达,因为来自父方和母方的等位基因在通过精子和卵子传递给子代时发生了修饰,使带有亲代印记的等位基因具有不同的表达特性,这种修饰常为DNA甲基化修饰,也包括组蛋白乙酰化、甲基化等修饰。
*印记基因的修饰:在生殖细胞形成早期,来自父方和母方的印记将全部被消除,父方等位基因在精母细胞形成精子时产生新的甲基化模式,但在受精时这种甲基化模式还将发生改变;母方等位基因甲基化模式在卵子发生时形成,因此,在受精前来自父方和母方的等位基因具有不同的甲基化模式,在成卵子后会有不用的基因表达模式。
二、 原型Ⅰ:信号(Archetype I: Signals)
等位基因特异性:Xist
Xist lncRNA与X染色体失活
X染色体去激活,又称X染色体失活或里昂化,是指雌性哺乳类细胞中两条X染色体的其中之一失去活性的现象[8]。正常的雌性拥有两条X染色体,有一条保有活性,标记作Xa;另一条则失活,标记作Xi。目前的假说认为,体染色体上有某个基因会制造出“阻碍因子”(blocking factor)来与X染色体结合,进而防止此染色体失去活性。X染色体上存在一种称为X去活化中心(X inactivation center,XIC)的序列,可调控X染色体的沉默化,是阻碍因子可能的结合位置。这些XIC序列是造成X染色体去活化的充要条件。
XIC序列上含有两个非转译RNA基因,分别是Xist与Tsix,此两者参与了去活化作用。此外,XIC上含有一些结合位置,分别可供一些已知和未知调控蛋白(regulatory protein)结合。Xist基因会转录出RNA分子,且此RNA将不会转译成蛋白质,XistRNA会从XIC位置开始,逐渐将Xi包覆起来,而且这些XistRNA并不会作用到Xa上。Xi被RNA包覆过后不久就会发生基因沉默现象。Xist是X染色体去活化的主要影响因子,Xi染色体外围会被XistRNA包覆,而Xa则没有这种现象。缺乏Xist基因的X染色体将无法去活化。
另一方面,Tsix基因同样也会转录出一条无蛋白质产物的RNA分子。Tsix基因是Xist基因的反义序列,也就是说,两者实际上是来自同一段DNA上互补的两股,而他们的产物RNA也因此具有互补性。这使Tsix成为Xist的负向调节因子,使没有表现Tsix的X染色体比较容易被去活化。
*知识点拓展:2021年3月17日,来自斯坦福大学Howard Chang教授团队在Cell上发表论文B cell-specific XIST complex enforces X-inactivation and restrains atypical B cells。本文首次报道了XIST在成体免疫B细胞中维持X染色体失活的重要作用和调控机制。这一发现颠覆了领域之前对XIST在成体体细胞中X失活作用的认识,拓宽了lncRNA-蛋白复合物的细胞特异性功能,揭示了X失活对免疫反应两性差异的重要影响。
表达趋势与器官生长有关:HOTAIR和HOTTIP
HOX基因座的ncRNA
Hox基因,全名同源基因(homeotic genes)或同源异型基因。是生物体中一类专门调控生物形体的基因,一旦这些基因发生突变,就会使身体的一部分变形。其作用机制,主要是调控其他有关于细胞分裂、纺锤体方向。Hox基因属于同源异型盒(homeobox)家族的其中一员,在大多数Hox基因中,会含有一段约180个核苷酸的同源异型盒,可以转录出含有约60个氨基酸序列,称为同源蛋白质区段(homeodomain)。各种生物的Hox基因之表现方式类似,靠近3'端的基因会表现于动物的身体前部,靠近5'端则表现于身体的后部。除了这种规律之外,Hox基因又会因为一些原因,而在不同状态下有不同的表现。
人类的Hox基因可分成4个基因群集,分别位在不同的染色体上,这些染色体分别是7号、17号、12号与2号。人类的Hox基因在书写时以全大写表达,例如HOXA、HOXB、HOXC与HOXD。此外,这些基因可分成13个平行同源家族(paralogous family),以数字表示,例如HOXA4,HOXB4,HOXC4与HOXD4。这些家族成员的DNA序列与转录出来的蛋白质序列类似。其中HOXD13的突变会造成多指症(synpolydactyly);而HOXA13的突变则会导致手脚生殖器症(hand-foot-genital syndrome,HGFS)。另外HOXB群集中的8个成员会影响红血球的发育,其中HOXB4与HOXB7又会影响T细胞与B细胞。
大量的lncRNA被发现转录于人类HOX基因簇中,它们以时间和空间特异的方式表达。lncRNA也被发现与HOX基因座的整体空间表达模式相对应,表明它们可能使用与HOX基因相同的增强子,例如,HOTAIR,一个HOXC基因座的lncRNA,在远端和后端位置相同的细胞中表达;以及Frigidair,另一个HOXC基因座的lncRNA,具有前端的表达模式。相反,HOTTIP,另一个在人HOXA簇远端发现的lncRNA,也在远端细胞中表达[9]。(图14)
知识点拓展:HOX基因在喉癌组织与癌旁正常组织中的表达谱研究[10](生信分析)
DNA损伤诱导:LincRNA-p21和PANDA
LncRNA不仅影响生物发育,而且在组织应激时(炎症、肿瘤)也起着重要作用。研究发现,lncRNA-p21位于CDKN1A基因上游,参与调控p53介导的凋亡过程。
lincRNA-p21 由 p53 直接激活,与异质性核糖核蛋白K(hnRNP-K) 这个反式作用因子直接相互作用来共同调控细胞凋亡[11]。(图15)
lncRNA-PANDA也依赖p53基因的激活。在缺乏p53基因的情况下,PANDA不能被DNA损伤激活。在DNA损伤后,p53直接与CDKN1A位点结合并激活PANDA。PANDA随后与转录因子NF-YA相互作用,限制促凋亡基因的表达,使细胞周期停滞[12]。
多能性与重编程:ROR-LncRNA
提到多能性和重编程,大家一定能联想到诱导性多能干细胞(induced pluripotent stem cells,iPS cells)。2006年日本京都大学Shinya Yamanaka在世界著名学术杂志《细胞》上率先报道了诱导多能干细胞的研究。他们把Oct3/4,Sox2、c-Myc和Klf4这四种转录因子基因克隆入病毒载体,然后引入小鼠成纤维细胞,发现可诱导其发生转化,产生的iPS细胞在形态、基因和蛋白表达、表观遗传修饰状态、细胞倍增能力、类胚体和畸形瘤生成能力、分化能力等方面都与胚胎干细胞相似。
科学家发现在小鼠胚胎干细胞(ESC)中存在一种与细胞多能性相关的lincRNA-ROR。研究人员表明,重编程可以诱导体细胞转化为多能干细胞(iPSC)。lincRNA-RoR参与了体细胞重编程转化为多能性干细胞的过程。ROR是关键的多潜能因子Oct4、Sox2和Nanog的直接靶向因子,研究发现RoR在Oct4缺失时下调,在iPSC分化过程中也下调[13]。
冷诱导:COLDAIR和COOLAIR
本篇综述,作者也举了植物相关的lncRNA参与的分子机制。对植物来说,从营养发育到生殖发育的转变是一个高度调节的过程。许多植物对季节非常敏感,利用春化作用储备营养,在一年中的最佳时期开始开花。冬季寒冷的环境中会通过表观遗传沉默机制,激活抑制开花的因子,为春季开花提供能力。例如在拟南芥植物中,寒冷引起开花因子沉默的过程中,产生了大量的反义转录本,其中一种lncRNA,命名为COOLAIR,温度下降激活lncRNA-COOLAIR与PRC2形成复合物,导致花抑制因子-开花位点C(FLC)染色质上三甲基化组蛋白H3K27的富集,达到FLC的表观遗传稳定的抑制作用。
以eRNA为例的协调活性
在发育和分化过程中,基因的表达调控涉及许多元件,例如,顺式调控DNA元件和反式作用蛋白。顺式调控DNA元件有启动子,绝缘子,增强子和沉默子。其中,一类被称为增强子RNA(eRNA),也是一种lncRNA,eRNA的长度为0.5-5kb。
启动子位于基因近端,与一般转录因子相关联,招募和定位RNA聚合酶激活转录。与启动子相反,增强子eRNA通常远离它们所调控的基因。是一类DNA调节序列,其可以激活基因表达而不依赖于它们与其靶基因的距离或方向。增强子通常与靶基因结合。在发育过程中,按时间及组织特异性调控编码基因的表达。它们的错误调节会诱发人类疾病。研究报道,eRNA的改变可影响癌细胞的细胞周期和细胞生长等生物过程,是潜在的治疗靶点。目前估计> 400k潜在的增强子存在于人类基因组中[14]。
重复检测:RNA降解和Staufen
mRNA的丰度与蛋白质的产量由直接的联系。影响mRNA丰度的主要因素就是转录量和降解速率。mRNA的转录量和降解速率主要通过转录水平调控和转录后加工决定。RNA结合蛋白Staul(Staufenl)通过直接结合移码增加蛋白(up-fameshift protein 1,Upf1)的NMD因子,将其募集到mRNA的3‘-非编码区域(UTR),引起mRNA的降解。这种机制称为Staul介导的mRNA降解 (SMD)。一种称为半Staul结合位点的lncRNA,1/2-sbsRNA(half-STAU1结合位点lncRNA),通过与mRNA的3‘-非编码区域(UTR)的ALU元件的不完全匹配,形成Staul结合位点,促进Staul与mRNA结合导致mRNA降解[15,16]。
三、功能2:分子诱饵
上述研究结果证明lncRNA在调节mRNA转录中的重要地位,此外,还有一个主要的机制,lncRNA充当分子诱饵。吸引另外一个分子与它结合,并发挥功能。
DHFR次要启动子:DHFR Minor
二氢叶酸还原酶(dihydrofolate reductase,DHFR)是利用NADPH还原二氢叶酸产生四氢叶酸的氧化还原酶。DHFR次要启动子区域转录出的lncRNA与该基因主要启动子区域结合形成lncRNA-DNA复合体,抑制转录因子TFIID结合,从而使基因DHFR发生沉默[13],并强调了基因间的lncRNA在调控邻近基因表达中充当诱饵,结合某些物质抑制基因表达。
TERRA:调控端粒
端粒是位于真核生物染色体物理末端的DNA-蛋白质复合物,对染色体稳定性至关重要。由端粒转录产生的长链非编码RNA被称作TERRA, TERRA具有调控和保护染色体末端的能力[17]。研究报道,携带PolyA的TERRA,刺激端粒酶阳性细胞中的端粒酶重新募集,以及TERRA可作为支架,可以加强端粒上蛋白质 招募和酶活性。
PANDA:NF-YA
lncRNA PANDA可以调控细胞凋亡。DNA损伤可导致细胞凋亡或细胞周期停滞。PANDA对DNA损伤非常敏感,其表达的诱导早于CDKN1A。PANDA通过直接结合和分离NF-YA(一种在DNA损伤时激活凋亡程序的核转录因子)来抑制凋亡基因的表达,以利于细胞周期的停止。
Gas5:糖皮质激素受体
生长阻滞特异性转录因子5(growth arrest-special transcript 5, GAS5)属于长链非编码RNA, 位于人类基因组1号染色体上, 在细胞增殖、凋亡、迁移和侵袭等生物过程中起重要调控作用。研究表明Gas5具有诱导细胞糖皮质激素抵抗的作用。Gas5通过形成RNA模体与糖皮质激素受体的DNA结合域结合,充当分子诱饵,抑制糖皮质激素受体[18]。
miRNA和剪接因子介导的LncRNA诱饵:假基因、miRNA靶向模拟物和MALAT1
miRNA可以与mRNA中的不完全互补序列相互作用调控编码基因的表达。而lncRNA,肿瘤抑制因子假基因(PTENP1)的3’ UTR与以肿瘤抑制基因(PTEN)为靶点的调节性miRNA序列结合,抑制PTEN基因的下调,并使其翻译成肿瘤抑制蛋白PTEN。
总之,这些例子说明了lncRNA诱饵可以结合蛋白质和小的调节性RNA发挥作用。
四、功能III:引导
lncRNA的第三个功能是引导RNA结合蛋白质,然后引导核糖核蛋白复合物定位到特定的靶点。lncRNA可以以顺式(在邻近基因上)或反式(远定位基因)的方式来引导基因表达的变化。
顺式导向作用之一,前面也有提及,lncRNA具有类似启动子和增强子的作用结合X染色体的非活性中心,使X染色体沉默[19]。(图19)
起到反式导向作用的lncRNA,类似于转录因子一样的结构,可发挥反式转录调控作用; 比如lncRNA HOTAIR与肿瘤转移相关,研究发现lncRNA HOTAIR表达下降,细胞侵袭性下降,其中lncRNA HOTAIR对肿瘤转移的影响通过反式调控PRC2表达实现[20]。
五、功能IV:支架
TERC:组装端粒酶
端粒酶催化活性需要与两个端粒酶亚基的结合。TERC(端粒酶RNA)为合成端粒酶提供模板并且为端粒酶与催化蛋白的结合和催化活性提供结构基础[21]。
HOX基因座转录反义RNA(HOTAIR):PRC2和LSD1
如前面所述,lncRNA HOTAIR结合多梳复合物PRC2,使K27上的组蛋白H3甲基化。发挥抑制基因表达的作用。研究报道与PRC2结合的片段是lncRNA HOTAIR 的5’ 端的前300nt,表明HOTAIR在PRC2和LSD1/CoREST/REST复合物之间充当支架和桥梁。
INK4基因座反义非编码RNA(ANRIL):PRC2 and PRC1
INK4为细胞周期蛋白依赖的激酶抑制剂,INK4可与MDM2结合防止p53被泛素化降解,这两种蛋白通过共同调节CDK4和p53,从而控制细胞从G1期转到S期,是一个非常重要的抑癌基因。反义lncRNA-ANRIL,来源于INK4b/ARF/INK4a基因座,有类似于启动子和增强子的作用,ANRIL与多梳抑制复合物PRC2 and PRC1相结合,并通过与这两种多梳蛋白相互作用引起INK4a基因转录沉默。
异染色质:
lncRNA发挥异染色质的分子拼接作用。异染色质是指在细胞周期中具有固缩特性的染色体。异染色质分为结构异染色质和功能异染色质两种类型。结构异染色质是指各类细胞在整个细胞周期内处于凝集状态的染色质,多定位于着丝粒区、端粒区,含有大量高度重复顺序的脱氧核糖核酸(DNA),称为卫星DNA(satellite DNA)。功能异染色质只在一定细胞类型或在生物一定发育阶段凝集,如雌性哺乳动物含一对X染色体,其中一条始终是常染色质,但另一条在胚胎发育的第16~18天变为凝集状态的异染色质,该条凝集的X染色体在间期形成染色深的颗粒,称为巴氏小体(Barr body)。
总结
通过上述介绍的几种lncRNA,可以说lncRNA具备多种关键的生物学功能。目前发表的生信分析的文章,分析内容主要涉及单个lncRNA在某些肿瘤中的预后作用,与临床的相关性,通过一些lncRNA数据库预测一些靶基因,再富集分析一下。进阶版本就是ceRNA网络。但总的来讲lncRNA与基因的作用不应该限于作用于某个mRNA并调控mRNA的表达。也许,某些lncRNA本身异常的增高也是一种机制呢?希望由本篇综述以及扩展学习的资料,为大家增加一点关于生物信息的背景知识,再写非编码RNA的文章的时候,可以更进一步的讨论其与肿瘤的关系。
参考文献
1. Mercer TR, Dinger ME, Mattick JS. Long non-coding RNAs: insights into functions. Nature Reviews Genetics. 2009;103:155-159.
2. St. Laurent G, Wahlestedt C, Kapranov P. The Landscape of long noncoding RNA classification. Trends in Genetics. 2015;315:239-251.
3. Wilusz JE, Sunwoo H, Spector DL. Long noncoding RNAs: functional surprises from the RNA world. Genes Dev. 2009;2313:1494-1504.
4. Ponting CP, Oliver PL, Reik W. Evolution and Functions of Long Noncoding RNAs. Cell. 2009;1364:629-641.
5. Guttman M, Garber M, Levin JZ, et al. Ab initio reconstruction of cell type–specific transcriptomes in mouse reveals the conserved multi-exonic structure of lincRNAs. Nature Biotechnology. 2010;285:503-510.
6. Scheuermann J, Boyer L. Getting to the heart of the matter: Long non-coding RNAs in cardiac development and disease. The EMBO journal. 2013;32.
7. Ransohoff JD, Wei Y, Khavari PA. The functions and unique features of long intergenic non-coding RNA. Nature Reviews Molecular Cell Biology. 2018;193:143-157.
8. Pontier DB, Gribnau J. Xist regulation and function explored. Human genetics. 2011;1302:223-236.
9. Rinn JL, Kertesz M, Wang JK, et al. Functional Demarcation of Active and Silent Chromatin Domains in Human HOX Loci by Noncoding RNAs. Cell. 2007;1297:1311-1323.
10. 曲灵美, 徐光达, 李昕, et al. HOX基因在喉癌组织与癌旁正常组织中的表达谱研究. 中国中西医结合耳鼻咽喉科杂志. 2018;261:3.
11. Lander, E. S, Regev, et al. A large intergenic noncoding RNA induced by p53 mediates global gene repression in the p53 response. CELL -CAMBRIDGE MA-. 2010.
12. 陈晓英. LncRNA PANDA通过抑制细胞凋亡调控动脉粥样硬化发展过程, 汕头大学; 2016.
13. Loewer S, Cabili MN, Guttman M, et al. Large intergenic non-coding RNA-RoR modulates reprogramming of human induced pluripotent stem cells. Nat Genet. 2010;4212:1113-1117.
14. Li W, Lam MT, Notani D. Enhancer RNAs. Cell Cycle. 2014;1320:3151-3152.
15. 夏天, 肖丙秀, 郭俊明. 长链非编码RNA的作用机制及其研究方法. 遗传. 2013;353:269-280.
16. Gong C, Maquat LE. lncRNAs transactivate STAU1-mediated mRNA decay by duplexing with 3′ UTRs via Alu elements. Nature. 2011;4707333:284-288.
17. Montero JJ, López de Silanes I, Graña O, Blasco MA. Telomeric RNAs are essential to maintain telomeres. Nature Communications. 2016;71:12534.
18. 李明凯, 詹浩炼, 吴灵飞. 长链非编码RNA GAS5在肿瘤中的研究进展. 世界华人消化杂志. 2019;2703:42-49.
19. Lee JT. The X as model for RNA's niche in epigenomic regulation. cold spring harb perspect biol. 2010;29:a003749.
20. Gupta RA, Shah N, Wang KC, et al. Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis. NATURE -LONDON-. 2010.
21. Collins K. Physiological assembly and activity of human telomerase complexes. Mechanisms of Ageing and Development. 2008;1291:91-98.