1961年,Jacob和 Monod提出mRNA的概念后,各种各样调控RNAs分子的研究成为科研达人的新宠[1]。其中,lncRNA是一类不具有编码能力,可以协调遗传调控的类mRNA分子。目前,lncRNA的发现主要是通过以下三种途径(图1):
传统的遗传学手段(如Xist、H19、HOTAIR以及植物中的HID1等);
芯片方法(如乳腺癌、胰腺癌、肝癌等癌症相关的lncRNA等);
高通量RNA-seq方法鉴定(新的lncRNA等)。
图1 .lncRNA的发现途径
lncRNA除了长度以及编码能力特点外,还具有一其他特点:
1.组织特异性高,表达量相对低于mRNA;
2.部分lncRNA的3’端特殊化,不含有polyA尾巴(图2)[2]。(一般lncRNA测序选择去核糖体的方法,因为可以得到更全面的lncRNA);
图2.哺乳动物中lncRNA的多样化[2]
3.lncRNA定位多样化,细胞核、核质、胞浆等(图3)[3];屁股决定脑袋,位置决定功能,这个一定要看清楚哦。
图3.lncRNA定位[3]
lncRNA之所以大红大紫,是因为他有着强大而独特的功能,包括表观调控染色质沉默、转录调控、转录后调控影响剪切体的剪切或者竞争性结合miRNA影响靶基因的表达等(图4)[4]。
图4.lncRNA作用机制[4]
针对芯片或者RNA-seq测序得到的显著差异表达的lncRNA,后续需要一系列的实验验证。包括表达验证、功能验证以及关键的互作验证其作用机理(图5)。
图5.lncRNA的验证
A.利用qRT-PCR验证差异表达的时候一定要注意,并不是所有的PCR产物反应的都是你要研究的lncRNA。所以在设计引物的时候一定要遵循以下建议:
cDNA质量一定要高,保证没有基因组DNA的污染;
按lncRNA类型排序,优先选择lincRNA>intron lncRNA>exon lncRNA(无重叠);
按FPKM或reads count排序,优先选择表达量高的lncRNA;
按变化倍数排序,优先选择差异变化明显的lncRNA。
注:具体表达量或变化倍数,由整体测序深度和差异表达基因的数量决定。最好选择用于测序的cDNA去做PCR验证。退而求其次,用随机引物去反转cDNA,如果oligo(dT)反转,可能检测不到不含poly(A) 的lncRNA 。
B.Northern-blot既可以验证RNA的表达丰度又可以验证序列信息。但是呢,Northern Blot 比较繁琐,真的比较繁琐,而且精度不如qRT-PCR。
C.lncRNA全长获得
可以借助5’RACE和3’RACE试剂盒获得全长的lncRNA,对其结构做进一步分析。
D.lncRNA的定位
对于未知lncRNA,可以利用FISH(Fluorescence in Situ Hybridization )验证其亚细胞定位,一定要做,一定要做,一定要做,重要的事情说三遍,因为其亚细胞定位和调控功能有关,关系到后面缺失实验的成功。当然,也可以通过Northern Blot 粗略验证其是细胞核还是胞质定位,但是前提是可以分离到质量高的核RNA和胞质RNA。
利用RNA亚细胞定位数据RNALocate (http:// www.rnasociety.org/rnalocate)检索已知lncRNA的亚细胞定位。其实,该网站不仅提供lncRNA的定位信息,还包括其他RNA信息,包括csRNA、mRNA、miRNA、piRNA 、snRNA、rRNA、snoRNA和tRNA。当前版本的RNALocate更新至2016年6月,共建档了超过37700条具有实验证据RNA的亚细胞定位,涉及65个物种(主要包括人、小鼠、和酿酒酵母等),超过22000条RNA和42种亚细胞定位(主要包括细胞核、细胞质、内质网和核糖体等等)。可以分别通过Localization、Organism和RNA Category进行检索,大大方便后续实验研究(图6)[5]。
图6.数据库RNALocate
E.编码能力验证
生信分析过程中,虽然我们已经利用多种编码能力预测其编码能力,但是,但是有个万一呢?所以,如果实验室条件允许,大家还是可以利用试剂盒体外验证编码能力。革命需要流血,大paper 是需要多重验证的,这个你懂得。
做实验最重要的是功能验证,只有这样才能得到老板的赏识,当然最重要的是,可以发高分文章毕业啊。所以,还是一步一步锁定目标,做做功能验证,看看此lncRNA是什么鸟,能否助我毕业一臂之力。
A.功能获得
构建lncRNA过表达载体,观察过表达lncRNA后对细胞增殖、凋亡、侵袭或者植物开花、果实成熟以及生长素响应等的影响,验证lncRNA靶基因的表达丰度。
注意!注意!不要一提到过表达就想到35S,其实,组织特异表达的lncRNA的过表达验证需要考虑组织特异的启动子,这样更有针对性。
B.功能缺失
研究lncRNA功能缺失的时候,首先,一定要根据其亚细胞定位选择合适的缺失方法。常见的功能缺失方法是借用siRNA或者shRNA,感染细胞,但是很多时候我们发现细胞的感染效率很高,但是lncRNA的干扰效率却很低。其实,RNA干扰作用发生在胞浆内,如果要研究的lncRNA定位在细胞核中,那siRNA或者shRNA真是鞭长莫及啊。如果lncRNA定位在细胞核中,那我们就用大招。可以选择RNAi、 CRISPR/Cas9 、反义寡核苷酸、位点反转、启动子缺失等方法干扰(图7),但是,最合适的方法还是需要自己摸索,自己多尝试[6]。
图7.lncRNA功能缺失方法
lncRNA可谓是“文武双全”,可以和RNA、DNA、蛋白等结合发挥作用。对于lncRNA 功能的研究,我们可以通过研究和其互作的分子来推测进而进行机理研究。利用已知蛋白的抗体去捕获RNA分子或者是利用标记的已知RNA分子的互补核苷酸去捕获与其互作的蛋白。
A.RIP(蛋白已知,RNA未知)
RIP(RNA immunoprecipitation)又称为RNA结合蛋白免疫沉淀技术,可以说是RNA界的ChIP(染色质免疫沉淀),该技术能帮助人们分析与RNA结合蛋白相关的核酸。利用与RNA结合的蛋白的抗体,从细胞提取物中捕获与蛋白相结合的RNA,再通过qPCR、芯片或二代测序技术对这些lncRNA进行鉴定(图8)。
RIP以外,CLIP(UV crosslinking and immuno-precipitation)和iCLIP (individual-nucleotide resolution CLIP)也可以帮助人们捕捉与RNA结合蛋白互作的RNA分子。
图8.RIP实验流程
B.RNA-Protein pull down(RNA已知)
RNA-Protein Pull-Down 实验是利用已知的RNA分子去捕获已知的或者未知的结合的蛋白分子。基本步骤包括:目标(已知)RNA生物素标记,磁珠富集,RNA结合蛋白的孵育,RNA 结合蛋白的洗脱,WB(已知蛋白验证)或者MS(未知蛋白检测)(图9)。
图9.RNA-Protein pull-down实验流程
C.EMSA
RNA EMSA是通过凝胶电泳迁移检测蛋白-RNA互作的一种技术,和DNA水平的EMSA相似。首先,标记的RNA探针和蛋白孵育,当蛋白-RNA复合体形成后,利用非变性聚丙烯酰胺凝胶分离。相对于游离的RNA分子来说,蛋白-RNA复合物的迁移速率慢。特异性的结合可以通过多于的未标记的探针的竞争结合证明。一般情况下,结合位点的突变或者是无结合能力的RNA探针是无法竞争特异性的结合的(图10)。
图10.EMSA实验流程
参考文献
[1].Jacob F, Monod J. Genetic regulatory mechanisms in the synthesis of proteins[J]. Journal of molecular biology, 1961, 3(3): 318-356.
[2].Chen L L. Linking Long Noncoding RNA Localization and Function[J]. Trends in Biochemical Sciences, 2016, 41(9): 761-772.
[3].Quinn J J, Chang H Y. Unique features of long non-coding RNA biogenesis and function[J]. Nature Reviews Genetics, 2016, 17(1): 47-62.
[4].Mercer T R, Dinger M E, Mattick J S. Long non-coding RNAs: insights into functions[J]. Nature Reviews Genetics, 2009, 10(3): 155-159.
[5].Zhang T, Tan P, Wang L, et al. RNALocate: a resource for RNA subcellular localizations[J]. Nucleic Acids Research, 2016: gkw728.
[6].Bassett A R, Akhtar A, Barlow D P, et al. Considerations when investigating lncRNA function in vivo[J]. Elife, 2014, 3: e03058.
摘自美吉生物