摘要
RNA指导的核酸内切酶cas9使得基因组编辑成为一种广泛应用的技术。和cas9类似, 属于Argonaute蛋白家族的核酸内切酶同样利用寡聚核苷酸作为来降解无用的基因组。本文报道的Natronobacterium gregoryi Argonaute (NgAgo)是一种DNA指导的核酸内切酶,非常适用于人的基因组剪切。NgAgo可以结合5’端磷酸化的大约长24nt的单链DNA(gDNA),有效的切断双链DNA的特异位点断裂。NgAgo–gDNA系统不需要PAM序列,这一点和cas9不同。初步数据表明NgAgo对guide–target错配的容忍度低,而且对于基因组中GC含量高的区域有较高的剪切效率。
引言
Cas9结合方式:DNA-RNA杂交。缺点:错误率高,RNA二级结构不易形成。NgAgo–gDNA:NgAgo+一小段5‘端磷酸化的核酸序列。两个系统的共同点:1.抑制基因表达;2.清除外来整合的基因组序列。两个系统的不同点:1.Cas9只存在原核生物,NgAgo在所有生物中都是保守的,尽管大多数的NgAgo都是和单链RNA结合,对RNA可变剪切有重要作用,但是有部分NgAgo也可以和单链DNA结合,切断靶位点;2.Cas9的指导RNA需要含有RNA-RNA杂合结构矫正Cas9的结果,但是NgAgo并不需要特定的RNA杂合结构的指导;3.Cas9只能切断PAM上游的target,NgAgo对靶序列无特异要求。本研究介绍一种从N. gregoryi中得到的NgAgo,它可以和单链DNA结合,尤其对于哺乳动物基因组,是一个准确、高效的编辑工具。
工具:PSI-BLAST、NCBI、TtAgo and PfAgo
结果:NgAgo, protein identifier AFZ73749.1
验证过程:
1 NgAgo利用DNA作为指导并剪切DNA
NgAgo是和ssDNA结合orssRNA?验证结果:ssDNA 见Fig1a。
确定E.coli中表达的NgAgo可以在37度发生原位剪切,质粒切割实验。我设计了3个ssDNA guide,其中FW和FV反向互补,与质粒 pACYCDuet-eGFP靶位点对应,和 NgAgo-encoding plasmid pGEX6P-1 没有同源序列(Figure1 b)。另一个guide为随机序列和pACYCDuet-eGFP没有overlap(NC)。还设计了一对RNA guide。55度孵化1h使NgAgo和guide结合。NgAgo不能催化剪切在没有guide存在或者guide NC存在的情况下。当FW和FV中任何一个guide存在时,质粒呈现OC状态。当FW和FV同时存在时,质粒呈线性状态(LIN)。但是如果ssDNA guide没有5’端磷酸化或者 5’端磷酸化ssRNA guide都不能催化质粒的剪切反应(Figure1c)。
Figure 1 NgAgo uses 5′ phosphorylated ssDNA guides and cleaves DNA targets in vitro. (a) Electrophoresis of GST-NgAgo expressed in E. coli, purified by Sephrose-4B, digested by protein kinase K, and treated with the indicated exonucleases. M, Single Strand molecular weight marker (nt). (b) Schematic of the target plasmid (top left) and sequences of the 5′-phosphorylated ssDNA guides (top right). In vitro plasmid cleavage assay, performed by reloading NgAgo expressed in E. coli with the indicated guide ssDNAs at 55 °C for 1 h, followed by incubation with the target plasmid at 37 °C for 12 h, and analysis of the target plasmid by electrophoresis (bottom). M1: super-coiled, open circular and linearized pACYCDuet-eGFP plasmids. SC, supercoiled; Lin, linearized; OC, open circular; M2, double strands molecular weight marker D2000 (GenStar Co. Ltd) (bp). (c) Plasmid cleavage assay performed by using the indicated nucleic acids with or without 5′ phosphorylation. Results are representative of three independent experiments. Full-length gels are presented in Supplementary Figure 9.
2 NgAgo可以和ssDNA guide结合,使靶位点双链DNA断裂
为了验证NgAgo是否可以用作基因组编辑,在 293T cells 中表达NgAgo,并检测NgAgo和人细胞内源性核酸序列是否相关。在 293T 细胞中并没有检测到和NgAgo相关联的内源性序列,这表明人细胞中只有极少的5’端磷酸化的ssDNA,这也说明 NgAgo脱靶的概率很低。之后用含有NgAgo-encoding 质粒和24-nt ssDNA 或者 ssRNAs 的质粒感染293T细胞。NgAgo只能和5’端磷酸化的 ssDNA 结合(Fig.2a)。
如果在转染NgAgo-encoding 质粒后24h再转染24-nt ssDNA 或者 ssRNAs ,NgAgo-ssDNA 的结合效率就会大大降低(Fig2b)。这表明ssDNA的加载只能在NgAgo表达后很短的时间窗口内完成。同样的,在37度条件下,ssDNA 在长达8小时的时间内没有和NgAgo发生结合。然而在55度,一个非生理适应的高温条件下,ssDNA可以和NgAgo结合(Fig2c)。同时,在含有NgAgo和NC guide 的细胞中,加入 FW guide,催化剪切反应也不会发生(Fig2d)。以上结果这表明 FW guide忠于其原始guide,并且是DNA在37度保持稳定。这一特征和 哺乳动物的Ago2类似。这一特性极大的减少了一些不可知的guide对剪切反应的干扰。
Figure 2 NgAgo binds ssDNA guide in a oneguide-faithful manner. (a) Electrophoresis of nucleic acids bound to NgAgo that had been expressed in 293T cells and extracted after 48 h growth with or without the indicated 24-nt nucleic acids. M1, ssDNA ladder; M2, ssDNA guide. (b) Electrophoresis of nucleic acids bound to NgAgo that had been expressed in 293T cells with transfection of a 5′ phosphorylated ssDNA guide (FW) with delays as indicated, and extracted 48 h after initial transfection of NgAgo-encoding plasmid. (c) Electrophoresis of nucleic acids bound to NgAgo that had been expressed in 293T cells, extracted after 48 h, and incubated with a 5′ phosphorylated ssDNA guide at 55 °C for 1 h or at 37 °C for 8 h. (d) Schematic of the one-guide-faithful rule abided by NgAgo. Results are representatives of at least three independent experiments. Full-length gels are presented in Supplementary Figure 9.
为了验证哺乳动物细胞中,NgAgo-gDNA系统的效率,进行了原位剪切试验。向Hela细胞中转染了pEGFP-N1 plasmid 和 NgAgo-encoding plasmid 以及ssDNA guides。其中ssDNA guides对应于 CMV promoter 或者eGFP reading frame。通过检测 eGFP的表达量来作为衡量NgAgo的效率的指标(Fig3c)。为了比较NgAgo系统和 Cas9-sgRNA,将含有 pEGFP-N1 target plasmid和Cas9-encoding plasmid以及sgRNA的质粒感染细胞。研究发现当利用等量的Cas9-encoding质粒和NgAgo-encoding质粒时,观察到NgAgo-gDNA系统在抑制eGFP表达量的效率方面和Cas9-sgRNA系统是一样的(Fig3c)。研究结果显示,NgAgo的最适切割长度为24nt(Fig3d)。
为了确定NgAgo的剪切位点,研究合成线性质粒后测序。NgAgo不是简单的切断单个磷酸二酯键,而是去掉了target区域的几个核酸。这一发现和TtAgo反应一致。为了验证去掉几个核酸是由于NgAgo的外切酶活性造成的,将反应延长到72h,尽管反应在8h就已经完成了,并且观察到target在72h后没有发生降解(Fig3a)。对剪切产物进行测序后发现,NgAgo会随机切除target区域内1-20nt的核酸。而且NgAgo不会剪切线性质粒或者ssDNA。以上结果表明NgAgo不是核酸外切酶。
Figure 3 NgAgo works as an endonuclease and can cleave DNA targets in vivo. (a) Electrophoresis of target pACYCDuet-eGFP plasmid after it was incubated with purified NgAgo, pre-loaded with FW guide in 293T cells for 4 h, 8 h or 72 h. Representative results from three independent experiments. (b) Examples of sequencing results from the plasmid cleavage products of NgAgo after 72-h incubation, which shows that 1−20 nucleotides within the guide/target region were randomly removed. Representative sequencing results from 20 independent experiments. (c) Schematic (top) shows the positions of ssDNA guides for NgAgo and sgRNA for Cas9 on the target plasmid pEGFP-N1. Western blot analysis (below) of eGFP expression in HeLa cells transfected with pEGFP-N1 target plasmid together with either the NgAgo-expressing plasmid and the indicated ssDNA guides, or Cas9-expressing plasmid and the indicated sgRNA transcription vectors. Densitometric ratios between eGFP and actin bands are shown below the blot. Representative of three independent experiments. (d) Western blot analysis of eGFP expression in HeLa cells transfected with pEGFP-N1 target plasmid, NgAgo-encoding plasmid and the G3 guide of various lengths (n). Blot is representative of three independent experiments. Full-length gels and blots are presented in Supplementary Figure 9.
3 广泛的靶位点和低容错率
检测NgAgo编辑人类基因组内源性位点的能力。对NgAgo进行改造,在其N端附加一段核定位信号,以保证NgAgo的核兼容性。根据DYRK1A的第11个外显子设计了5个gDNA(Fig4a)。使用T7核算内切酶来检测内源性剪切。通过测序,发现所有的guide指导下的NgAgo都可以进行高效率的靶位点剪切。同时验证了针对与8个基因的47个guide,所有guide指导下的基因组剪切效率都是非常可观的(21.3%-41.3%,Fig4b),同时观察到NgAgo对于靶位点没有明显的偏好性。NgAgo在各种哺乳动物细胞系中,包括乳腺癌细胞系(MCF-7)、骨髓瘤细胞系(K562)以及人上皮细胞系(Hela),可以有效的切断DYRK1A双链DNA(Fig4c)。
研究gDNA和靶序列碱基错配对于NgAgo活性的影响。研究设计了一个以DYRK1A为靶序列的24nt guide,并在每一个位置引入错误(Fig4d)。对于guide上每一个位置引入单碱基错误,NgAgo都非常敏感(剪切效率降低了73%-100%),并在P8-P11,剪切效率下降最多(85%-100%)。如果在3个连续碱基处引入错误将会彻底阻碍剪切反应。同时研究了在guide长度改变后,NgAgo是否还对单碱基错误敏感。当guide长度变为21nt时,仍然可以观察到单碱基错配会极大的影响NgAgo的活性,而且尽管guide的长度改变了,P8-P1仍然是NgAgo的关键敏感位置。由于Cas9-sgRNA系统可以最多容许5个错配,尽管以上的结果只是初步数据,仍然能够说明NgAgo-gDNA系统的高保真性。由于P8位置的错配可以完全的破坏剪切,可以推测P8位置处的磷酯键可能是NgAgo启动其内切酶活性的位置。
由于DYRK1A基因被广泛的用于cas9-sgRNA研究,文章利用该基因来比较NgAgo-gDNA和Cas9-sgRNA在哺乳动物细胞中的剪切效率。NgAgo-gDNA和Cas9-sgRNA表现出相同的剪切效率(Fig.4e, 31.97% NgAgo vs. 32.2% Cas9)。然后,文章研究了NgAgo系统是否在GC含量较高的区域的表现优于Cas9,由于RNA易于在GC含量较高的区域形成二级结构,进而影响Cas9和sgRNA的结合。事实是,Cas9-sgRNA系统在HBA2基因和GATA4基因的GC含量高的区域的剪切效率远远低于NgAgo-gDNA(Fig4f)。因此,相比cas9-sgRNA系统,NgAgo-gDNA系统有潜力应用于更广泛的基因组靶位点剪切。而且Cas9要求靶位点位于PAM的上游,根据文章的研究和相关文献报道,NgAgo对靶位点序列无特殊要求。
Figure 4 NgAgo can make targeted double-strand breaks in mammalian genome. (a) Schematic of the guides corresponding to the loci of the exon 11 of human DYRK1A gene (top). T7E1 assay (middle) for NgAgo-mediated insertion-deletions (indels). Arrows show the anticipated positions of T7E1 products. The control is normal 293T cell genomic DNA. Example chromatogram showing microdeletion as well as representative sequences of mutated alleles identified from clonal amplicons by using G10 guide (bottom). WT, wild type; D, deletions; M, mutations; +, insertions. (b,c) T7E1 assays of NgAgo-mediated indels at the indicated targets in human genome (b) and at the DYRK1A gene in the indicated cell lines (c). (d) T7E1 assay of G10 guide with indicated nucleotide mismatches (marked in red). (e,f) Comparison of the efficiency between NgAgo-gDNA system and Cas9-sgRNA system in cleaving the human DYRK1A gene (e), and the (G+C)-rich sequences at HBA2 and GATA4 genes (f). The controls were normal 293T cell genomic DNA. Data in b−f are representative of three independent experiments. Full-length gels are presented in Supplementary Figure 9.
4 借助NgAgo可以准确的将DNA片段插入基因组
到此,文章已经验证了NgAgo可以在哺乳动物基因组中锚定靶位点并催化剪切。接下来,文章继续验证NgAgo是否可以用于基因组编辑。 HDR是细胞内一种修复DNA双链损伤的机制。只有当细胞核内存在与损伤DNA同源的DNA片段时,HDR才能发生。作者设计了一个donorDNA片段,包括一个reporter和G418抗性基因(fig5a)。reporter由两个阅读框组成:一个编码mRFP,另一个编码eGFP,但是中部由一个终止密码子分开成两部分。reporter中不含有promoter,所以除非将它插入到一个基因中,否则它不会表达。文章以DYRK1A基因的最后一个外显子为靶位点。在用含有编码NgAgo质粒、guide和donor转染293T细胞后,筛选选表达mRFP的细胞。通过PCR和后续测序,研究确认donor被准确的插入到期望位置(Fig5d)。在G418筛选后,分离到了含有donor的细胞。之后文章以终止密码子为靶位点,在G418阳性细胞中,利用NgAgo-gDNA系统通过NHEJ (Imprecise genome repair mediated by nonhomologous end joining) 使终止密码子发生突变,最终使得mRFP-eGFP嵌合体得以表达(Fig5c)。通过流式细胞仪分析,检测到11.7%的细胞是eGFP阳性,这表明NgAgo-gDNA在哺乳动物基因组编辑上的高效性(Fig5d)。当向293T细胞中引入等量的cas9和NgAgo后,southern blot的结果表明,cas9没有将donorDNA的插入到靶位点。
Figure 5 NgAgo can be used to edit mammalian genome. (a) Schematic of the HDR-mediated donor DNA insertion edited by NgAgo-gDNA. The donor is composed of a reporter region and a G418 resistance gene. The latter is directed by a CMV promoter. The reporter is composed of a mRFP gene and an eGFP gene which is separated by a TGA terminator. Human genome and human genome homologous sequence in the donor are indicated in black. Black arrows indicate the positions of PCR primers used for sequencing. (b) HDR-mediated donor DNA insertion into the targeted genome locus, confirmed by Sanger sequencing of genomic PCR amplicon. (c) Schematic of NHEJ-mediated mutation of the terminator edited by NgAgo-gDNA. eGFP expression will be turned on afterward. (d) Flow cytometry analysis, showing the efficiency of turning on eGFP expression in the cells. Results in b and d are representative of three independent experiments.
讨论
argonautes是RNA引导的沉默复合体的主要成分。本文中作者报道了一种提取自N.gregoryi SP2的argonautes,这种argonautes是一种DNA引导的核酸内切酶,可以对哺乳动物细胞基因组进行剪切。NgAgo通过DNA-DNA杂合锚定靶位点并完成剪切。相比cas9,NgAgo在基因组编辑方面有潜在的优越性。NgAgo的长度是cas9的2/3(887aa vs 1,368aa)。
NgAgo只需要是一段长约24nt,5'端磷酸化的ssDNA。本研究检测了超过50个以10个基因为靶标的guide,在哺乳动物和古细菌中都没有观察到guide的偏好性。然而cas9需要sgRNA含有三个发夹结构,DNA结合还需要一段PAM序列。研究发现NgAgo和gDNA没有特异的共有序列不会增加脱靶的可能性,因为在哺乳动物细胞内5’端磷酸化的单链DNA非常少。NgAgo一个新的特性是不仅能够切断双链DNA还可以去掉靶标的几个碱基。这是一个进化上的优势,使得一些无用基因组无法修复。NgAgo用于基因组编辑有以下几个特征:1对于guide-targe容错率低。对于guide上任意位置上引入的单碱基错误都会极大的影响NgAgo的剪切效率。实验验证,三个位置上的错配会导致NgAgo完全失去剪切活性。2 5'端磷酸化的短单链DNA在哺乳动物细胞中含量非常低,使得细胞内寡聚核苷酸误导剪切的概率非常低。3 NgAgo遵守one-guide-faithful的原则,也就是说guide只有在NgAgo表达时才能被加载,而且在37度时,NgAgo一旦和某一个guide结合后就不能释放其first guide,再与其他空载的guide结合。所有以上特性保证NgAgo脱靶造成的影响最小化。最后,NgAgo比较容易设计合成和调节浓度。这对于cas9系统是很难做到的。如果sgRNA在质粒中表达,ssDNA guide的含量只需要是sgRNA质粒的1/10。
进一步的研究需要评价剪切的脱靶率以及如何修饰NgAgo的结构来提高基因组编辑的准确性和效率。
Reference:
Feng, G., Xiao, Z. S., Feng, J., Wu, Y., & Han, C. (2016). Dna-guided genome editing using the natronobacterium gregoryi argonaute. Nature Biotechnology.
欢迎关注生信人公众号!