Cas9 protein variant VQR recognizes NGAC protospacer adjacent motif in rice
Gaowei Xin1,2, Xixun Hu2, Kejian Wang

Gaowei Xin, Xixun Hu, Kejian Wang, Xingchun Wang.
基因组编辑技术是一种在基因组水平上对目标基因序列进行碱基删除、插入或替换的操作技术。该技术的原理是利用人工构建序列特异性核酸酶(sequence-specific nucleases, SSNs)在特定的基因组位置切断DNA,切断的DNA在细胞内DNA修复系统修复过程中产生突变,从而实现定点改造基因组的目的[1]。目前,常用的SSNs主要包括锌指核酸酶(zinc-finger nucleases, ZFNs)技术[2]、类转录激活因子效应物核酸酶(Transcription activator-like effector nucleases, TALENs)技术[3]和成簇的规律间隔的短回文重复序列/相关蛋白(clustered regularly interspaced short palindromic repeats/CRISPR-associated 9, CRISPR/ Cas9)技术[4]。与ZFN和TALEN技术相比,CRISPR/ Cas9技术具有载体构建简单、基因编辑效率高、成本低等特点[5,6],目前被广泛应用于基因功能研究和动植物精准分子育种等领域[7,8,9,10,11]。
2013年,在细菌天然免疫系统中发现的CRISPR/ Cas9系统作为第三代基因组编辑技术迅猛发展起 来[12,13]。该基因编辑系统通过单链向导RNA (single guide RNA, sgRNA)与基因组上的靶位点进行碱基互补配对完成识别过程,进而与核酸酶Cas9形成的sgRNA-Cas9复合体在特定靶位点造成DNA双链断裂,并借助于生物体内的同源或非同源重组修复途径完成基因组编辑。其中,靶位点的选择需符合不同系统的PAM要求[14]。目前,广泛使用的酿脓链球菌(Streptococcus pyogenes) SpCas9在植物中所识别的PAM主要是NGG[4],极大地限制了SpCas9的基因组编辑范围。为了扩展CRISPR/Cas9在基因组中的编辑范围,人们从不同微生物中鉴定了识别不同PAM的同源蛋白,比如嗜热性链球菌(Streptococcus thermophiles) CRISPR3 Cas9识别NGGNG PAM[15],嗜热性链球菌(Streptococcus thermophiles) CRISPR1 Cas9识别NNAGAAW PAM[16],脑膜炎奈瑟菌(Neisseria meningitides) NmeCas9识别NNNNGATT PAM[17]。此外,通过改造SpCas9的方法也可以改变其识别的靶位点。SpCas9变体VQR (D1135V/R1335Q/T1337R)和VRER (D1135V/G1218R/R1335E/T1337R)分别可以识别NGA PAM和NGCG PAM[18];而变体xCas9可以识别NG、GAA和GAT 3种PAM[19]。类似地,本课题组对VQR和VRER变体在水稻中的研究表明,VQR和VRER在水稻中也分别识别NGA PAM和NGCG PAM[20]。生物信息学分析表明,水稻基因组中VQR、VRER和SpCas9可编辑位点数目分别为45176043、7972298和38923028[20]。在水稻中VQR的基因编辑范围大于VRER和SpCas9,其中NGAG、NGAC、NGAT和NGAA 4种类型PAM靶位点的个数分别为9784476、9784158、12807613和12799796,NGAC所占比例为22%[20]。然而,VQR变体能够高效识别NGAA、NGAT和NGAG 3种PAM,NGAC是否能够被编辑仍然未知[20,21]。
虽然VQR变体大大扩展了CRISPR/Cas9的应用范围,但其编辑效率低于原CRISPR/Cas9系统,这极大地限制了该系统在水稻中的推广应用[20]。在哺乳动物细胞中,将sgRNA中连续4个胸腺嘧啶(T)中的一个碱基T突变为胞嘧啶(C),同时将sgRNA双链特异性延长5 bp可以提高CRISPR/Cas9系统的基因编辑效率[22]。最近,本课题组通过优化sgRNA的结构以及使用水稻内源性强启动子来驱动VQR变体的表达,成功地将CRISPR/Cas9-VQR系统的编辑效率提高到了原有系统的3~7倍[21]。
为了验证改进后的VQR变体是否可以高效编辑NGAC靶位点,本文在水稻中使用改进后的CRISPR/VQR系统,即改造后的sgRNA和Actin1启动子表达VQR来编辑PAM为NGAC的两个靶位点。在获得的57株转基因水稻中,两个靶位点附近分别有27株和44株发生移码突变。进一步分析表明,改进后的VQR系统编辑效率显著高于未改进的VQR系统。这表明改进后的VQR系统可以高效识别NGAC PAM,为今后利用改进后的VQR变体编辑NGAC靶位点提供了理论依据。
1 材料和方法
1.1 材料
水稻品种为日本晴(Oryza sativa L. ssp. japonica),所有材料均种植于浙江省杭州市富阳区中国水稻研究所实验基地,正季常规水肥管理。载体分别为SK-gRNA、pC1300-ACT1-Cas9和pC1300-ACT1-VQR,载体详细信息参见文献[21]。
1.2 基因编辑载体的构建
在正向靶序列5′端加上GGCA,合成引物g++;在反向互补靶序列的5′端加上AAAC,合成引物g--。g++和g--等量混合,100℃ 5 min,室温复性成双链DNA,并与AarⅠ (Thermo Scientific,美国)线性化的SK-gRNA载体进行连接。靶标位点序列及其所对应的引物g++和g--序列详见表1。Table 1
表1 靶位点及构建基因编辑载体的引物
Table 1
靶位点 | 靶位点序列(5′→3′) | 引物名称 | 引物序列(5′→3′) |
基因编辑的构建采用同尾酶连接策略:首先将5个靶位点NAL1-Q1、NAL1-Q2、LPA1-Q、GL1-C和NAL1-C序列分别组装至中间载体SK-gRNA,所得载体分别命名为SK-gRNA-NAL1-Q1、SK-gRNA- NAL1-Q2、SK-gRNA-LPA1-Q、SK-gRNA-GL1-C和SK-gRNA-NAL1-C。然后将SK-gRNA-NA L1-Q1 (KpnⅠ/SalⅠ)、SK-gRNA-NAL1-Q2 (XhoⅠ/BglⅡ)和SK-gRNA-LPA1-Q (BamHⅠ/NheⅠ)同时组装至pC1300-ACT-VQR (KpnⅠ/XbaⅠ);将SK-gRNA-GL1C (KpnⅠ/SalⅠ)和SK-gRNA-NAL1C (XhoⅠ/NheⅠ)同时组装至pC1300-ACT-VQR (KpnⅠ/XbaⅠ);将SK- gRNA-GL1C (KpnⅠ/SalⅠ)和SK-gRNA-NAL1C(XhoⅠ/NheⅠ)同时组装至pC1300-ACT-Cas9 (KpnⅠ/ XbaⅠ)。
1.3 农杆菌介导的水稻遗传转化
水稻遗传转化采用Hiei等[23]农杆菌介导法进行,所用的农杆菌菌株为EHA105。1.4 靶位点片段的扩增和测序
采用十六烷基三甲基溴化铵(hexadecyl trimethyl ammonium bromide, CTAB)方法提取水稻愈伤组织及植株基因组DNA。利用KOD FX Polymerase (TOYOBO, 日本)扩增靶标位点片段,引物序列详见表2。PCR产物通过Sanger测序,峰图使用DSD (degenerate sequence decoding)方法进行解读[24]。Table 2
表2 靶位点片段扩增所用引物
Table 2
引物名称 | 引物序列(5′→3′) |
2 结果与分析
2.1 改进的CRISPR/VQR系统可以高效编辑NAL1和LPA1基因
前期研究发现,在NAL1和LPA1(LOOSE PLANT ARCHITECTURE 1)基因外显子上存在3个相对低效的VQR靶位点NAL1-Q1、NAL1-Q2和LPA1-Q,其PAM分别为NGAA、NGAT、NGAG[20]。在未改进的VQR系统下,这3个位点的基因编辑效率分别为0%、13.30%和2.10%[20]。为了进一步研究改进后VQR系统的编辑效率,本研究构建了同时靶向这3个位点的基因编辑载体(图1A),并利用农杆菌介导法将其转入水稻,获得41株转基因水稻。图1

A:NAL1-Q1、NAL1-Q2和LPA1-Q靶位点基因编辑载体示意图。g1、g2和g3分别表示gRNA-NAL1-Q1、gRNA-NAL1-Q2和gRNA-LPA1-Q,ACT1 pro表示Actin1启动子,CaMV T表示CaMV终止子。B:NAL1-Q1、NAL1-Q2和LPA1-Q位点基因编辑效率。C:#25转基因植株靶位点NAL1-Q1的测序结果。红色短线表示碱基缺失,下划线的序列为PAM。
Fig. 1Gene editing of NAL1-Q1, NAL1-Q2 and LPA1-Q
经Sanger测序检测,NAL1-Q1、NAL1-Q2和LPA1-Q靶位点的基因突变率分别为9.75%、43.90%和29.26% (图1B),表明改进后的VQR系统可以大幅提高这3个位点的编辑效率。值得一提的是,在原系统无法编辑的NAL1-Q1位点上,改进后的VQR系统也造成了一定水平的突变(图1C)。
2.2 改进的CRISPR/VQR系统高效识别NGAC PAM序列
在水稻中,NAL1通过影响细胞分裂调控叶片宽度,该基因的突变导致叶片变窄[25];GL1是蜡质合成中的一个基因,GL1突变破坏叶表皮蜡质形成叶片高度亲水表型[26]。为了进一步研究改进后的CRISPR/VQR系统能否对NGAC PAM靶位点进行识别和编辑,本研究选择水稻中GL1和NAL1基因的靶位点GL1-C和NAL1-C进行基因编辑(图 2A)。利用同尾酶连接策略,构建了GL1-C和NAL1-C共敲除载体(图 2B),然后通过农杆菌转染法将其转入水稻中,最终获得57株转基因水稻。靶位点PCR扩增及测序结果显示,NAL1-C和GL1-C靶位点的基因突变植株分别为27株和44株,突变率分别为47.36%和77.19%;NAL1-C和GL1-C靶位点的双基因突变植株为26株,突变率为45.61% (图2C)。此外,也检测出基因功能缺失型突变体(双等位突变及纯合突变)。为了验证改进VQR系统的编辑效果,本研究进一步分析了基因编辑水稻的表型。如图2D所示,野生型水稻叶片较宽,疏水性较强,水滴呈球形;而双基因纯合突变叶片较窄,亲水性较强,水滴扩散开。这些结果表明在改进后的系统中,VQR可以高效地识别NGAC PAM序列。图2

A:GL1和NAL1基因编辑靶位点示意图。下划线序列表示PAM。B:GL1-C和NAL1-C靶位点基因编辑载体示意图。g4和g5分别表示gRNA-GL1-C和gRNA-NAL1-C,ACT1 pro表示Actin1启动子,CaMV T表示CaMV终止子。C:NAL1-C靶位点和GL1-C靶位点及NAL1-C/GL1-C双靶位点的基因编辑效率。D:GL1和NAL1基因共敲除水稻叶片。上面为野生型,下面为基因编辑的突变体,标尺为1 cm。
Fig. 2Gene editing of GL1-C and NAL1-C
2.3 突变类型分析
本研究进一步对CRISPR/VQR系统造成的突变进行分类,发现共有4种突变类型,分别为杂合突变、双等位突变、嵌合体突变和纯合突变。其中,以杂合突变和双等位突变为主,其次是嵌合体突变和纯合突变(表3)。双等位突变多数情况意味着基因功能丧失,而转基因T1代则能产生一半的纯合突变体,在研究中具备重要的价值。Table 3
表3 靶位点突变类型
Table 3
靶位点 | 突变率(%) | 杂合突变 | 双等位突变 | 嵌合体 | 纯合突变 | ||||
植株数 | 所占比例(%) | 植株数 | 所占比例(%) | 植株数 | 所占比例(%) | 植株数 | 所占比例(%) | ||
NAL1-Q1 | 9.75 | 3 | 75.00 | 0 | 0 | 1 | 25.00 | 0 | 0 |
NAL1-Q2 | 43.90 | 15 | 83.33 | 3 | 16.66 | 0 | 0 | 0 | 0 |
LPA1-Q | 29.26 | 6 | 50.00 | 5 | 41.66 | 1 | 8.33 | 0 | 0 |
NAL1-C | 47.36 | 19 | 70.37 | 6 | 22.22 | 1 | 3.70 | 1 | 3.70 |
GL1-C | 77.19 | 19 | 43.18 | 12 | 27.27 | 11 | 25.00 | 2 | 4.54 |
2.4 SpCas9低效识别NGAC PAM
前人研究表明SpCas9可以切割NGA PAM类型的靶位点[18],但切割效率尚不清楚。为此,本研究检测了SpCas9对NAL1-C和GL1-C靶位点的切割能力。结果表明,NAL1-C和GL1-C靶位点在SpCas9切割下,转基因愈伤组织的基因突变率分别为10.42%和12.50% (表4)。与转基因植株测序结果相比,通常愈伤组织中敲除效率要略高一些。然而,SpCas9在NAL1-C和GL1-C位点的表现却远逊于VQR在转基因苗中的结果(图2C),这表明VQR对NGAC PAM的编辑能力要高于SpCas9。Table 4
表4 SpCas9对NAL1-C和GL1-C靶位点的编辑效率
Table 4
靶点名称 | 检测愈伤组织总数 | 突变愈伤组织个数 | 突变率(%) |
NAL1-C | 48 | 5 | 10.42 |
GL1-C | 48 | 6 | 12.50 |
3 讨 论
目前,广泛应用的CRISPR/Cas9基因编辑系统仅能识别NGG PAM,极大地限制了其靶位点的选择范围。SpCas9的变体VQR能够高效识别NGAA、NGAT和NGAG3种PAM,对于CRISPR/Cas9系统是一个强大补充。本研究表明,在水稻中利用改进后的CRISPR/VQR也可以高效编辑NGAC PAM,并产生丰富的突变类型,从而为水稻NGAC PAM位点的编辑提供了理论依据。在人类细胞中,基于增强型绿色荧光蛋白(enhanced green fluorescent protein, EGFP)报告基因破坏实验的结果表明,VQR对包含NGAN PAM位点的切割效率为:NGAG>NGAT=NGAA>NGAC,这表明VQR对包含NGAC PAM的位点有切割能力[18]。在水稻中,由于NGAC的位点尚未被验证,22%的NGA位点是否能够被VQR编辑仍然不清楚[20,21]。在原始的CRISPR/VQR系统中,VQR无法切割NGAC PAM位点[20]。在改进的CRISPR/VQR系统中,sgRNA特异性延长5 bp,增强了sgRNA的稳定性;将多聚胸腺嘧啶(poly T)的第4个碱基T突变为C,消除了转录终止信号,从而使sgRNA转录水平得到提高;强内源启动子表达VQR使其蛋白表达水平得到提高,因此基因编辑效率得到显著提高[22]。本研究利用改进后的CRISPR/VQR系统也高效地编辑了水稻中NAL1-Q1、NAL1-Q2和LPA1-Q等3个位点(图1),而原始CRISPR/VQR系统对这3个位点的编辑效率极低甚至无法编辑。在此基础上,本研究进一步验证了改进后的CRISPR/VQR系统对NGAC PAM识别和编辑的情况。结果表明,改进后的CRISPR/VQR系统可以高效识别并编辑NAL1和GL1基因的NGAC PAM (图2),从而为水稻中含有NGAC PAM位点基因的编辑提供了理论依据。此外,我们推测原始的CRISPR/VQR系统也应该能够识别NGAC PAM位点,但由于编辑效率极低,在转基因株系较少的情况可能无法获得基因编辑植株。对于相同靶位点NAL1-C和GL1-C,SpCas9的基因编辑效率远低于VQR (图2,表4),因此VQR在实际应用中仍具有不可被SpCas9替代的优势。从突变类型来看,VQR主要产生杂合突变和双等位突变(表3)。其中双等位突变与纯合体一样,同为基因功能缺失型突变,并且其自交一代理论上可以产生出约1/2的纯合体,在育种或基因研究方面均具备巨大应用价值。
CRISPR/Cas9基因编辑系统的脱靶问题会引起基因组非靶向位点的突变,导致研究结果的不确定性。本课题组前期的研究表明,在利用改进后的CRISPR/VQR编辑NGAG和NGAT PAM位点时也存在一定的脱靶效率[21]。由于脱靶效率主要与错配碱基距离PAM位点的远近关,因此在利用改进后的CRISPR/VQR系统编辑NGAC位点时也存在类似的脱靶问题。
综上所述,本文利用改进的CRISPR/VQR基因编辑系统成功地编辑了水稻NGAC PAM序列,并产生丰富的突变型,为水稻及其他植物含有NGAC PAM基因的编辑提供了借鉴。
