CRISPR/Cas systems in genome engineering of bacteriophages
Caijiao Liang, Fanmei Meng, Yuncan Ai
编委: 张天宇
Caijiao Liang, Fanmei Meng, Yuncan Ai.
噬菌体(bacteriophage)是地球上独特的生物 体[1,2,3,4]。目前GenBank数据库中有2293条噬菌体基因组序列,但是大部分开放阅读框(open reading frame, ORF)功能未知[5]。受限于技术等因素,对噬菌体功能基因组学研究的速率滞后于噬菌体基因组测序速率。
CRISPR/Cas (clustered regularly interspaced short palindromic repeats/CRISPR-associated genes)系统主要存在于原核生物中[6],但是在霍乱弧菌(Vibrio cholerae)噬菌体中也发现了有活性的CRISPR/Cas系统[7]。根据cas位点构造及标签Cas蛋白类别特征,CRISPR/Cas系统被划分为Ⅰ~Ⅵ类和22种亚型[8,9]。本文涉及其中4种亚型,表1简单归纳了其相应的免疫机制。它们的免疫过程大致可以分为3步:(1) 适应:Cas1和Cas2等利用外来核酸(DNA或RNA)形成CRISPR阵列中的新间隔(spacer);(2) 表达:CRISPR阵列的转录产物pre-crRNA (precursor CRISPR RNA)在特定Cas蛋白及某些细胞因子加工下形成crRNAs (CRISPR RNAs)[10,11];(3) 干涉:crRNA与特定Cas蛋白组装形成的crRNP (CRISPR ribonucleoprotein)复合物,在外来核酸原间隔(protospacer)处切割并降解外来核酸。因此,基于CRISPR/Cas系统的基因组编辑技术主要是利用了该系统干涉过程中的两个特性:(1) crRNAs与原间隔的碱基互补配对定位靶标序列;(2) 特定Cas蛋白的核酸酶活性切割、降解外来核酸。
Table 1
表1 CRISPR/Cas系统中4种亚型的免疫机制
Table 1
类型 | 代表 | 适应 | pre-crRNA加工 | crRNP复合物 | 干涉 | 参考文献 |
Ⅰ-E | E. coli K12 Ⅰ-E | RecBCD和Cas1-2参与,由Cas1识别PAM (CTT) | Cas6特异加工 | Cascade: CasA1B2C6D1E1:61 nt crRNA1 (PDB: 4U7U) | Cse1 (CasA)识别PAM,Cas3切割dsDNA | [12~17] |
Ⅰ-F | P. aeruginosa UCBPP PA14 Ⅰ-F | Cas1-3与Csy1-4参与 | Cas6特异加工 | 缺乏研究 | Cas2/3切割dsDNA | [18~20] |
Ⅱ-A | S. pyogenes SF370 Ⅱ-A | tracrRNA-Cas9-Cas1- Cas2-Csn2参与,由Cas9识别PAM (NGG) | tracrRNA、RNaseⅢ和Cas9参与 | SpyCas9:RNA (tracrRNA:crRNA) (EMD-5859) | Cas9识别PAM,并切割dsDNA | [10, 21, 22] |
Ⅲ-A | S. epidermidis RP62a Ⅲ-A | 缺乏研究 | PNPase参与,Cas6特异加工 | 缺乏研究* | 非PAM依赖,Cas10切割dsDNA有义链,Csm3切割RNA | [11, 23~25] |
1 基于CRISPR/Cas系统的噬菌体基因组编辑
1.1 天然含CRISPR/Cas系统宿主细菌中噬菌体的基因组编辑
CRISPR/Cas系统存在于45%细菌和87%古生菌中[6],这意味着在应用CRISPR/Cas系统进行噬菌体基因组编辑时会存在一定便利:既无需额外设计、购买和构建由CRISPR/Cas系统衍生的基因编辑质粒,也无需担心质粒在宿主细菌中是否复制和表达及质粒对细胞的毒害作用等问题。1.1.1 基于Ⅱ-A类CRISPR/Cas系统的噬菌体基因组编辑
Martel和Moineau[27]在天然含Ⅱ-A类CRISPR/ Cas系统嗜热链球菌DGCC7710 (Streptococcus thermophilus DGCC7710)中开展了编辑2972烈性噬菌体基因组的研究(图1A)。编辑前,首先解析嗜热链球菌DGCC7710 CRISPR1位点及其原间隔邻近基序(protospacer adjacent motif, PAM) NNAGAAW[28];其次用2972噬菌体侵染DGCC7710,使CRISPR1位点获取系列新间隔从而得到系列噬菌体不敏感突变株;随后,开展两类噬菌体基因组编辑[27],简述如下:

A:采用Ⅱ-A类CRISPR/Cas系统编辑2972噬菌体基因组。从左到右模板质粒的作用:在原间隔PS91旁侧PAM处引入无义突变(GAA→TAA,红色三角形→黑色三角形)、使非必需基因orf33被删除306 bp长的DNA片段和使orf33被基因LlaDCHIA (紫色)替换。B:采用Ⅲ-A类CRISPR/Cas系统编辑Andhra噬菌体orf9。三角形标示处为编辑点(沉默突变:ATT→ATA,红色三角形→黑色三角形)。C:采用Ⅰ-E类CRISPR/Cas系统编辑T7噬菌体基因1.7。D:采用Ⅰ-E类CRISPR/Cas系统(位于霍乱弧菌E7946基因组上)编辑ICP1_2011_A噬菌体(本身含有Ⅰ-F类CRISPR/Cas系统)基因cas1。S:间隔;PS:原间隔;CR:CRISPR阵列;WT-T7:未发生重组的野生型(Wild type) T7噬菌体;T7Δ1.7:基因1.7被删除的T7噬菌体;csn2为Nmeni亚类cas;csm1-6为Mtube亚类cas;csy1-4为Ypest亚类cas;cse1-2为Ecoli亚类cas。Cas9:RNA、Cascade和Cas10-Csm见
Fig. 1CRISPR/Cas systems in bacteriophage genome editing
第一类:CRISPR/Cas系统对随机突变的选择作用。在Ⅱ-A类CRISPR/Cas系统中,crRNP复合物对外来核酸免疫的前提是:Cas9对PAM的特异性识别[22]以及crRNAs与原间隔之间的碱基互补配对。当外来核酸发生的随机突变为原间隔种子区(seed region)单个或两个碱基的突变、PAM关键碱基的特定突变、包含种子区或PAM在内的序列删除时,往往导致外来核酸对该免疫系统的逃脱[27,29,30]。由此,采用2972噬菌体感染系列噬菌体不敏感突变株,以1%~22%比例筛选系列逃逸CRISPR噬菌体随机突变株,其中随机突变包括同义突变、非同义突变、PAM中GAA到TAA的无义突变和orf33中306 bp长DNA片段的删除[27]。通过大量分析系列逃逸CRISPR噬菌体突变株的原间隔及其PAM碱基的变化情况,既可以确定原间隔的种子区,又可以确定PAM中对靶向噬菌体关键的碱基(AGAA)[27]。
第二类:CRISPR/Cas系统联合同源重组介导噬菌体基因组的点突变、移码突变、基因删除与替换。同源重组在噬菌体基因组编辑中的应用受限于缺乏选择压力,而CRISPR/Cas系统的定点切割作用恰使它成为一个选择工具。该工具切割野生型噬菌体基因组,保留目的同源重组子,从而提高目的重组子的噬菌斑占总噬菌斑的比例。采用高拷贝数载体pNZ123构建系列用于同源重组的模板质粒,获取噬菌体系列重组子:非必需基因orf39中原间隔PS91旁侧PAM处的无义突变(GAA→TAA)和移码突变(ACAAGAAT→AC---AAT)、非必需基因orf33中306 bp长DNA片段的删除、orf33与基因LlaDCHIA的交换[27](图1A)。该实验结果表明,若菌株内含有模板质粒,则相应的噬菌体成斑率(efficiencies of plaquing, EOP)与对照相比,点突变和基因片段的删除都提高2~4个数量级[27]。成斑率提高的原因是:同源重组产生的目的重组子可逃脱CRISPR/Cas系统的靶向[27];Cas9在噬菌体基因组靶标处造成的DNA双链断裂(double strand break, DSB)可以诱发同源重组,从而间接提高同源重组的效率[28]。
1.1.2 基于Ⅲ-A类CRISPR/Cas系统的噬菌体基因组编辑
Bari等[31]在天然含Ⅲ-A类CRISPR/Cas系统表皮葡萄球菌LAM104 (Staphylococcus epidermidis LAM104,即S. epidermidis RP62a?crispr)中开展了编辑Andhra和ISP烈性噬菌体基因组的研究[32](图1B)。其中,菌株RP62a CRISPR阵列的删除,可使新导入的质粒不易被丢失。与Ⅱ-A类CRISPR/Cas系统相比,当利用Ⅲ-A类CRISPR/Cas系统作为选择压力时,双层平板中具有随机突变的噬菌斑的比例会降低[27,31]。分析其原因主要是:其一,该类系统不具备PAM[23];其二,该类系统既能够以转录依赖的方式靶向DNA[25],也能够靶向RNA,且靶标RNA不存在种子区[33]。
Bari等[31]构建了质粒pcrispr/spc?-donor,该质粒不仅能够通过同源重组途径在Andhra和ISP噬菌体的基因组中引入沉默突变,还可以表达特定crRNA,使形成的Cas10-Csm复合物靶向非目的重组子,保留目的重组子(图1B)。此外,采用Ⅲ-A类CRISPR/ Cas系统作为选择压力时,crRNA需要同时满足两个条件[31]:(1) crRNA互补于ORF的有义链[25];(2) 5°末端的标签序列不可与原间隔有义链下游的反标签序列互补,以防Cas10不切割DNA[25,34]。
1.2 无CRISPR/Cas系统宿主细菌中噬菌体的基因组编辑
该类噬菌体基因组编辑的基本思路是:为了编辑靶基因,以质粒的方式导入同源重组模板;为了富集噬菌体重组子,将CRISPR位点和cas位点转到无CRISPR/Cas系统的宿主细菌中。这类研究尚不多,本文仅对4例情形介绍如下。Kiro等[37]在无CRISPR/Cas系统大肠杆菌(Escherichia coli) NEB5α和BL21-AI中对T7烈性噬菌体基因组进行了编辑(图1C)。大肠杆菌NEB5α含同源重组模板质粒(pBAD-1.760或pUC19-4.360),而BL21-AI含3种质粒:pAnti-1.7/4.3具有靶向相应基因(基因1.7或4.3)的间隔,pWUR400具有casA/B/C/ D/E系列基因,pWUR397编码Cas3[37]。首先采用T7噬菌体感染含模板质粒的大肠杆菌NEB5α,获得同时具有重组子和野生型噬菌体的混合裂解液;然后采用该混合噬菌体感染BL21-AI[37]。在BL21-AI中,crRNP复合物首先利用CasA亚基识别噬菌体基因组中的PAM[16],然后利用crRNAs与原间隔的碱基互补配对定位在基因1.7或4.3中的靶标序列,再召集Cas3酶以切割靶标序列[17,38,39],从而降解野生型噬菌体。应用这种方法编辑基因1.7得到的成斑率约为对照的10 000倍[37]。
Box等[40]在无CRISPR/Cas系统霍乱弧菌E7946中编辑ICP1_2011_A烈性噬菌体基因组(图1D)。首先,采用自然转化(natural transformation),将霍乱弧菌O395的基因组岛GI-24 (含Ⅰ-E类CRISPR/Cas系统)转入霍乱弧菌E7946中,使得E7946具备CRISPR/Cas系统;其次,设计系列质粒,如pTarget?cas1 (图1D,左下角),使它们既可用于同源重组,又可编码靶向ICP1_2011_A噬菌体Ⅰ-F类CRISPR/Cas系统基因cas1或cas2-3 (图1D,顶部)的crRNAs[7];最后,实施对各个基因的编辑[40]。其中,对cas1中原间隔的删除实验获得理想的实验结果:成斑率是对照的10倍[40]。但是,Box等[40]的方法(图1D)与Martel和Moineau [27]的(图1A)都存在相同的缺点:导入的外来质粒容易被CRISPR/Cas系统所免疫。
酿脓链球菌(Streptococcus pyogenes)Ⅱ-A类CRISPR/Cas系统衍生出来的基因编辑工具的成份简单、应用成熟,在无CRISPR/Cas系统的宿主细菌中编辑噬菌体基因组时,可优先考虑利用该系统作为选择压力。Lemay等[41]和Tao等[30]采用电转化方式将质粒(加载酿脓链球菌Ⅱ-A类CRISPR/Cas系统)导入待编辑噬菌体的特定宿主细菌中。其中,cas9、tracrRNA (trans-activating CRISPR RNA)和CRISPR位点共同加载于一种质粒载体(如pTRK2或cloDF13-aadA)上,同源重组模板则单独加载于另一种质粒载体(如pNZ123或pET28b)上[30,41]。Lemay等[41]利用这类方法,对乳酸乳球菌MG163 (Lactococcus lactis MG163)的p2烈性噬菌体基因组实施基因删除、点突变和His6序列插入系列操作。Tao等[30]采用该方案,对大肠杆菌野生型T4或T4(C) (此类T4噬菌体的胞嘧啶在大肠杆菌B834中不被修饰)烈性噬菌体基因组实施无义突变、沉默突变和基因片段删除系列操作。
2 CRISPR/Cas系统在噬菌体基因组编辑中的拓展应用
2.1 联合使用CRISPR/Cas系统与噬菌体重组系统
前述的噬菌体基因组编辑实例都有一个共同点:宿主细菌本身具有的重组系统(如RecA/RecBCD)介导了质粒模板与靶基因之间的重组。然而,细菌的重组系统利用寡核苷酸来编辑自身基因组中的靶基因的能力不足,而这种不足可由宿主细菌特异的噬菌体重组系统来弥补[42,43]。例如,利用寡核苷酸在大肠杆菌gal基因中引入点突变时,选择菌株SIMD (含bet基因)作为编辑对象要比HME75 (无Red与Rac系统)效果好,前者得到的重组子是后者的6 × 104倍[42];大肠杆菌MG1655天然重组系统介导寡核苷酸与靶基因之间的重组效率要低于HME63 (含缺陷λ原噬菌体)[43]。λ噬菌体的Red系统和Rac原噬菌体的RecE/T系统,具有相近的重组原理,且重组过程都独立于RecA[44,45]。利用这两个系统实施重组的优点是:以PCR扩增所得的dsDNA及寡核苷酸为模板时,要比以质粒为模板更容易设计。Red和RecE/T系统不仅可以应用于其他物种的基因组编辑,还可以用于噬菌体本身的基因组编辑。比如,Oppenheim等[46]采用Red系统编辑裂解性λ噬菌体基因组;Marinelli等[47]采用分枝杆菌噬菌体Che9c (Mycobacteriophage Che9c) RecE/T类蛋白gp60-61编辑分枝杆菌噬菌体基因组。下面以Oppenheim等[46]、Marinelli等[47]及Jiang等[43]研究为参考,对联合使用CRISPR/Cas系统及Red系统或BRED (Bacteriophage Recombineering of Electroporated DNA)策略编辑噬菌体基因组的实验方案做介绍。
第一类:联合使用CRISPR/Cas系统及Red系统在大肠杆菌内编辑裂解性λ噬菌体的基因组[46]。Oppenheim等[46]所用系列大肠杆菌的染色体上整合有缺陷λ原噬菌体,原噬菌体上的cⅠ857温敏抑制子用来调节red操纵子PL启动子的开与关(图2)。该实验的操作过程简化为:首先,用噬菌体感染宿主细菌;其次,42 ℃热击细胞,致使cⅠ857表达的温敏阻遏物失效、red操纵子表达;再次,将PCR扩增所得的dsDNA或寡核苷酸模板电转化进入细胞内,使模板和噬菌体靶基因可以在Exo外切酶、Beta重组酶和Gam蛋白的作用下发生重组;最后,根据噬菌斑形态特征、测序结果、裂解液重侵染所得溶源菌的抗生素抗性情况和PCR来判定重组子。该方法虽然可以对λ噬菌体的基因组进行基因的无义突变、删除和替换系列操作(图2),但是重组子的噬菌斑占总噬菌斑的百分比并不高,仅为1%~13%。为了提高重组子比例,可以利用CRISPR/Cas系统制造选择压力,留下已发生重组的噬菌体,淘汰未发生重组的噬菌体。若选择酿脓链球菌Ⅱ-A类CRISPR/ Cas系统作为选择压力,则具体操作是:首先,将加载了cas9和tracrRNA的质粒pCas9-1、加载了CRISPR位点的质粒pRSnR导入宿主细菌(染色体上整合缺陷λ原噬菌体);其次,诱导质粒表达Cas9、tracrRNA和CRISPR阵列,诱导时间根据具体情况而定;最后,后续实验保持和前述一致,即噬菌体感染宿主细菌、red操纵子诱导表达等(图2)。

Fig. 2Editing of the bacteriophage λ genome with CRISPR/Cas and Red systems
第二类:联合使用CRISPR/Cas系统及BRED在耻垢分枝杆菌(Mycobacterium smegmatis)内编辑分枝杆菌烈性噬菌体的基因组[47,48]。其中,BRED操作分3步:第一,诱导耻垢分枝杆菌mc2155:pJV53,使得质粒pJV53表达外切酶gp60和重组酶gp61之后,制备感受态细胞[48],并将噬菌体DNA与PCR扩增所得的dsDNA底物同时电转化进入细胞,铺平板;第二,挑选平板上多个噬菌斑,采用引物P1/2或P2/3开展常规PCR或选择性PCR(图3),电泳(若电泳条带不单一,则相应的噬菌斑是重组子与非重组子混合的噬菌斑);第三,将混合噬菌斑的裂解液混合,实施双层平板实验,经过挑斑与PCR扩增后,电泳检测纯合重组子[47]。这样,与CRISPR/Cas系统和Red系统联合类似,将CRISPR/Cas系统与BRED联合使用,有望提高第二步混合斑和第三步重组子斑的比例。

S20:间隔20;PS20;原间隔20;CR:CRISPR阵列;P1、P2和P3分别为引物1 (primer1)、引物2和引物3;SpyCas9:RNA见
Fig. 3Editing of the mycobacteriophage gene with CRISPR/Cas systems and BRED
联合使用CRISPR/Cas系统与噬菌体重组系统实施噬菌体基因组编辑时,可以将两类系统独立地转入到宿主细菌内(在第一类中,Red系统存在于缺陷λ原噬菌体上,而CRISPR/Cas系统加载于质粒 中[46];在第二类中,表达外切酶gp60和重组酶gp61的基因60-61与CRISPR/Cas系统加载于不同的质粒 中[47,48]),也可以将两类系统进行搭配。第一类可以采用同源重组使cas9和tracrRNA整合于缺陷λ原噬菌体上[49];第二类可以考虑利用宿主细菌已知的温和噬菌体,构建包含cas9和tracrRNA、基因60-61、与温和噬菌体包装相关基因的噬粒[50]。
2.2 拓展应用中的潜在问题
联合CRISPR/Cas系统与噬菌体重组系统,构建裂解性噬菌体重组子,需要注意以下几个问题。第一,噬菌体重组系统的选择问题。当利用寡核苷酸在耻垢分枝杆菌基因组中引入点突变时,重组酶来源不同,它在该菌中所体现的活性亦不同,活性大小分别为Che9c gp61>Rac RecT>Halo gp43> Giles gp53≈λ Beta[51]。显然,分枝杆菌噬菌体Che9c来源的重组酶活性最高。反之,当利用寡核苷酸在大肠杆菌基因组中引入突变时,不宜使用Che9c gp61,但是可以用大肠杆菌λ噬菌体的Beta重组酶[42]。这些意味着噬菌体重组酶在其专一性寄生的宿主细菌中才可能达到较佳活性状态,从而有利于发生重组(这可能是宿主细菌的细胞内液体环境更有利于自身噬菌体的重组酶基因的表达、酶活性的稳定或维持[51],还可能与宿主细菌的基因序列或者GC含量等特征有关)。为此,在编辑噬菌体基因组时,应该选择来自该噬菌体(或近缘的噬菌体)的重组系统。
第二,CRISPR/Cas系统类型的选择问题。正如噬菌体重组酶活性在其专一性寄生的宿主细菌(及其近缘的细菌)中表现较佳,选择该噬菌体的宿主细菌(或与其近缘的菌株)所具有CRISPR/Cas系统,实施噬菌体基因组编辑,可能更为恰当。Kiro等[37]就采用了大肠杆菌K12所具有的Ⅰ-E类CRISPR/Cas系统在BL21-AI中进行T7噬菌体基因的删除实验;类似地,Box等[40]则采用了霍乱弧菌O395 Ⅰ-E类CRISPR/Cas系统在E7946中进行ICP1_2011_A噬菌体基因组的编辑。
第四,模板底物问题。应考虑底物单双链及底物同源臂的合适长度等问题。Marinelli等[47]对Giles基因20实施片段删除的实验中,发现dsDNA底物比ssDNA好,而200 bp dsDNA又比100 bp dsDNA重组效率高。此外,应用“Red系列蛋白或重组酶gp61”和ssDNA,在宿主细菌基因组中引入点突变时,基因后随链的互补ssDNA比前导链的互补ssDNA更容易获得高的重组效率[42,44,51]。因此,在应用类似的方法对噬菌体的基因组进行编辑时,应该考虑ssDNA与靶基因单链的互补性问题。
第五,宿主细菌的防御与噬菌体的反防御问题。由于Ⅲ-A类CRISPR/Cas系统以转录依赖的方式切割DNA有义链,使得这类系统不易免疫原噬菌 体[24,25]。但是,Ⅰ-E类CRISPR/Cas系统不同,只要原噬菌体上存在原间隔及其PAM,就会发生免 疫[52]。据推测,Ⅱ类CRISPR/Cas系统与Ⅰ-E类CRISPR/Cas系统具有相似的机制免疫原噬菌体[53]。如同某些噬菌体可以通过限制性内切酶酶切位点修饰等策略来避免宿主细菌的限制—修饰系统[54],原噬菌体中存在着类似机制:采用抗CRISPR蛋白来阻止CRISPR/Cas系统对于原噬菌体的免疫防御。例如,铜绿假单胞菌PA14 (Pseudomonas aeruginosa PA14) (含有Ⅰ-F类CRISPR/Cas系统)的溶源性噬菌体JBD30等,可编码抗CRISPR蛋白。该类蛋白通过与特定Cas蛋白互作来抑制宿主细菌Ⅰ-F类CRISPR/Cas系统的免疫活性,从而维持JBD30等的溶源性[55,56]。又例如,单核细胞李斯特菌1043s (Listeria monocytogenes 1043s) (含有Ⅱ-A类CRISPR/Cas系统)的原噬菌体?J0161a,可编码抗CRISPR蛋白AcrⅡA1和AcrⅡA2。AcrⅡA1和AcrⅡA2蛋白可以使得含有靶标序列的质粒pT成功转化过量表达Cas9的单核细胞李斯特菌1043s::?J0161a[57]。此外,Hynes等[58]发现,嗜热链球菌DGCC7854的烈性噬菌体D4276可表达抗CRISPR蛋白AcrⅡA5;Seed等[7]在霍乱弧菌ICP1_2011_A噬菌体中发现具免疫活性的Ⅰ-F类CRISPR/Cas系统;Tao等[30]发现,T4噬菌体基因组修饰对于Cas9活性的抑制强度因为原间隔序列的不同而不同。因此,分析噬菌体基因组中是否存在抗CRISPR基因、有活性的CRIPSR/ Cas系统及碱基修饰等,对于选择CRISPR/Cas系统开展噬菌体基因组编辑是十分重要的环节。
3 结语与展望
