体细胞核移植(somatic cell nuclear transfer, SCNT)和诱导多潜能干细胞(induced pluripotential stem cells, iPSC)技术都是将已分化的体细胞重编程为未分化的状态,涉及到多潜能基因的重新激活、表观遗传改变及染色质的重塑等过程。以SCNT和iPSC为代表的重编程技术在再生医学领域具有巨大的应用前景,但目前重编程机制尚不甚清楚。SCNT和iPSC均存在效率低下、体细胞表观记忆残留等问 题[1,2],极大地制约了这些技术的应用,因此解析重编程机制进而提高其效率成为当前遗传与发育研究领域的热点之一。
核小体是真核生物染色质的基本组成单位,由146 bp的DNA在组蛋白八聚体上缠绕将近两圈形成。组蛋白八聚体包含两套核心组蛋白H2A、H2B、H3、H4,由两个H2A-H2B二聚体和一个H3-H4四聚体组成。核小体的产生不仅使DNA保持固缩状态,维持基因组的稳定性,而且也保证DNA序列可以正确地进行复制、转录、重组和修复。真核细胞通过组蛋白翻译后修饰(post-translational modifications, PTMs),如甲基化、乙酰化、磷酸化、泛素化等,以及各种组蛋白变体来调节核小体的生物过程。除了H4变体组蛋白只在低等真核生物中被发现外,H2A、H2B、H3在大部分真核生物中都有多种的组蛋白变体,变体组蛋白与常规组蛋白的差异从几个到上百个氨基酸不等。其中H3.3与其常规组蛋白原型仅有几个氨基酸的区别,但H3.3整合进入染色质的方式以及功能却发生了很大的变化。越来越多的研究表明这些组蛋白变体在调节染色质稳态以及相应DNA活性的过程中发挥着重要作用。
1 组蛋白变体H3.3与常规组蛋白H3的区别及特点
编码常规组蛋白H3.1和H3.2的基因不含内含子,且多个基因串联集合成簇存在。其编码的mRNA不包含polyA尾,同时需要结合茎环结合蛋白(stem binding protein)并且在3′端结合U7 snRNA (small nuclear RNA)才能进行翻译[13]。正是这种独特的基因构成及其转录调控方式使得在细胞有丝分裂的间期S期时可以得到大量的常规组蛋白H3,从而保证DNA复制时有足够多的新合成的组蛋白整合进入其中。这是一种依赖DNA复制(DNA synthesis- coupled, DSC)的方式。当紫外线照射或者其他因素导致DNA损伤时,即使细胞不处于S期,常规组蛋白H3.1仍然能以DSC的方式整合进入到染色质 中[14]。而编码非常规组蛋白H3.3的基因却只有一个或几个,且散布在基因组中,转录得到含有polyA尾的mRNA。例如:在小鼠(Mus musculus)、人(Homo sapiens)、果蝇(Drosophila melanogaster)中均有两个编码H3.3的基因,即H3.3A和H3.3B,虽然它们的非编码区不同,但编码相同的H3.3蛋白[15,16,17]。这些基因在整个细胞周期都持续表达,使组蛋白变体H3.3替换常规组蛋白H3,并能以一种不依赖DNA复制(DNA synthesis-independent, DSI)的方式整合进入染色质。所有真核细胞中都存在H3.3或H3.3样的保守蛋白,而在哺乳动物中组蛋白H3.3与H3.2仅有4个氨基酸的差异(第31、87、89和90位氨基酸),H3.3与H3.1也仅有5个氨基酸的差异(第31、87、89、90和96位氨基酸)(
2 H3.3在特定的基因位置富集及作用
利用染色质免疫共沉淀测序技术(chromatin immunoprecipitation with high-throughput sequencing, ChIP-seq),人们确定了真核生物细胞中详细的H3.3全基因组定位图谱。结果表明对于GC含量高的启动子区域,无论基因是激活还是沉默状态,均有H3.3的富集[18]。而H3.3倾向于整合进入激活的染色质中,主要富集在有活性基因的启动子区域、基因内与基因间的调控区域,说明H3.3与基因活性之间存在一定联系[18,19,20,21]。当基因转录时,RNA聚合酶复合物在基因体上会移除原有的核小体,H3.3能被动地以DSC方式整合进入染色质进行补充[22]。而H3.3也能主动在激活状态基因的调控元件区域持续地以DSI方式替换常规组蛋白H3来维持相关复合体的结合,从而激活转录或保持基因的表观遗传记忆[21,23]。Gurdon等[23]发现在非洲爪蟾(Xenopus laevis)中存在一些H3.3相关的表观遗传标志,其在细胞分裂过程中始终存在,而不是依靠每一个细胞周期中重新激活转录来维持激活状态的记忆。在果蝇中敲除H3.3编码基因(His3.3A和His3.3B)会出现H3的过表达,说明其中可能存在部分补偿机制[24]。但在小鼠胚胎干细胞中,敲除Hira的细胞与野生型细胞相比,H3.3在基因内区域的富集减少对于整个细胞的转录影响不大[18]。这表明H3.3可能在这些细胞中的正常转录中并不是必需的,但考虑到它们是全能或多潜能干细胞,与终末分化的细胞相比,可能不需要一个持续的基因激活的记忆,所以应关注H3.3在已分化的哺乳动物细胞中对于激活状态记忆的作用。H3.3除了整合进入激活的染色质中,同时也富集在另一些非激活状态的基因位置中。小鼠胚胎干细胞中存在一些启动子区域同时富集H3K4me3和H3K27me3两种表观修饰的二价基因,它们大多处于静止状态,只有在细胞分化时才激活表达。在正常情况下H3.3会募集多梳蛋白抑制复合体2(polycomb repressive complex 2, PRC2)到二价基因启动子区域参与建立H3K27me3修饰的过程[25]。当NIH3T3细胞受到某些外界条件(如干扰素)刺激后会激活部分基因的表达,此时H3.3会大量富集到这些基因的编码区的末端。如果细胞不处于有丝分裂时期,即使转录结束后,H3.3一段时间内仍会存在于这些基因的编码区[26]。Ahmad和Henikoff[10]发现H3.3在果蝇Kc细胞中富集到大量rDNA重复序列中,或许是因为这些致密重复的rDNA位点有很高的转录活性又或者是为了维持rDNA异染色质的稳定。而在小鼠胚胎干细胞中,H3.3在rDNA等重复序列中均有富集,且保持较稳定的水平,维持基因的平衡状态[21]。另外,在人、果蝇和小鼠中,还发现H3.3在端粒和着丝粒旁的异染色质区域的聚集,而且对于维持此处重复序列的转录抑制状态是必需的[27,28,29]。因此,可以看出H3.3整合进入端粒和着丝粒旁的异染色质区域与基因组稳定性相关。探究H3.3如何整合进入这些特殊的位点,以及介导H3.3整合进入的组蛋白分子伴侣复合物如何发挥作用,对更好地理解H3.3的富集模式和作用很有意义。

Fig. 1Differences in amino acid sequences between H3 (H3.1 & H3.2) and H3.3
3 H3.3与分子伴侣
核小体的组装需要一系列组蛋白整合进入DNA,而组蛋白变体整合进入的平衡受到组蛋白分子伴侣的影响,这对于细胞命运决定和基因表达程序的稳定很重要。H3.3有很多分子伴侣,一部分特异地与H3.3相互作用,而另一部分则可以与所有的组蛋白H3发生相互作用。在高等动物中,主要由两种特异的组蛋白分子伴侣复合体引导H3.3整合进入染色质:HIRA/UBN1/CABIN1复合体和ATRX/DAXX复合体。3.1 HIRA/UBN1/CABIN1复合体
Almouzni等[30]在分离常规组蛋白H3.1整合进入复合体时发现了染色质合成因子(chromatin assembly factor-1, CAF-1),其包含p150、p60和p50 3个亚基,是在DNA复制和因紫外线照射损伤修复过程中以DSC方式促进核小体合成的分子伴侣原型。在分离H3.3整合进入复合体的研究中,又发现了组蛋白细胞周期调节因子A(histone cell cycle regulator A, HIRA)[31]。该复合体(以下简称HIRA复合体)主要包括HIRA、泛素化核蛋白1(ubinuclein-1, UBN1)、钙依赖磷酸酶结合蛋白1(calcineurin-binding protein 1, CABIN1)(图2)。这是一个进化保守的组装过程,在抗沉默功能蛋白1同源物a (anti-silencing function 1 homolog a, ASF1a)的帮助下,调控H3.3-H4二聚体以DSI方式整合进入或退出染色质[32]。酿酒酵母菌(Saccharomyces cerevisiae)中Hir1p和Hir2p拥有与HIRA同源的结构域,而Hir3和Hpc2分别是CABIN1和UBN1的同源物。其中UBN1能特异性识别H3.3- H4二聚体H3.3第90位上甘氨酸残基,与H3.3高度保守的第87、89和90位的AIG结构域结合。酿酒酵母菌中HIR复合体以DSI方式参与转录调控、延长速度和沉默染色质结构域的建立[33]。在果蝇中,HIRA对于H3.3整合进入解凝集的精子染色质很重要,HIRA突变使卵母细胞中H3.3不能替换精子中鱼精蛋白,精子染色质维持凝集状态,最终导致胚胎致死[34]。然而在出生后的发育阶段,敲除HIRA并不影响果蝇的生长过程,仅雄性果蝇出现不育症状,表明在果蝇中,由HIRA复合体介导的H3.3整合进入核小体并不是生长发育过程必需的,可能还存在其他介导H3.3整合进入核小体或者其他组蛋白变体替代H3.3功能的代偿机制[24]。在非洲爪蟾中,胚胎发育过程中H3.3的整合进入也依赖HIRA复合体,敲减HIRA的蛋白水平会得到与敲减H3.3类似的表型[35]。在哺乳动物中,HIRA复合体介导的H3.3整合进入核小体对于早期胚胎发育和细胞多能性十分重要[36]。在小鼠胚胎干细胞中,HIRA复合体介导H3.3在发育相关基因启动子区域募集PRC2复合体,建立正确的H3K27me3修饰,维持胚胎干细胞中正常的染色质表观修饰标记,这对于分化时的基因调控是必需的[25]。在增殖细胞中,因为HIRA复合体可以控制RNA聚合酶Ⅱ与转录位点和调控元件结合,所以HIRA复合体出现在活跃基因的启动子与基因体等位置,可以调控转录激活基因的功能[37]。最新的研究表明,HIRA复合体介导的H3.3核小体合成依赖复制蛋白A(replication protein A, RPA),RPA是单链DNA结合蛋白,是DNA复制和修复重要的调节因子。如果下调RPA表达水平会影响HIRA复合体的募集和H3.3整合进入调节元件和启动子区域,进而影响基因转录[38,39]。图2

H3.3由HIRA/UBN1/CABIN1复合体介导整合进入激活基因的基因体和启动子区域以及调控元件区域。而ATRX/DAXX复合体介导H3.3整合进入端粒和着丝粒旁异染色质区域。PML小体形成一个H3.3“仓库”,里面容纳未整合进入染色质的H3.3以及HIRA、ATRX、DAXX和DEK等分子伴侣,在整合进入染色质之前调控H3.3与分子伴侣之间的相互作用。ASF-1a为HIRA/UBN1/CABIN1复合体提供H3.3-H4二聚体,DEK和RPA各自调控H3.3整合进入调控元件区域。PML NB: 早幼粒白血病蛋白小体(promyelocytic leukemia nuclear bodies)。
Fig. 2H3.3 enrichment pattern and specific chaperone complexes
3.2 ATRX/DAXX复合体
除了HIRA复合体外,另一个包含两个蛋白的复合体也参与了H3.3核小体的合成[40],该复合体包含的两个蛋白分别是α地中海贫血/智力低下X连锁综合症蛋白(the alpha-thalassemia/mental retardation X-linked syndrome protein, ATRX)和死亡结构域相关蛋白(the death domain-associated protein, DAXX) (图2)。ATRX属于SNF2相关ATP酶家族,是一个ATP依赖的染色质重构因子。与其他真核生物SWI/ SNF多蛋白复合体的其他螺旋酶亚基一样,ATRX会介导H3.3整合进入特定的靶点位置改变核小体组成。ATRX定位在端粒和着丝粒旁的异染色质区域,表明可能有维持染色质沉默状态的作用[41]。DAXX和ATRX一起介导H3.3整合进入染色质[40],与HIRA复合体类似,DAXX可以识别H3.3中第87~90位氨基酸的AAIG模体,与H3.3-H4二聚体结合[42]。DAXX和ATRX相互作用,引起ATP依赖的染色质重构以及H3.3以DSI方式整合进入特定的基因区域[40,43]。有研究表明,ATRX能通过自身的染色质结合结构域识别H3K9me3和未被修饰的H3K4,与异染色质蛋白1(heterochromatin protein 1, HP1)结合[44]。这会促进macroH2A1退出基因和基因间区域,因为在缺乏ATRX的人源细胞中发现macroH2A1在端粒旁区域聚集[45]。在分裂细胞和分化细胞中,DAXX与ATRX一同控制H3.3整合进入着丝粒旁异染色质、端粒以及转录起始区域[18,40,46~48]。尽管H3.3常与激活基因的启动子和调控区域相关[49,50],但ATRX/DAXX复合体控制H3.3整合进入H3K9me3等甲基化的沉默基因区域,维持表观遗传修饰[48],这也许可以阻止表观遗传记忆的丢失以及异染色质区域的异常基因表达。在小鼠胚胎干细胞中,ATRX/DAXX复合体对于H3.3整合进入内源转座元件(endogenous retroviral elements, ERVs)很重要,例如:H3.3依赖的核小体替换通过募集KRAB相关蛋白1(KRAB-associated protein-1, KAP1)维持H3K9me3标记和ERVs的沉默状态[51,52]。近期有研究发现EB病毒(epstein-barr virus, EBV)可以利用ATRX/DAXX复合体整合进宿主基因组中,并维持潜伏状态[53]。这些结果表明ATRX/DAXX复合体介导的H3.3替换对于维持基因组稳定性和组织中体细胞异质性十分重要。3.3 其他的分子伴侣
其他一些蛋白也被发现与H3.3整合进入特定位置相关,一些能特异地与H3.3相互作用,而另一部分则与所有H3或者所有组蛋白相关。例如:FACT介导组蛋白整合进入与交换,NASP1可以保证新合成的组蛋白不被降解。在果蝇中,染色体结构域螺旋酶DNA结合蛋白1(chromodomain helicase DNA- binding protein 1, CHD1)与HIRA互作,介导H3.3在受精后整合进入精子DNA解凝集的雄性染色质中[54]。早幼粒白血病(promyelocytic leukemia, PML)蛋白形成空腔的PML小体(PML nuclear bodies, PML NB),包含H3.3及HIRA、DAXX、ATRX等分子伴侣,PML小体调控H3.3与分子伴侣之间的相互作用,使之整合进入PML蛋白相关的异染色质区域[55]。在人和果蝇中发现另一个蛋白DEK,是染色质结合原癌基因产物,也被认为是H3.3的一个分子伴侣,介导H3.3整合进入调控元件区域并增强转录[56]。有研究发现DEK聚集在PML小体中,调控H3.3与ATRX/DAXX复合体相互作用,整合进入端粒和异染色质区域,维持端粒和异染色质区域的稳定[57] (图2)。综上所述,这些结果表明H3.3整合进入染色质需要特殊的分子伴侣复合体参与,但可能还存在一些其他的H3.3分子伴侣或者整合进入途径,可以在缺失H3.3特异分子伴侣的时候代偿发挥作用。4 H3.3与细胞重编程
在雄性哺乳动物生殖细胞进入第一次减数分裂前期时,H3.3的整合进入伴随所有染色体中的核小体的替换,发生在减数分裂性染色体失活(meiotic sex chromosome inactivation, MSCI)过程中[58]。这与雄性哺乳动物生殖细胞系中性染色质基因沉默的表观遗传重编程相关。在大部分有性繁殖的动物中,还涉及另外一个主要的重组过程,即在精子发生过程中,组蛋白被鱼精蛋白替换,这对于维持精子细胞基因组凝集状态以及转录抑制状态十分重要[59]。当进入卵母细胞之后,精子的细胞核会经历一系列保守的过程被重编程为雄原核。精子内主要经历鱼精蛋白被组蛋白替换和染色质解凝集。同济大学高绍荣课题组等发现受精后,卵母细胞中的重编程因子更多地进入到雄原核之中[60]。在果蝇和小鼠中,受精后精子中鱼精蛋白被母源H3.3替换,而不是H3,这种状态一直持续到第一次DNA复制之前[9,34]。这说明H3.3整合进入对精子染色质重编程具有重要作用。SCNT是利用去核的卵母细胞将供体细胞核重编程为胚胎样细胞核,从而具有全能性。核移植胚胎激活后4 h内,母源H3.3会逐渐替换供体细胞内原有的H3,类似受精过程中鱼精蛋白被母源H3.3替换的过程,首先是常染色质区域,最后是异染色质区域[61],母源H3.3会重新激活供体细胞核中的多潜能基因Oct4,降低基因组中H3K27me3水平。而敲除母源H3.3后,关键的多潜能基因转录水平下降,体细胞核不能被完全重编程,SCNT胚胎将不能正常发育[62,63]。注入外源H3.3 mRNA而不是H3.2 mRNA可以挽救这种缺陷,说明H3.3在体细胞重编程过程中十分重要。而iPSC是另一种将体细胞重编程为全能性细胞的方式,通过转入外源的转录因子达到体细胞重编程的目的。但H3.3在iPSC重编程过程中的作用机制尚不清楚。小鼠SCNT后代理论上可以无限次通过SCNT得到后代[64],但iPSC后代进行连续iPSC在第六代后会因非同义的单核苷酸突变(single-nucleotide variations, SNVs)累积某些致病基因,造成心肾发育缺陷导致胚胎死亡。且在第一代iPSC小鼠体细胞构建的第二代iPSC细胞系中即可检测到逆转录转座子元件的缺失,如无法检测到长散在核元件(long interspersed nucleotide elements, LINEs)和长末端重复序列(long terminal repeats, LTRs)的存在[65](图3)。已有文献报道,H3.3对于维持H3K9me3标记和逆转录元件的沉默状态十分重要[51,52]。对比这两种重编程过程,在敲除端粒酶Terc后,SCNT胚胎来源的ntESC中端粒比iPSC中端粒更长且更稳定[66],而H3.3在维持端粒稳定性方面也有重要作用[11,46,57]。考虑到iPSC重编程过程中没有卵母细胞参与,缺乏母源H3.3替换,自身H3.3可能不足以维持端粒和着丝粒旁重复序列异染色质的稳定性,这也许是连续iPSC重编程不能无限连续进行的原因之一。过表达外源H3.3或者其特异的分子伴侣是否能提高iPSC的重编程效率,使之更接近正常的ESC还有待进一步研究。图3

SCNT重编程过程中卵母细胞含有大量的母源H3.3,会替换体细胞核中原有的H3.3,而iPSC重编程过程中没有母源H3.3参与。如果进行连续iPSC重编程,从第二代iPSC起可检测到LINEs和LTRs的缺失,到第六代时,四倍体补偿的iPSC胎儿会因非同义的SNVs累积致病基因而死亡[65]。SCNT:体细胞核移植(somatic cell nuclear transfer);iPSC:诱导多潜能干细胞(induced pluripotent stem cell);SNVs:单核苷酸突变(single-nucleotide variations);LINE:长散在核元件(long interspersed nucleotide elements);LTRs:长末端重复序列(long terminal repeats)。
Fig. 3Comparison of H3.3 in somatic cell reprogramming during SCNT and iPSC
5 结语和展望
H3.3与常规组蛋白H3之间只有几个氨基酸不同,但它们能够驱使H3.3与特异的分子伴侣相互作用。H3.3至少包含两种特异的分子伴侣复合体,HIRA复合体和ATRX/DAXX复合体,与不同的分子伴侣相互作用可以使H3.3富集到基因组中的不同位置。HIRA复合体介导H3.3整合进入转录激活基因的启动子和调控元件区域,促进基因的转录表达。而ATRX/DAXX复合体介导H3.3整合进入端粒或着丝粒旁异染色质区域,维持该区域的抑制性表观遗传标记和基因组稳定性。H3.3是重要的母源因子,在正常受精后精子的重编程以及体细胞核移植后供体细胞核的重编程过程中起重要作用。在正常受精过程中,H3.3能替换精子中的鱼精蛋白,将其重编程为雄原核。而在SCNT过程中,母源H3.3也能替换供体细胞核内原有的H3.3,将其重编程成为具有全能性的胚胎。rDNA是编码核糖体的基因,在受精过程中最先被激活,以保证受精卵的蛋白合成。在SCNT过程中,重编程效率与rDNA启动子区域甲基化程度相关[67],而在iPSC建系过程中提高rDNA的表达水平,可以提高iPSC的建系效率[68]。在果蝇Kc细胞、非洲爪蟾和小鼠受精卵中,H3.3整合进入rDNA区域,保证rDNA的转录[10,69,70]。这些结果证明H3.3与rDNA活性相关。在爪蟾SCNT重编程过程中HIRA介导H3.3进入rDNA区域,促进rDNA的表达,从而促进供体细胞核重编程[70],但在其他物种中尚未见相关报道。那么在其他物种SCNT过程中H3.3是否也会整合进入rDNA区域并参与rDNA重编程过程?如果H3.3确实在SCNT过程中参与rDNA重编程,那么又是由何种特异的分子伴侣介导?是整合进入激活的rDNA区域来维持rDNA的表达或沉默rDNA基因?还是整合进入沉默的rDNA区域,激活rDNA转录或者继续维持rDNA的异染色质结构稳定?调控H3.3的分子伴侣的含量能否促进体细胞重编程效率?关于这些分子机制的研究对于改善SCNT和iPSC的重编程效率低下、消除体细胞表观记忆残留等问题将很有帮助。未来这一领域的研究将会为利用体细胞重编程技术构建正常的全能性干细胞用于细胞替代治疗、组织器官移植提供巨大的应用前景。(责任编委: 王晓群)
