PDF (555KB)
表观遗传调控是实现真核生物基因选择性表达的主要途径。多梳蛋白家族(polycomb groups,PcGs)是一类重要的表观遗传调控因子,与多种干细胞的干性维持、细胞分化、细胞周期的调控、细胞衰老、X染色体失活等一系列细胞生理活动密切相关[1,2]。它主要通过两类蛋白复合体发挥功能——多梳抑制复合体Ⅰ和Ⅱ (polycomb repressive complex 1/2, PRC1/2)。近年来在高等动物细胞中不断鉴定出组分不同的PRC1亚型,且它们的生物学功能在靶基因群的选择及调控基因表达的作用机制中有所差异。PRC1.6复合体属于其中一类PRC1亚型,主要包含RING1B、PCGF6 (polycomb group ring finger protein 6)、MAX (Myc-associated factor X)、MGA (MAX gene associated)、E2F6和L3MBTL2 (lethal (3) malignant brain tumour like 2)等组分。近年来通过对PRC1.6复合体不同核心组分在生物化学、分子生物学、细胞生物学及发育生物学等方面的研究,发现该复合体对于哺乳动物发育过程中多种相关细胞谱系的建成及维持是必需的。本文在介绍该复合体的发现、核心组分的分子生物学功能的基础上,对该复合体在高等动物胚胎发育、性腺发育、精子发生、胚胎干细胞(embryonic stem cells, ESCs)及生殖干细胞(germ line stem cells, GSCs)维持等过程中发挥的生物学功能展开了系统论述。
1 多梳蛋白家族PcGs
PcGs是一大类通过催化和识别组蛋白表观遗传修饰来改变染色质构象、对靶基因进行转录调控的蛋白。第一个多梳蛋白编码基因Polycomb (Pc)是Pamela Lewis于1947年在黑腹果蝇(Drosophila melanogaster)中发现的,1978年Edward Lewis发现Pc突变导致果蝇发生同源异型转化(如雄性果蝇产生多对性梳的异常发育表型),进一步研究发现多梳蛋白是通过抑制同源异型基因的表达来调控果蝇的体节发育[1,3,4],其功能与发挥基因激活作用的三胸蛋白家族TrxGs(trithorax groups)相拮抗[5,6]。但是近几年也有关于PcGs蛋白激活基因表达的报道[7,8,9],表明PcGs蛋白在执行转录调控方面的机制可能是非常复杂且多效的。PcGs蛋白主要通过PRC1和PRC2两类蛋白复合体形式发挥作用。其中,EZH2是PRC2中具有催化活性的核心组分,可以催化组蛋白H3第27位赖氨酸的三甲基化(H3K27me3)[10]。其他的PRC2组分参与复合体组装及活性维持[11]。PRC1具有E3泛素连接酶活性,该活性由RING1A/ RING1B及PCGF的环指结构域(ring finger domain)的部分亲水性表面构成[12,13],催化组蛋白H2A第119位赖氨酸的单泛素化(H2AK119ub1)[14]。PRC1和PRC2 调控的靶基因群存在部分重叠,在多数情况下二 者存在相互招募的关系,互助实现对靶基因的转录 调控[15]。高等动物中PRC1的组分较果蝇要复杂的多,除了对应果蝇PRC1的每个组分都衍生出多个同源蛋白之外,还增添了很多其他组分,且组分之间的组合方式非常复杂多样[16]。目前在哺乳动物中发现PRC1亚型有6类,称为PRC1.1~PRC1.6,其中PRC1.2和PRC1.4因包含有经典的Pc蛋白同系物CBX蛋白而被称作经典PRC1 (canonical PRC1),其余几种亚型因缺乏CBX蛋白而被列为非典型PRC1 (non-canonical PRC1)。本文着重讨论了PRC1.6亚型,关于其他亚型的组成及功能均有较多报道,请读者参考相关综述[17,18]。
2 PRC1.6复合体的发现、核心组分及其分子功能
2.1 PRC1.6复合体的发现
PRC1.6复合体先后被不同的研究团队发现,并被赋予了不同的名称(表1)。2002年,Ogawa等[19]在HeLa及成纤维细胞中利用免疫沉降技术、甘油密度梯度离心并结合质谱检测发现了与E2F6-标签融合蛋白结合的蛋白复合体—E2F6复合物(E2F6.com)。该复合体中除了包含转录因子E2F6/DP-1,还有另一对转录因子异二聚体MAX/MGA;同时发现该复合体在甘油密度梯度分离中与组蛋白甲基转移酶G9a、Eu-HMTase1 (GLP)部分重叠,具有H3K9的甲基转移酶活性[19]。2011年,美国纽约大学医学院Danny Reinberg课题组的Trojer等[20]研究L3MBTL2的功能时再次发现了该复合体,将其命名为PRC1L4 (PRC1-like4)复合体;2012年,同课题组的Gao等[21]通过免疫沉降/质谱实验发现了人源细胞中包含不同PCGF因子(PCGF1~PCGF6)的PRC1复合体,并根据包含PCGF因子的编号将PRC1复合体细分为PRC1.1~PRC1.6复合体亚型,各亚型除了共同组分是PRC1复合体的酶学核心组分RING1B (RING2)外其余组分差异较大。其中PRC1.6组分包括PCGF6、RING1B、RYBP、MAX、MGA、L3MBTL2、E2F6、DP-1/2、HP1γ和HDAC1/2等。2017年,Endoh等[22] 在小鼠ESCs中利用带标签的PCGF6蛋白也分离到了类似的复合体并将其称为PCGF6-PRC1。以上4种复合体虽然名称各异,但是核心组分都含有PCGF6、E2F6、RING1B、L3MBTL2和HP1γ等因子(表1),本质上属于同一复合体或十分相近的同类复合体。为了叙述简洁,本文在后续介绍中将其统称为PRC1.6复合体。Table 1
表1 PRC1.6复合体的发现及组分
Table 1
复合体命名 | 组分 | 细胞系 | 文献 |
E2F6.com | E2F6、PCGF6、RING1B、MAX、MGA、L3MBTL2、HP1γ、DP-1/2、YAF2、G9a和Eu-HMTase1(GLP) | HeLa | [19] |
PRC1-like 4 (PRC1L4) | E2F6、PCGF6、RING1B/RING1A、L3MBTL2、HP1γ和MBLR | HEK293T | [20] |
PRC1.6 | E2F6、PCGF6、RING1B、MAX、MGA、L3MBTL2、HP1γ、DP-1/2、HDAC1/2、RYBP/YAF2和WDR5 | 293TREx | [21] |
2.2 PRC1.6复合体各组分的分子功能
Table 2
表2 PRC1.6复合体中各组分的主要生化及分子功能
Table 2
组分名称 | 主要生化及分子生物学功能 | 文献 |
RING1B/ RYBP | RING1B具有E3泛素连接酶活性,催化H2AK119泛素化从而抑制基因转录;RYBP与RING1B直接互作,辅助增强RING1B酶活性,其泛素结合结构域可结合H2A上的泛素化修饰 | [21,23,30] |
HDAC1/2 | 去乙酰化酶,降低组蛋白特定位点的乙酰化水平,抑制靶基因转录 | [21,31] |
HP1γ | 与H3K9甲基化转移酶互作,参与染色质凝缩和异染色质形成与维持,并在转录延伸和RNA形成中发挥作用 | [21,32] |
PCGF6 | 招募RING1B到PRC1靶基因形成H2AK119单泛素化及维持H3K27me3水平来抑制基因表达;在复合体组装中发挥作用 | [21,22,24, 33,34] |
MAX/MGA | 是识别特定DNA序列结构域的转录因子异二聚体,帮助招募复合体到特定靶基因;主要抑制靶基因表达;MGA对于该复合体装配及其他组分的蛋白稳定性十分重要 | [21,25,35] |
E2F6/DP-1 | 是识别特定DNA序列结构域的转录因子异二聚体,帮助招募复合体到特定靶基因。E2F6在细胞G0期结合至E2F应答基因启动子并沉默其表达;DP-1调控DNA复制及细胞周期相关基因 | [19,36,37] |
L3MBTL2 | 具有组蛋白结合能力,参与染色质凝缩和转录抑制;其MBT结构域参与复合体装配及复合体靶向定位 | [20,21,25,35] |
目前,关于PRC1.6复合体的靶向定位的研究结果显示该复合体的定位机制较为复杂,由多个组分协同执行,包括MAX/MGA和E2F6/DP-1/2这两对转录因子形成的异二聚体以及L3MBTL2[25] (表2)。MAX和MGA通过各自的bHLHZip (basic Helix- Loop-Helix-Zipper)结构域结合形成异二聚体,并特异性识别E-boxes序列CACGTG;此外MGA的氮端还包含另一个DNA结合结构域,可识别T-box序列AGGC/TGC/TGA,该异二聚体在PRC1.6复合体的组装、稳定性及靶基因识别上都发挥着重要作用[25,26]。另一对转录因子是E2F6和DP-1或DP-2,二者结合共同识别E2F家族识别序列GCGGGA[27]。与E2F家族的其他转录激活因子不同,E2F6通常对其结合的序列调控的靶基因产生转录抑制效应。L3MBTL2包含4个MBT结构域,结合组蛋白H3和H4,但该结合是否依赖于组蛋白的甲基化状态目前还有争议[28,29]。
3 PRC1.6复合体在胚胎发育中抑制生殖谱系相关基因的表达
近年来不断积累的针对PRC1.6组分的RNA干扰或基因敲除实验已经充分证实PRC1.6复合体在维持ESCs的自我更新及调控其分化能力方面,尤其在抑制生殖谱系相关基因表达中发挥重要作用。在小鼠中,该复合体组分的敲除往往造成胚层及/或胚外谱系不同程度的发育异常,多数情况下产生胚胎致死表型(表3),由此可见,PRC 1.6复合体在ESCs以及胚胎发育过程中发挥至关重要的调控功能。Table 3
表3 PRC1.6组分下调对ESCs及小鼠胚胎发育或性腺发育的影响
Table 3
组分 | 敲低/敲除表型(ESCs) | 敲低/敲除表型(小鼠胚胎发育) |
RING1B | 敲除后干细胞分化相关基因(含印记基因)转录去抑制,ESCs异常分化[47,48,49];与Ring1a双敲除导致H2A K119泛素化标记消失,同时释放对polⅡ的转录延伸抑制[50] | 敲除后胚胎及胚外组织发育迟缓,不能正常进入原肠胚阶段,E8.5左右出现胚胎致死[51];半合子体轴和胸骨发育异常[52];在生殖细胞特异性敲除的雄鼠可存活但睾丸明显变小且不 育[53];对原始生殖细胞的性别分化至关重要[54] |
RYBP | 缺失后ESCs不能形成收缩的心肌细胞[55];对ESCs自我更新维持非必需,但敲除导致ESCs不能形成囊胚,生殖谱系相关基因及内源性反转录病毒表达去抑制[38] | 敲除后在受精卵着床后早期胚胎致死(E5.5~6.0),对于胚胎存活及胚外组织的结构建成是必需的;敲除Rybp的杂合子CNS系统发育异常[56] |
HDAC1/2 | 同时条件性敲除Hdac1和2导致细胞活力丧失,基因失活从而导致有丝分裂纺锤丝异常增加和染色体分离缺陷,多能性核心因子Oct4,Nanog等表达下调[57] | 敲除Hdac1会导致胚胎E10.5致死[58];在E8.5时诱导敲除Hdac1和2导致从E12.5开始产生突变的肺上皮细胞,并且出生后全部死于呼吸窘迫[59] |
HP1γ | 敲除导致ESCs趋于分化且内胚层和神经发育缺陷,细胞增殖能力下降[60] | 纯合敲除的小鼠只有约1%活到成年,且雄性表现出性腺功能低下,精子发生缺陷,转座子活性升高[61];对于减数分裂中组蛋白H3K9甲基化修饰的识别至关重要[62] |
PCGF6 | 对于维持ESCs干性是必需的[24],抑制小鼠ESCs过早分化[22];敲除导致干性相关基因表达下调,中胚层及精子发生特异性基因上调,在iPS形成实验中可有效取代Sox2[33,34] | 敲除小鼠可以存活并且可育,但是存在部分胚胎致死现象,出现骨骼同源异型转化及胎盘发育异常,约有1/3的Pcgf6-/-胚胎在E10.5体现出明显的发育迟缓[22] |
E2F6 | 结合在生殖相关基因的启动子区抑制其表达[63];可以与G0期相关基因的靶启动子区结合,沉默E2F-和Myc-应答基因[19] | E2f6敲除小鼠可存活,但是轴向骨骼出现同源异型转化;2~3个月龄的雄鼠睾丸发育异常,支持细胞数目异常增加,精母细胞及成熟的精子数目减少,但未达到不孕程度[64];E2f6与Bmi1双敲小鼠生长迟缓,且严重贫血[65];体细胞广谱表达生殖细胞特异性基因[42] |
DP-1 | DP-1的敲除不影响ESCs中细胞周期相关基因的表达[66] | 敲除小鼠胚胎外谱系发育及DNA复制异常,于E12.5胚胎致死;但对胚胎本身发育不是必需的[66,67] |
MAX | 敲除后诱发ESCs进入减数分裂[39,40] | 影响胚胎及胚外组织发育,在受精卵着床后早期发育停滞并于E5.5~E6.5胚胎致死[44] |
MGA | 敲低导致ESCs明显分化甚至死亡,生殖谱系发育及减数分裂相关基因去抑制[45,68] | 敲除导致小鼠胚胎中多能性的内细胞团细胞死亡(可能与调控腐胺合成酶Odc1有关),于E4.5~E5.5胚胎致死[45] |
L3MBTL2 | 敲除后ESCs的增殖能力下降,细胞周期改变,干细胞分化异常;生殖谱系发育及减数分裂及其他发育相关基因去抑制[41] | 缺失导致内细胞团不能形成正常的上胚层,胚胎于E7.5~9.5致死[41];在生殖细胞中特异性敲除后,雄鼠可育但精子数目减少,睾丸小且呈现生育能力下降[69] |
3.1 PRC1.6复合体参与ESCs干性维持及调控ESCs正常分化
PRC1.6复合体的组分RING1B、MAX、MGA、HP1γ、PCGF6和L3MBTL2等都已被报道对于ESCs的干性维持是必需的,这些组分在被敲除后均会引起ESCs分化异常(表3)。另有一些因子如RYBP虽然对于ESCs的自我更新是非必需的,但对于ESCs的正常分化却是不可缺少的[38]。2013年,Maeda等[39]在小鼠ESCs中通过siRNA文库从864个候选基因中筛选能够抑制生殖细胞分化路径的重要基因,筛选到多个PRC1.6复合体组分,包括Max、Mga和L3mbtl2,其中Max敲低效应最为显著,可诱发ESCs进入类似减数分裂的状态。Suzuki等[40]在ESCs中诱导性敲除Max后也发现表达上调的基因主要包括减数分裂和精子发生过程中的相关基因,如Hormad1、Dazl和Slc25a31等。通过细胞免疫荧光实验发现在Dox诱导Max敲除10天后,ESCs发生类似减数分裂细胞的形态学变化,出现减数分裂前期(细线期和偶线期)相关蛋白SYCP3的表达,因此PRC1.6复合体功能异常导致减数分裂相关基因的异常高表达,使ESCs越过原始生殖细胞(primordial germ cells, PGCs)直接形成类似减数分裂前期的细胞,说明MAX对于调控减数分裂的起始至关重要[40]。在小鼠ESCs中PRC1.6复合体不同组分的ChIP-Seq数据显示,该复合体在全基因组中靶向上万个位点(由PCGF6、L3MBTL2和MGA共同靶向);当逐个敲除不同组分时,这些PRC1.6复合体靶基因中转录本水平发生上调的基因数目一般为数百个,如敲除Pcgf6导致882个基因上调[25,26];敲除L3mbtl2导致421个[25]或167个[41]基因上调。这类对PRC1.6复合体调控最敏感的基因中包含不同类型的发育相关基因(如神经发育基因),但最显著的是特异性地包含生殖谱系及减数分裂关键基因[24,25,40,41],这是其区分于其他PRC1复合体亚型所独具的功能。在敲除Pcgf6的ESCs中表达显著上调(>10倍)的基因中有49个都是在精子发生过程中必不可少的基因[22]。在ESCs中敲除Mga后发现与减数分裂相 关的基因Taf7l、Slc25a31、Stra8和Sycp3表达量上调[25]。同样,敲除Rybp的ESCs也呈现出生殖谱系相关基因特异性上调的现象[38]。另有研究表明,PRC1.6复合体同时抑制体细胞中生殖谱系相关基因的表达,如敲除E2f6基因的小鼠呈现出生殖谱系相关基因(SMC1β和STAG3等)在体细胞中的异常表达[42,43]。这些实验证据都支持PRC1.6复合体在ESCs等其他非生殖细胞类型中发挥稳定抑制生殖谱系特异性基因表达的作用,维持这些细胞类型的身份,限制其向生殖细胞谱系异常分化。
3.2 PRC1.6复合体对于正常胚胎发育必不可少
PRC1.6复合体对于哺乳动物胚胎发育的正常进行是必需的,但每个组分被敲除后小鼠所呈现的胚胎发育异常状况却有所区别,这一定程度上反映出每个组分在该复合体功能发挥中的权重不同以及部分组分可能因为参与多种复合体而具备更为多样的发育调控功能(表3)。有研究表明,Max敲除小鼠在E5.5~6.5时表现出胚胎及胚外组织发育阻滞,且不具备明显的胚胎特征或胚胎与胚外组织分界不清晰[44]。Mga的表达在小鼠E3.5时的内细胞团中以及E4.5~E6.5时具全能性的上胚层(epiblast)中均可检测到,当使用MgaGt/MgaGt纯合敲除Mga,内细胞团在E4.5后随即发育停滞,细胞增殖无明显变化但细胞凋亡增加,上胚层不能正常形成[45]。由MgaGt衍生出来的MgaInv等位基因呈现出Mga低表达表型,约一半MgaInv/MgaInv纯合小鼠在出生及哺乳期死亡,其余能存活并可育[45]。早期通过原位杂交实验发现Mga在胚胎发育E9.5~10.5间广谱表达,在肢芽、腮弓及尾部区域高表达[26]。为进一步澄清其在E4.5之后的发育调控功能,近期研究发现表达低剂量Mga的MgaGt/MgaInv杂合转基因小鼠在E7.5~E12.5之间死亡,主要由于E7.5之前上胚层全能性细胞发育停滞导致[46],所以Mga对于上胚层的正常分化是必不可少的。L3mbtl2缺失会导致多能性ESCs增殖及分化异常,在E7.5左右胚胎因不能正常形成原肠胚而致死,致死原因尚不明确[41]。4 PRC1.6复合体调控雄性性腺发育及精子生成过程中生殖谱系基因的顺次激活
5 PRC1.6复合体是精子发生表观遗传调控网络的重要组成部分
精子发生是一个受到多因素调控的复杂发育过程。表4简要概括了精子发生过程中已知的表观遗传调控机制的大致类型。参与甲基化的各类DNA甲基转移酶(DNMTs)的表达及活性在生殖细胞发育过程中呈现明显的动态变化,这些DNMTs的异常往往直接导致生殖细胞发育异常以及个体雄性不育[70]。胚胎发育及生殖细胞发育过程中呈现动态变化的组蛋白甲基化、乙酰化等修饰对于建立细胞谱系的特异性身份至关重要[71,72]。其他组蛋白修饰,如泛素化、磷酸化以及近几年新发现的组蛋白巴豆酰化等对精子发育也十分重要[73,74]。在精子发育过程中,组装核小体的经典组蛋白在特定发育阶段被不同睾丸特异性组蛋白变体所替换,逐渐减弱DNA和组蛋白之间的作用,为大多数组蛋白在单倍体精子成熟的过程中被鱼精蛋白所替代做准备[75,76]。非编码RNA如piRNA介导的 Piwi基因沉默机制是精子发育及其他情况下抑制可转座元件活性的重要途径,对于精子的正常发育必不可少[77];同时生殖细胞特异性表达的lncRNAs或miRNAs等在精子发育过程中也都起到重要的调控作用[78,79,80,81]。另外,近几年发现RNA的修饰尤其是甲基化修饰可参与RNA的转录后加工、核输出、翻译及RNA稳定性调节等,在造血干细胞分化、精子发生、神经发育等发育过程中发挥重要作用[82,83]。Table 4
表4 精子发育过程中的表观遗传调控方式
Table 4
调控类型 | 分类 | 作用靶点及分子功能举例 | 文献 |
DNA甲基化 | 与原始生殖细胞的增殖状态以及染色体联会等有关 | [84,85] | |
组蛋白修饰 | 甲基化 | H3K4甲基化水平在精原干细胞(SSCs)阶段最高;H3K9和H3K27甲基化水平在SSCs阶段中较低,在减数分裂过程中增加 | [86] |
乙酰化 | 精子形成过程中,组蛋白H4高度乙酰化,有助于置换组蛋白变体 | [87] | |
磷酸化 | 小鼠精子组蛋白磷酸化影响染色质解凝集、减数分裂后染色质折叠和压缩、双线期精原细胞减数分裂等过程,是组蛋白变体和/或鱼精蛋白替换的前提 | [88] | |
泛素化 | E3泛素连接酶RNF8异常导致精子细胞发育后期缺陷 | [89,90] | |
巴豆酰化 | Cdyl敲除小鼠组蛋白巴豆酰化失调和雄性生育能力降低,附睾精子数和精子运动能力降低 | [74] | |
组蛋白变体 | 睾丸H1变体H1t2影响精子形态和生育力 | [91] | |
非编码RNA | piRNA | 在生殖细胞中抑制可转座元件的表达并指导该位置的新生甲基化;MILI和MIWI2在影响piRNA生物合成及指导在不同类型转座元件上DNA新生甲基化方面功能有所区别 | [92, 93] |
miRNA | 调控SSCs自我更新相关转录因子的表达;维持SSCs总数并调控SSCs动态平衡 | [94, 95] | |
lncRNA | 小鼠精原细胞特异性表达的lncRNA033862调控Gfra1基因表达,对于SSCs生存所必需 | [96] | |
RNA甲基化 | mRNA的N6-腺苷甲基化修饰(m6A)确保在小鼠精子发生的不同阶段协调翻译 | [97] |
如表4所示,生殖谱系基因的表达受到非常复杂精密的表观遗传调控网络的调控,PRC1.6复合体作为该表观遗传调控网络的一部分,与该调控网络的其他“版块”之间存在着紧密的交互作用。目前已知PRC1.6复合体与DNA甲基化、组蛋白H3K9me3和H3K27me3等重要的表观遗传修饰存在协同作用,且这些协同互作呈现出明显的动态变化(图1)。例如,在胚胎发育早期E2F6对于减数分裂相关基因的转录抑制主要通过与PRC2协同完成,但不依赖于DNA甲基转移酶DNMT3B[98];然而,在小鼠体细胞中,E2F6则更多地通过招募DNMT3B对靶基因启动子进行甲基化来实现对这些生殖谱系特异性基因表达的有效抑制[99]。有趣的是,虽然小鼠ESCs中E2F6与DNMT3B之间没有协同关系,但MAX与DNA甲基转移酶DNMT1,DNMT3A,DNMT3B之间存在明显的协同作用并抑制生殖谱系相关基因的转录[100]。除了PRC1.6复合体自身包含HP1γ,可实现对转录抑制标记H3K9me3的结合之外,最近有研究揭示MAX与H3K9甲基转移酶SETDB1 可协同介导生殖谱系相关基因的转录抑制,但该机制并不依赖于PRC1.6复合体[100]。另外,在PCGF6 敲除的小鼠ESCs中,piRNA互作蛋白PIWIL1和PIWIL2的表达量均明显上升,意味着PRC1.6复合体通过抑制piRNA调控途径中重要RNA结合蛋白的表达水平来控制其活性[24]。除此之外,PRC1.6复合体组分自身的表达水平受到严密调控,目前这方面的报道相对较少,已知RYBP[101]和E2F6[102]等均可以受到miRNA的调控。

Fig. 1The crosstalk between PRC1.6 and other epigenetic regulators
6 结语与展望

Fig. 2The composition, molecular functions of PRC1.6 complex and the developmental defects originated from its dysregulation
