Structural and functional characteristics of plant PHD domain-containing proteins
植物同源结构域(plant homeodomain, PHD)是锌指结构域家族的一类转录调控因子,其最主要的功能是可以识别各种组蛋白修饰密码,包括组蛋白甲基化和乙酰化等;此外PHD结构域还可以与DNA结合。含有PHD结构域的蛋白,或者本身具有组蛋白修饰酶活性,或者可以与各类组蛋白修饰酶相互作用,还有部分与DNA甲基化相关,具有E3泛素连接酶活性,或者还可以作为染色质重塑因子,以各种不同的作用方式,在植物的生长发育过程中发挥了重要的作用。本文主要综述了结合各种类型组蛋白(包括H3K4me3/0、H3K9me3、H3R2和H3K14ac)以及DNA的PHD结构域的结构特点及其结合特异性、PHD结构域在植物中的进化保守性以及植物中已经发现的含有PHD结构域蛋白的功能及作用机制,为进一步了解该类蛋白在植物生长发育过程中如何发挥作用提供了参考。
Plant homeodomain (PHD) is a class of transcription factor in the Zinc finger domain family. The most important function of which is to recognize various histone modifications, including histone methylation and acetylation, etc. They can also bind to DNA. Proteins with PHD domains, some of which possess histone modification enzyme activity, or can interact with histone modification enzymes, and some are associated with DNA methylation, with E3 ubiquitin ligase activity, or even can be chromatin remodeling factors. As transcriptional regulators, they play an important role in plant growth and development. In this review, we summarize the structural features and substrate binding specificity of PHD domains (including H3K4me3/0, H3K9me3, H3R2, H3K14ac) and DNA, the conservation of plant PHD domain in evolution, the molecular mechanism of known PHD domain-containing proteins in plants, providing a reference for further understanding of the involvement of these proteins during plant growth and development.
植物同源结构域(plant homeodomain, PHD)是真核生物进化过程中一种保守的锌指结构域。PHD结构域发挥功能最主要的方式是识别各类组蛋白修饰,它们对于各类组蛋白修饰的识别也具有一定的特异性,除此之外还可以识别一些DNA序列。含有PHD结构域的蛋白作为转录调控因子,参与生物体的各项生命过程。如在植物中,含有PHD结构域的蛋白参与了包括胚胎分生组织萌发、根系发育、发芽、开花、减数分裂,以及减数分裂后的花粉发育等重要过程,对植物的生长发育具有十分重要的作用[1]。
关于植物中含有PHD结构域的蛋白,Mouriz等[1]按照其功能分类进行了综述,本文则是从PHD结构域与各类组蛋白翻译后修饰的结合特异性、PHD结构域在植物中的进化保守性,以及各类PHD结构域蛋白的作用机制方面进行论述,主要针对拟南芥(Arabidopsis thaliana)中PHD蛋白的作用机制进行解析,为进一步了解其如何发挥调控功能提供参考。
1 PHD的结合特异性
组蛋白翻译后修饰主要包括甲基化、乙酰化等多种形式,这些翻译后修饰通过招募与组蛋白结合的效应蛋白来调控下游基因的表达。其中,识别组蛋白甲基化修饰的结构域主要为PHD结构域和Royal家族的Chromo、Tudor、PWWP (Pro-Trp-Trp- Pro)和MBT (malignant brain tumour)结构域等;而识别组蛋白乙酰化的主要为 Bromo、DPF (double PHD finger)和YEATS结构域[2]。除此之外,对于DNA的识别主要有螺旋-转角-螺旋(Helix-Turn-Helix, HTH)、锌指结构、亮氨酸拉链(basic Leucine zipper, bZIP)和碱性-螺旋-环-螺旋(basic Helix- Loop-Helix, bHLH)结构域等,而PHD结构域就属于锌指结构域家族。PHD结构域是一类比较小的蛋白结构域,由50~80个氨基酸残基组成,其不同家族成员序列表现出较低的氨基酸相似性,但该结构域可以折叠成高度保守的球状结构[3]。保守的PHD折叠,包含了一对反向平行的双链β-sheet和一个C端的α-helix (不是所有的PHD都有),2个锌原子被固定在Cys4-His-Cys3基序上,形成一个“cross-brace”的拓扑结构[4]。
PHD结构域最主要功能是与各种组蛋白修饰特异结合,作为组蛋白密码识别器来调控下游基因的表达。研究发现,PHD结构域可以识别的组蛋白密码包括H3K4me3/2/0[5,6]、H3K9me3[7,8,9]、H3K36[10]、H3R2me2/0[11,12]、H3K14ac以及H4乙酰化等[13,14]。研究发现,PHD结构域通常和其他识别模块(reader modules)成对出现,例如与Bromo、Chromo、Tudor、PWWP、MBD、SRA或者PHD finger本身,一起作为一个组合来发挥作用[15]。模块配对可以显著地提升PHD的识别能力,提高与组蛋白之间结合的亲和力和特异性,从而提供新的调控能力。例如BPTF通过PHD-Bromo结构域识别“H3K4me3+H4K16ac”[16]。
1.1 识别H3K4me3
PHD与组蛋白H3K4me3的结合通常依靠一个包含2~4个芳香族残基的笼子(aromatic cage)。在这个笼子中,K4me3由范德华力和π键稳定[5](图1A)。不同的PHD中aromatic cage氨基酸组成不一样,但是位于序列的相似位置,其中一个色氨酸(Trp)残基,在位点和残基类型上都完全保守,是识别结合甲基化赖氨酸的PHD中最特异的残基[17]。图1

A:ING2的PHD结构域结合H3k4me3 (2g6q[23]);B:BHC80的PHD结构域结合未修饰的H3 (2puy[19]);C:ATRX的PHD结构域识别H3K9me3 (3ql9[24]);D:BPTF的PHD结构域结合H3K4和H3R2 (2fuu[25]);E:DPF3b的PHD1识别乙酰化修饰(5i3l[26],黄色代表结合K14ac的疏水性口袋);F:BRPF2的PHD2结构域(2lq6[27])。图中所用模型来自PDB数据库(Protein Data Bank),晶体结构展示软件为PyMOL (version 2.4)。
Fig. 1The crystal structures of PHD domain
1.2 识别未修饰的H3
1.3 识别H3K9me3
ATRX通过其ADD结构域识别H3K9me3。ADD (ATRX-DNMT3-DNMT3L)结构域富含半胱氨酸残基,是4个不同的蛋白ATRX、DNMT3A、DNMT3B和DNMT3L共同拥有的结构。ATRX的ADD结构域由1个N端类GATA锌指(GATA-like finger)、1个PHD结构域、1个长的C端螺旋(C-terminal helix),通过广泛的疏水性相互作用组装在一起,形成一个球状的结构域[21]。在ATRX的ADD结构域识别K9me3的过程中,涉及到一个非典型的极性口袋(polar pocket),该口袋只含有一个芳香族的酪氨酸(Tyr),并且富含极性的氨基酸(polar residues)[8]。除了分子表面的范德华力以外,K9me3的识别还涉及到了芳香族Tyr203与甲基化赖氨酸之间的阳离子π作用,以及Tyr203、Asp207、Gln219和Ala224与甲基化的赖氨酸之间的非传统的C-H…O氢键的相互作用[21](图1C)。
1.4 识别H3R2
在许多蛋白(例如BPTF[5]、ING4[22]和UHRF[11]等)中,H3K4和H3R2的识别发生在同一个PHD的不同位点。在这个过程中,H3R2的侧链和H3K4me3分别进入到2个相邻的识别口袋,这两个口袋通过一个保守的Trp残基分隔开(图1D)。其中K4me3的结合口袋是芳香族笼子,通过π键,疏水相互作用和范德华力,稳定PHD与三甲基集团之间的结合。而R2口袋通常是酸性的,通过Asp、Glu和Gln等残基与R2之间形成盐桥或者氢键来进行配对[5]。UHRF1的PHD同样依赖于Asp347和Asp350与H3R2之间形成氢键进行结合[11]。1.5 识别乙酰化
1.6 识别DNA
BRPF1/2[27]中的PHD可以结合DNA,它们都拥有2个PHD结构域,中间由一个锌原子连接。BRPF1/2的PHD1对于未修饰的H3有高度的特异性。PHD2呈鞍状结构,可以与DNA相互作用,与一般的PHD结构域不同,PHD2具有2个与锌离子配位的组氨酸残基,其序列特征为C4HC2H,并且还含有一个额外的β3-β4发夹结构(图1F)。PHD2对于DNA的结合能力,可能是由于PHD结构域中具有静电势(electrostatic potential)的表面的作用[27]。2 植物中PHD蛋白功能及作用机制
染色质对基因的转录调控主要依赖于两种作用:一种是激活因子,主要依赖于组蛋白的乙酰化修饰,使DNA结构变得松散,有利于RNA聚合酶等转录起始因子与DNA的结合;另一种是抑制因子,它们可以通过对组蛋白进行抑制型的甲基化修饰,以招募去乙酰化酶,去掉激活类修饰,进而增强染色质的屏障作用。含有PHD结构域的蛋白,以两种形式参与转录调控作用,或者本身即拥有组蛋白修饰酶活性,或者可以与各种组蛋白修饰酶相互作用。还有部分PHD结构域蛋白与DNA甲基化相关,具有E3泛素连接酶活性,或者可以作为染色质重塑因子,对各种植物的生长发育以及应对各种逆境胁迫过程着重要作用。PHD结构域蛋白在植物中广泛存在。在植物基因组网站Phytozome12中搜索可以发现,已注释的拟南芥PHD结构域基因有82个,水稻(Oryza sativa L.)有84个,无油樟(Amborella trichopoda)有67个。以拟南芥MMD1的同源蛋白构建系统发育树,发现该PHD结构域蛋白在植物中广泛存在,在十字花科和豆科中的同源蛋白数量最多,在蔷薇科、芸香科、杨柳科、番木瓜科等科目中也有存在,说明该蛋白在植物进化过程中具有保守性,并且可能在多种植物的生长发育过程中发挥了重要的作用(图2)。

图中展示了部分拟南芥MMD1的同源蛋白的进化关系(序列来源于植物基因组网站Phytozome12)。使用IQ-TREE (version 1.6.12),以最大似然法(Maximum Likelihood, ML)构建系统发育树,选用的构树模型为JTT+R6,以葫芦藓科、泥炭藓科和卷柏科的MMD1同源蛋白定根。图中数字为分支的自展值,星号“*”代表自展值为100。拟南芥的MMD1分支标为红色,睡莲的MMD1同源蛋白分支标为蓝色,无油樟的MMD1同源蛋白分支标为绿色。图中标注了几个主要的科目,分别为豆科(粉色)、蔷薇科(绿色)、杨柳科(紫色)、锦葵科(黄色)、十字花科(蓝色)和番木瓜科(橙色)。
Fig. 2Phylogenetic tree of the PHD domain protein MMD1 in plants

黑色表示同源性为100%,粉色表示同源性为75%,蓝色表示同源性为50%。可以看出PHD结构域保守的C4HC3氨基酸残基序列特征。图中各蛋白对应的TAIR基因号分别为:ATX1 (At2g31650)、TX2 (At1g05830)、ATX3 (At3g61740)、ATX4 (At4g27910)、ATX5 (At5g53430)、ATXR5 (At5g09790)、ATXR6 (At5g24330)、ATORC1A (At4g14700)、ATORC1B (At4g12620)、AL1 (At5g05610)、AL2 (At3g11200)、AL3 (At3g42790)、AL4 (At5g26210)、AL5 (At5g20510)、AL6 (At2g02470)、AL7 (At1g14510)、CHR4 (At5g44800)、CHR6 (At2g25170)、EBS (At4g22140)、HAT3.1 (At3g19510)、ING1 (At3g24010)、ING2 (At1g54390)、MMD1 (At1g66170)、MBD9 (At3g01460)、MS1 (At5g22260)、OBERON1 (At3g07780)、OBERON2 (At5g48160)、PTM (At5g35210)、PRHA (At4g29940)、ROS4 (At3g14980)、SHL1 (At4g39100)、SIZ1 (At5g60410)、SCC2 (At5g15540)、VIM1 (At1g57820)、VIM2 (At1g66050)、VIM3 (At5g39550)、VIM4 (At1g66040)、VIM5 (At1g57800)、VIN3 (At5g57380)。
Fig. 3Sequence alignment of PHD domains in Arabidopsis thaliana
Table 1
Table 1
分类依据 | 蛋白名称 | 其他包含的结构域 | 识别的配体 | 作用特点 | 在植物中的功能 | 参考文献 | |
本身具有组蛋白修饰酶活性 | 本身具有组蛋白甲基转移酶活性 | ATX1 | ePHD结构域、SET结构域 | H3K4me3 | 使H3K4三甲基化 | 根系、叶片和花器官的发育以及一些逆境胁迫基因的转录调控 | [29~31] |
ATX2 | ePHD结构域、SET结构域 | H3K4me2 | 使H3K4三甲基化 | 与ATX1拥有相似的序列,但是在调控基因转录方面具有非冗余的功能 | [32] | ||
ATX3/4/5 | 编码了一个可能的H3K4甲基转移酶 | H3K4me2/3 | 是迄今为止在拟南芥基因组中发现的具有H3K4me2甲基转移酶活性的蛋白 | ATX3/4/5具有冗余的功能,可以调控一系列作用于营养生长和生殖生长的基因 | [33,34] | ||
ATXR | SET结构域 | H3K4me0 | PHD结构域作用于SET结构域结合辅因子以及促进H3K27me1的过程 | 作用于植物中染色质结构、基因沉默和异染色质的DNA复制过程 | [35] | ||
本身具有组蛋白乙酰基转移酶活性 | IDM1/ ROS4 | MBD结构域、 乙酰基转移酶结构域 | H3K4me0 | PHD结构域影响IDM1乙酰转移酶的活性 | 对于DNA去甲基化具有负面调控,阻止高度同源的多拷贝基因和其他重复序列的DNA高度甲基化 | [36,37] | |
与组蛋白修饰酶相互作用 | 与组蛋白去乙酰化酶相互作用 | EBS/SHL | BAH结构域 | H3K4me2/3 | PHD结构域结合HDA6 | 作用于开花调控和种子 休眠 | [38,39] |
与组蛋白甲基转移酶相互作用 | MMD1 | MMD结构域 | H3K4me2/3 | 与组蛋白去甲基化酶JMJ16相互作用 | 植物减数分裂,调控浓缩等过程的蛋白 | [40~42] | |
AL | 除AL3以外所有AL蛋白都结合H3K4me2/3 | 是植物中特有的一类转录因子,PHD结构域与PRC1蛋白相互作用,招募PRC2从而积累H3K27me3 | 调控植物的生长发育,以及应对低温、干旱、高盐等非生物胁迫 | [43~46] | |||
VIN3 | H3K9me2和H3K4me2 | PHD结构域与PRC2的相互作用,PHD-PRC2复合体使H3K27me3水平升高 | 作用于春化作用所需的FLC表观遗传学基因沉默过程 | [47~51] | |||
与DNA甲基化相关 | 结合甲基化的DNA | MBD9 | MBD结构域 Bromo结构域 | DNA甲基化 | MBD结构域结合甲基化的DNA,Bromo结构域可能发挥了催化组蛋白乙酰化反应的作用 | 通过DNA甲基化和组蛋白乙酰基化,分别间接和直接调控基因的表达,影响拟南芥的生长发育 | [52,53] |
ORTH | RING结构域、SRA结构域 | DNA甲基化 | SRA结构域作用于结合甲基化的DNA | 作用于调控DNA甲基化 | [54,55] | ||
具有E3泛素连接酶 活性 | SIZ1 | RING、SAP、SXS、PINIT 结构域 | H3R2me2和H3K4me3 | PHD结构域与染色质重塑复合体有关,也可能作为一个E3泛素连接酶 | 通过调控基因的表达,作用于植物的生长发育以及应对干旱、低盐的胁迫的过程 | [56~58] | |
是染色质重塑因子 | CHR4 | Chromodomain结构域 | 是依赖于ATP的染色质重塑因子 | 植物的生长发育和DNA损伤应答 | [59,60] | ||
是染色质重塑因子 | PKL | Chromodomain结构域 | 是依赖于ATP的染色质重塑因子 | DNA损伤应答,以及调控植物生长和响应胁迫基因的表达 | [61,62] | ||
与bHLH型的转录因子相互作用 | OBE | 可能结合 bHLH型的转录因子 | 促进依赖于转录因子MP的基因的激活表达 | 在生长素介导的调控发育过程中,作用于根系和顶端分生组织的维持和建立 | [63~65] | ||
其他 | SCC2 | 在陆地植物有PHD,动物和 真菌中没有 | 未修饰及甲基化的H3、H4和H2A | 作用于减数分裂过程,介导染色质黏连蛋白cohesin的招募过程 | [66] | ||
ORC | 只有植物的ORC1中含有PHD结构域 | H3K4me3,更倾向于结合未修饰的H3 | 通过PHD结构域识别靶基因启动子区域的H3K4me3来激活基因的转录表达 | 作用于DNA复制的起始,在细胞周期中调控转录 过程 | [67,68] | ||
MS1 | 调控作用于花粉外壁形成,花粉细胞溶质和绒毡层的基因的表达,对于减数分裂后的花粉和绒毡层的发育具有重要作用 | [69] | |||||
PTM | DDT 结构域 | H3K4me3 | 结合到ABI4的启动子上,以激活ABI4基因的表达。 | 结合叶绿体被膜的转录调控因子,作用于将叶绿体信号传递到细胞膜 | [70] |
2.1 本身具有组蛋白修饰酶活性
2.1.1 本身具有组蛋白甲基转移酶活性拟南芥ATX (ARABIDOPSIS TRITHORAX-LIKE)基因分为两个亚家族,分别为ATX1/2亚家族和ATX3/4/5亚家族。ATX1和ATX2蛋白包含ePHD结构域(extended plant homeodomain)和SET结构域。ePHD结构域包含1个N端pre-PHD (C2HC Zinc finger)、1个长的连接区域和1个PHD (C4HC3 Zinc finger),ePHD结构域可以结合双链DNA但是不能结合组蛋白。而SET结构域使ATX1/2具有甲基转移酶活性。ATX1作用于H3K4me3,而ATX2作用于H3K4me2,这两个组蛋白修饰都是活跃转录的标志。
ATX1参与根系、叶片和花器官的发育以及一些逆境胁迫基因的转录调控[29]。研究表明,ATX1在调控目标基因表达时具有两种不同的作用:一种是作为共同激活子参与前起始复合物PIC的形成,招募RNA聚合酶II和TATA结合蛋白;另一种是被磷酸化的RNA聚合酶II招募到转录起始位点下游行使H3K4三甲基化作用[31]。ATX1催化的H3K4me3不作用于转录起始,而是作用于活跃转录的延伸[30]。与其他的PHD结构域结合H3K4me3的功能不同,ATX1的ePHD结构域通过结合PI5P (phosphatidylinositol 5-phosphate),影响ATX1的亚细胞定位,从而调控一些特异依赖于ATX1的基因的表达[71]。
ATXR5/6 (ARABIDOPSIS TRITHORAX-RELATED PROTEIN 5/6)是拟南芥中另一对含有PHD结构域的蛋白,具有H3K27me1甲基转移酶活性。ATXR5/6参与植物中染色质结构、基因沉默和异染色质的DNA复制过程[72]。atxr5和atxr6突变体表现出异染色质成分(heterochromatic elements)、转座子和重复序列的转录激活。ATXR5/6的PHD结构域可以识别未甲基化的H3K4,参与SET结构域结合辅因子以及促进H3K27me1的过程[35]。
除此之外,在酵母和人类的PHD蛋白中也有类似的例子。酿酒酵母(Saccharomyces cerevisiae)的Spp1是一个含有PHD结构域的蛋白,同时也是组蛋白H3K4甲基转移酶Set1(COMPASS)复合体的成员。Spp1的PHD结构域结合组蛋白H3K4,并且可以调控甲基转移酶COMPASS的活性[73]。在人类中的一些蛋白,包括PHF2、PHF8和KIAA1718等,除了包含PHD结构域以外,还包含1个具有组蛋白去甲基化酶活性的JmjC (Jumonji-C)结构域。这些蛋白的PHD结构域,在活跃转录基因的启动子区域,与含有H3K4me3的核小体结合。而JmjC结构域则可以移除与转录抑制相关的组蛋白H3K9、H3K27的单、双甲基化以及H4K20的单甲基化。这样的双重作用,确保了基因在被转录激活之后,组蛋白转录抑制标记能够恰当地移除[74]。
2.1.2 本身具有组蛋白乙酰基转移酶活性
IDM1 (INCREASED DNA METHYLATION1)是一个组蛋白H3乙酰基转移酶,具有1个MBD结构域(methyl-CpG-binding domain)、1个PHD结构域和1个组蛋白乙酰基转移酶结构域[37]。MBD结构域参与识别甲基化的DNA;PHD结构域可以识别未甲基化的H3K4。IDM1对于DNA甲基化具有负面调控,
在酿酒酵母中,Yng1蛋白包含PHD finger结构域,并且该蛋白是NuA3 HAT复合体(组蛋白乙酰基转移酶)的组成部分。Yng1通过PHD结构域识别H3K4me3,增强了NuA3 HAT复合体对组蛋白H3底物作用的活性,使H3K14乙酰化,从而激活基因的表达[76]。
2.2 与组蛋白修饰酶相互作用
2.2.1 与组蛋白去乙酰化酶相互作用SHL (SHORT LIFE)和EBS (EARLY BOLTING IN SHORT DAYS)是拟南芥中的两个旁系同源基因,都包含PHD结构域和BAH (bromo-adjacent homology)结构域,参与染色质介导的开花抑制和种子休眠。研究发现,SHL的过量表达还会引起植物育性的降低[77]。SHL和EBS在调控开花时间上发挥重要作用,主要通过其PHD结构域识别H3K4me2和H3K4me3,分别结合到SOC1和FT (SOC1和FT都是开花调节基因[78])的调控区域。这两种PHD蛋白通过结合组蛋白去乙酰化酶HDA6 (HISTONE DEACETYLASE 6),阻止高水平的H3乙酰化,维持了SOC1和FT的不活跃的染色质构象[79]。EBS与HDA6的相互作用,说明组蛋白甲基化和乙酰化对于开花时间的精确控制是一个关键的因素。另外,在EBS和SHL参与的种子休眠调控的过程中,组蛋白甲基化和乙酰化修饰共同协作对于种子休眠的精确调控也十分重要[39]。SHL和EBS在植物中高度保守,但是在其他真核生物中却没有,说明这些基因介导的调控方式是植物中的一种特有的机制。
2.2.2 与组蛋白甲基转移酶相互作用
拟南芥的MMD1 (MALE MEIOCYTE DEATH 1)对于植物减数分裂过程十分重要[40]。其PHD结构可以识别H3K4me2/3,通过结合目标基因启动子区域的组蛋白标记,招募其他的调控因子到相同的位点,从而调控基因的表达[41]。最近研究发现,MMD1拥有另一个保守的MMD结构域,其与JMJ16 (组蛋白去甲基化酶,具有H3K4me3去甲基酶活性[80])的FYR-C结构域相互作用,从而拓展了JMJ16的H3K9me3去甲基酶活性,使目标基因启动子区域的抑制基因表达的组蛋白修饰减少,从而促进了基因表达,包括编码浓缩蛋白CAP-D3的基因表达。在这个过程中,PHD结构域通过结合H3K4me3,使JMJ16能够准确定位到基因的启动子区域[42]。
拟南芥中AL (ALFIN-LIKE)蛋白是植物中特有的一类转录因子,对于植物的生长发育,以及应对低温、干旱、高盐等非生物胁迫具有重要的调控作用[44,46]。AL蛋白家族包括AL1、AL2、AL3、AL4、AL5、AL6和AL7,除AL3以外都能通过PHD结构域与H3K4me3和H3K4me2结合来调控目标基因的表达[45]。在种子萌发时,AL蛋白通过与PRC1蛋白相互作用,招募PRC2 (一个保守的H3K27甲基转移酶[81])从而促进H3K27me3的积累,将种子发育相关基因的活跃转录的染色质状态转变为不活跃状态,对于种子萌发和早期的幼苗生长十分重要[43]。
植物的春化作用中所需的FLC表观遗传学基因沉默过程,需要PRC2和2个PHD finger蛋白—VRN5和VIN3的参与。VIN3蛋白的PHD结构域与PRC2的相互作用被认为是PcG家族调控基因表达的保守机制[82],PHD结构域蛋白在增强PRC2活性上发挥了重要作用。高水平的H3K27me3能够稳定基因的沉默状态,PHD-PRC2复合体使FLC基因的H3K27me3水平升高,从而使其保持沉默[82]。
类似的调控过程在果蝇(Drosophila melanogaster)和哺乳动物中也存在。哺乳动物的PHF1蛋白拥有1个N端Tudor结构域和2个PHD结构域,是PRC2的组成部分。PHF1包含两个PHD finger结构域的区域,可以直接与PRC2的催化亚基EZH2 (甲基转移酶活性)相互作用[83]。在果蝇中,Pcl (PHF1的同源基因)和E(z) (EZH2的同源基因)也可以互相结合[84],说明PHF1的PHD finger功能的保守性[85]。此外,研究发现在没有H3K36me3的情况下,PHF1可以增强PRC2的甲基转移酶活性,这可能是由于PHD finger结构域与其他组蛋白翻译后修饰(例如未修饰的H3或H3K4me3,与H3K27me3没有空间冲突)相互作用[86]。
2.3 与DNA甲基化相关
AtMBD9 (METHYL-CPG BINDING DOMAIN 9)蛋白拥有5个与染色质结构修饰调控基因表达相关的结构域,分别为1个MBD结构域、2个PHD结构域、1个Bromo结构域、1个FYRN结构域(N-terminal phenylalanine/tyrosine-rich domain)和1个FYR结构域(C-terminal phenylalanine/tyrosine-rich domain)[53]。AtMBD9是一个转录调控因子,通过DNA甲基化和组蛋白乙酰基化这两种表观遗传途径,分别间接和直接调控基因的表达,从而影响拟南芥的生长发育[52]。研究表明,AtMBD9突变体出现DNA高度甲基化,并且AtMBD9通过调控H4乙酰化来影响开花调节基因FLC的表达,从而调节开花时间,其突变体表现出早开花和根系分支增多的表型[53]。MBD结构域可以结合甲基化的DNA,Bromo结构域可能发挥了催化组蛋白乙酰化反应的作用,因为该结构域在其他组蛋白乙酰基转移酶中经常存在[87],而PHD结构域的功能还没有具体的研究。拟南芥ORTH/VIM (ORTHRUS/VARIANT IN METHYLATION)基因家族有6个成员,是哺乳动物UHRF(UBIQUITIN-LIKE CONTAINING, PHD, RING FINGER)的直系同源基因群[55]。ORTH1-ORTH5编码的蛋白拥有1个PHD结构域、2个RING结构域和1个SRA(SET RING associated)结构域。研究表明,ORTH蛋白在体外拥有E3泛素连接酶活性,并且可以介导DNA甲基化。而第6个成员ORL1/VIM6 (ORTH LIKE-1/VARIANT IN METHYLATION6)只有1个RING结构域和1个SRA结构域,其SRA结构域作用于结合甲基化的DNA[88]。而在人的UHRF1中,PHD和SRA结构域共同作用,使其结合到甲基化的H3K9上[89]。
正确的甲基化对于基因调控十分重要。MET1 (DNA METHYLTRANSFERASE 1)作用于DNA的CG甲基化。研究发现,ORTH/VIM可以通过识别MET1建立的CG甲基化在相应的位点积累,成为MET1介导的DNA甲基化途径中关键的组成部分[54]。
此外,ORTH2/VIM1的PHD结构域可以与NtSET (SU(VAR)3-9蛋白,烟草(Nicotiana tabacum)中的一种甲基转移酶)相互作用[90]。因此,该PHD结构域是一个蛋白互作结构域,可能通过招募H3K9甲基转移酶,在DNA甲基化和H3K9组蛋白修饰之间建立联系。
在VIM突变体的靶基因上,活跃的染色质标记如H3K4me3和H3K9/K14ac明显增加,而抑制的染色质标记如H3K9me2和H3K27me3减少。此外,VIM的不足会引起异染色质染色中心(chromocenters) H3K9me2的明显减少[54]。因此,VIM蛋白通过调控激活和抑制的组蛋白修饰,使靶基因沉默,在协调组蛋白修饰和DNA甲基化状态的转变方面发挥了重要作用。
2.4 具有E3泛素连接酶活性
类泛素化(SUMOylation)在调控真核生物生长发育的多个方面发挥了重要的作用。Siz/PISA家族是一类具有SP-RING特征结构域的SUMO E3泛素连接酶,具有保守的特征结构域,包括SAP、PINIT和PHD finger结构域(只有植物成员具有PHD结构域,动物和酵母中没有)[91]。拟南芥AtSIZ1通过调控基因的表达,参与植物的生长发育以及应对干旱、低盐的胁迫的过程[57]。AtSIZ1包含了5个结构域,分别是SAP结构域、Siz/PIAS-RING结构域(作用于发挥SUMO E3连接酶活性)、PINIT结构域、SXS结构域(促进与SUMO的结合)以及PHD结构域。研究人员推测其PHD结构域与染色质重塑复合体有关,或者可能具有E3泛素连接酶活性[58]。
2.5 是染色质重塑因子
依赖于ATP的染色质重塑因子主要包括:SWI/ SNF (SWITCH/SUCROSE NON-FERMENTING)、ISWI (IMITATION SWITCH)、INO80 (INOSITOL 80)和CHD (CHROMODOMAIN-HELICASE-DNA BINDING)。其中CHD是依赖于ATP的染色质重塑因子,在调控基因表达方面具有重要作用。CHD蛋白可以分为3个亚家族,分别为Chd1亚家族(也称为CHD1蛋白)、Mi-2亚家族(也称为CHD3蛋白)和CHD7亚家族[61]。拟南芥中Mi-2亚家族有3个成员(PKL、CHR4和CHR7),水稻中也有3个(CHR207、CHR729和CHR703)。这些蛋白除了CHR7以外,都拥有1个PHD结构域和2个chromo结构域。拟南芥PKL和CHR4作用于DNA损伤应答[59],与水稻CHR729一样在调控植物生长和响应胁迫基因的表达中发挥重要的作用[60]。
PKL对一些基因的表达具有抑制作用,这些基因位点上有H3K27me3富集,推测该抑制作用与H3K27me3有关。PKL还可以激活一些基因的表达,它出现在例如ACT7 (ACTIN7)和UBQ10 (POLYUBIQUITIN 10)这类不需要依赖PKL表达的基因的启动子区域,并且促进普遍的染色质重塑过程[62]。CHR7没有PHD结构域,但是与PKL在激活基因表达上拥有重叠的功能,这说明PHD结构域可能对激活转录表达是不必要的。
2.6 与bHLH型的转录因子相互作用
TIP3 (TDR interacting protein 3)是水稻中的一种雄性不育基因,包含PHD结构域,主要于花药发育期间在绒毡层和小孢子中表达[93]。TDR是一个bHLH型的转录因子,通过直接激活其靶基因的表达来调控绒毡层的发育和退化、脂质的代谢以及花粉的形成等过程[93]。研究发现,TIP3可以作为转录激活因子与TDR相互作用,从而影响与绒毡层程序性死亡和花粉壁发育相关基因的表达;并且酵母双杂交实验表明,TIP3的PHD结构域可以在在酵母中与3个bHLH型的转录因子TDR、EAT1和TIP2相互作用[93]。因此,含有PHD结构域的蛋白还可能是通过不依赖于组蛋白修饰的方式,直接与转录因子结合,将转录因子招募到基因的启动子区域,从而发挥基因表达调控的功能。
3 结语与展望

Fig. 4Schematic diagram of the role of PHD domain proteins in Arabidopsis thaliana
基因的转录调控与各种染色质修饰以及DNA甲基化密切相关。一般认为DNA甲基化与转录抑制相关,组蛋白乙酰化促进转录激活,而组蛋白甲基化则通过招募各种下游效应蛋白来发挥激活(H3K4me)或抑制(H3K9me)转录的修饰效应[94]。PHD结构域由于不同的氨基酸序列组成和结构特异性,对于不同的组蛋白乙酰化和甲基化修饰的结合也具有特定的偏好性。因此,对于PHD结构域结合特异性的精准研究,将会对其如何发挥转录调控功能具有十分重要的指示作用。目前已有研究在PHD结构域的结合特异性的基础上,开发相应的化学探针(chemical probes)以干扰其与组蛋白H3之间的相互作用[95],以及通过一些小分子抑制子(small molecule inhibitors)来竞争结合PHD结构域[96]。此外,开发具有E3泛素连接酶活性的PHD结构域配体以降解PHD蛋白也可能成为未来的一种研究思路[95]。
