删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

亚麻纤维素合酶超基因家族的生物信息学及表达分析

本站小编 Free考研考试/2021-12-26

袁红梅, 郭文栋, 赵丽娟, 于莹, 吴建忠, 张利国, 程莉莉, 赵东升, 吴广文, 关凤芝. 亚麻纤维素合酶超基因家族的生物信息学及表达分析[J]. , 2016, 49(23): 4656-4668 https://doi.org/10.3864/j.issn.0578-1752.2016.23.018
YUAN Hong-mei, GUO Wen-dong, ZHAO Li-juan, YU Ying, WU Jian-zhong, ZHANG Li-guo, CHENG Li-li, ZHAO Dong-sheng, WU Guang-wen, GUAN Feng-zhi. Bioinformatics and Expression Analysis of the Cellulose Synthase Supergene Family in Flax[J]. Scientia Acricultura Sinica, 2016, 49(23): 4656-4668 https://doi.org/10.3864/j.issn.0578-1752.2016.23.018

0 引言

【研究意义】纤维素、半纤维素是地球上最丰富和重要的可再生资源。纤维素是由D-葡萄糖通过β-1,4糖苷键连接而成的一种线性葡聚糖,而半纤维素主要包含木聚糖、葡甘露聚糖和半乳葡甘露聚糖等,它们共同组成了细胞壁的主要骨架结构。深入研究纤维植物中纤维素的生物合成过程,挖掘控制纤维发育的重要基因,进而通过遗传操作改良植物的纤维品质和产量具有重要的理论和实践意义。【前人研究进展】纤维素、半纤维素作为细胞壁的重要组成部分,对其生物合成的研究具有重要意义。纤维素合酶超基因家族包括纤维素合酶(cellulose synthase,CesA)和纤维素合酶类蛋白(cellulose_synthase_like protein,Csl蛋白),是纤维形成的关键酶,分别参与纤维素和半纤维的合成[1-3]。目前已从40多种植物中克隆了1 400多个CesA的相关序列[4-5]。在拟南芥(Arabidopsis thaliana)及毛果杨(Populus trichocarpa)中分别鉴定出10个和18个CesA。在四倍体陆地棉(Gossypium barbadense)中共鉴定出37个CesA,其中,19个来自At亚基因组,18个来自Dt亚基因组,而在二倍体雷蒙德氏棉(Gossypium raimondii)中鉴定出15个CesA[6]。在拟南芥中,AtCesA1、AtCesA3、AtCesA6组成纤维素合酶复合体,参与初生细胞壁合成,AtCesA4、AtCesA7、AtCesA8则参与次生细胞壁合成[7-13]。AtCesA2、AtCesA5、AtCesA9被认为是AtCesA6的同源蛋白,这些蛋白彼此之间存在功能冗余。在棉花中,GhCesA3GhCesA5GhCesA6GhCesA9GhCesA10参与初生细胞壁合成,GhCesA1GhCesA2GhCesA7GhCesA8参与次生细胞壁合成[14]。杨树木质部细胞膜上至少存在2种纤维素合酶复合体,复合体Ⅰ由PtCesA4、PtCesA7、PtCesA8、PtCesA17、PtCesA18组成,参与细胞次生壁的合成;复合体Ⅱ由PtCesA3、PtCesA10、PtCesA11、PtCesA13、PtCesA15、PtCesA16组成,参与细胞初生壁和次生壁的合成[15]。除CesA蛋白之外,植物体内还有Csl蛋白,该类酶则在高尔基体体腔中介导半纤维素的合成[16-17]。依据序列结构特征的不同,Csl蛋白被分为9个亚族,分别为CslA—CslH及CslJ,其中CslF、CslH和CslJ只存在于单子叶植物中[18-19]。CslA催化(1,4)-b-D-甘露聚糖的合成,CslC参与催化木葡聚糖骨架的形成,CslD则在多糖(木聚糖和半乳醛聚糖)的合成中起作用。但目前,CslB、CslE和CslG的生物学功能尚不清楚。亚麻(Linum usitatissimum L.)是一种重要的韧皮纤维作物。其韧皮纤维细胞的发育主要经历2个阶段:细胞伸长和次生细胞壁加厚,这两个时期互不重叠,分别决定了韧皮纤维的长度和强度,次生细胞壁加厚与韧皮纤维的品质密切相关。韧皮纤维细胞发育是个复杂的过程,受很多基因表达调控影响,如CesASusyKor等,其中,CesA是催化纤维素合成的关键酶之一,一直是植物纤维素合成研究领域中的一个热点。但亚麻纤维发育的分子生物学基础相对滞后。随着亚麻基因组测序计划的完成,生物信息学、生物化学、分子生物学和遗传学等研究方法的不断完善,亚麻纤维发育的分子生物学基础才得以不断推进。笔者前期研究发现,现蕾期喷施适当浓度的植物激素油菜素内酯(brassinosteroids,BR)及芸苔素吡咯(brassinazole,Brz)能够提高亚麻的纤维产量和耐盐性。为深入研究BR、Brz调控亚麻纤维发育和提高耐盐性的分子机制,利用Solexa技术,比较分析了BR、NaCl、Brz处理对亚麻现蕾期茎部组织基因转录表达谱的影响。结果发现,差异基因中存在大量细胞壁合成相关基因,这些基因涉及纤维素合成、木质素合成、细胞壁结构、细胞壁多糖合成代谢等。【本研究切入点】尽管对纤维素合酶超基因家族的研究有了较大进展,但大多局限于拟南芥、棉花、杨树等模式植物中,亚麻中大多CesA、Csl成员尚未得到分离和鉴定。随着亚麻基因组序列的公布,有必要对亚麻纤维素合酶超家族基因进行全基因组挖掘和全面、系统分析。【拟解决的关键问题】本研究采用生物信息学方法,从基因组水平对亚麻纤维素合酶超家族基因的理化特性、定位、基因结构、进化等进行阐释,并根据Solexa表达谱数据对CesA/Csl的表达特性进行分析,为亚麻纤维发育的机理研究奠定基础。

1 材料与方法

1.1 植物材料

材料为高纤亚麻品种Diana,在不同时期播种于黑龙江省农业科学院民主园区试验田,以期在同一时期获得不同发育阶段的亚麻植株。选择苗期植株喷施清水;同时,选择现蕾期植株,分别喷施清水(对照CK)、BR(0.2 mg·L-1)和Brz(1 mg·L-1)及根灌NaCl(300 mmol·L-1)等4种处理。处理12 h后分别选择生长一致的植株,取其茎中部1/3,每个处理分别取3株,3次生物学重复。取材后将样品置于液氮中迅速冷冻,-80℃保存,用于RNA的提取及Solexa数字表达谱分析。

1.2 亚麻CesA/Csl的鉴定

根据拟南芥AtCesA及AtCsl蛋白氨基酸序列,在Phytozome数据库中进行BLASTP比对,搜索亚麻同源序列。利用NCBI CDD(http://www.ncbi.nlm.nih. gov/Structure/cdd/)在线工具对获得的基因是否含有Cellulose-synt保守结构域进行确认。亚麻CesA/Csl基因家族蛋白序列下载自phytozome数据库(http:// phytozome.jgi.doe.gov/),拟南芥CesA/Csl蛋白序列下载自TAIR(http://www.arabiodpsis.org)。

1.3 亚麻CesA/Csl的特性分析

通过phytozome数据库查询CesA/Csl的Scaffold位点信息,利用ExPASy Proteomics Server(http://web. expasy.org/protparam/)预测蛋白氨基酸序列的基本信息,包括蛋白质的长度、分子量、等电点。利用TMHMM Server V2.0(http://www.cbs.dtu.dk/services/ TMHMM/)进行蛋白跨膜螺旋预测。通过在线软件WoLF PSORT(http://wolfpsort.or)进行亚细胞定位分析。

1.4 亚麻CesA/Csl系统发育树的构建

使用Clustal X软件对鉴定出的45个亚麻CesA/Csl蛋白与分别来自于杨树、棉花和拟南芥的CesA/Csl蛋白进行氨基酸序列比对,比对结果通过MEGA5软件生成进化树,采用邻接法(Neighbor-Joining,NJ)构建进化树,矫正参数Bootstrap重复1 000次。

1.5 亚麻CesA/Csl基因家族的基因结构分析及蛋白基序分析

利用Gene Structure Display Server(http://gsds1.cbi. pku.edu.cn/)在线分析CesA/Csl基因家族的基因结构;通过MEME网站(http://meme-suite.org/tools/meme)在线分析CesA/Csl基因家族蛋白的保守基序,参数设置:基序宽度为6×50,鉴定最大基序数量为20。

1.6 亚麻CesA/Csl表达分析

对高通量测序表达谱数据进行背景扣除、均一化,提取亚麻45个CesA/Csl在苗期、现蕾期以及BR、NaCl及Brz不同处理的表达量(RPKM值),利用Excel软件绘制柱形图。运用SPSS 16.0软件进行数据分析,一维方差分析(One-way ANOVA)进行组间比较,多重比较使用最小差数比较法(LSD),P<0.05代表差异显著。

2 结果

2.1 亚麻CesA/Csl的鉴定

从亚麻全基因组中共筛选到51个拟南芥AtCesA/ Csl的同源蛋白,利用NCBI CDD(http://www.ncbi.nlm. nih.gov/Structure/cdd/)在线工具对其进一步鉴定,获得45个在CDD软件上预测含有CesA保守结构域的蛋白,其中,35个蛋白含有CESA_CelA_like(cd06421)结构域,10个含有CESA_CaSu_A2(cd06437)结构域。因此,该45个蛋白被确认为亚麻CesA/Csl家族蛋白。

2.2 亚麻CesA/Csl的基因组定位及特性分析

CesA/Csl蛋白理化特性分析表明,氨基酸长度为409—1 167,分子量为47 401.1—130 578.3,等电点分布在5.43—9.08。根据WoLF PSORT预测显示(表1),35个CesA/Csl蛋白定位于质膜上,是亚麻CesA/Csl蛋白定位最多的细胞部位。4个CesA/Csl蛋白(Lus10023056、Lus10032415、Lus10025046、Lus10022982)属于叶绿体蛋白,1个CesA/Csl蛋白(Lus10030035)位于细胞核内,还有5个CesA/Csl蛋白(Lus10003525、Lus10013851、Lus10026568、Lus10020539、Lus10039475)暂不能确定其亚细胞位置。大多数CesA/Csl蛋白都含有跨膜结构域,跨膜区是β-1,4-葡萄糖苷链穿过质膜进入细胞壁的重要通道,在亚麻中,除Lus10003525蛋白可能是截短的不完整蛋白序列,未预测到跨膜结构域外,其余CesA/Csl蛋白均含有跨膜结构域,数目为2—8。
Table 1
表1
表1亚麻CesA/Csl基因家族信息
Table 1The information of CesA/Csl gene family in flax
基因登录号
Gene accession
保守结构域
Conserved domains
大小
Size (aa)
分子量
Molecular
weight (D)
等电点
Isoelectric
point
亚细胞定位
Sublocation
跨膜螺旋数
Transmembrane
helices number
基因定位
Scaffold
location
Lus10003525CESA_CelA_like(cd06421)68777073.75.430144
Lus10006161CESA_CelA_like(cd06421)1074121442.06.79质膜Plas6779
Lus10041063CESA_CelA_like(cd06421)1096123703.26.79质膜Plas6280
Lus10002940CESA_CelA_like(cd06421)906102055.57.26质膜Plas51060
Lus10002939CESA_CelA_like(cd06421)1097123554.27.06质膜Plas61060
Lus10003526CESA_CelA_like(cd06421)1097123633.16.78质膜Plas6144
Lus10022449CESA_CelA_like(cd06421)1035116929.46.09质膜Plas638
Lus10007538CESA_CelA_like(cd06421)1092122311.17.46质膜Plas8259
Lus10012198CESA_CelA_like(cd06421)1094122623.57.03质膜Plas81186
Lus10039607CESA_CelA_like(cd06421)1069120160.18.01质膜Plas615
Lus10018902CESA_CelA_like(cd06421)1079121660.46.26质膜Plas6103
Lus10028597CESA_CelA_like(cd06421)1079121623.36.28质膜Plas6346
Lus10007296CESA_CelA_like(cd06421)988111446.26.39质膜Plas8859
基因登录号
Gene accession
保守结构域
Conserved domains
大小
Size (aa)
分子量
Molecular
weight (D)
等电点
Isoelectric
point
亚细胞定位
Sublocation
跨膜螺旋数
Transmembrane
helices number
基因定位
Scaffold
location
Lus10029245CESA_CelA_like(cd06421)988111276.16.73质膜Plas8360
Lus10013851CESA_CelA_like(cd06421)1128126664.06.438618
Lus10026568CESA_CelA_like(cd06421)1135127121.56.628617
Lus10022982CESA_CelA_like(cd06421)1127125504.95.88叶绿体Chlo6355
Lus10000755CESA_CelA_like(cd06421)991111050.48.56质膜Plas81775
Lus10011736CESA_CelA_like(cd06421)949106646.48.92质膜Plas8568
Lus10009248CESA_CelA_like(cd06421)1095122791.16.70质膜Plas6267
Lus10038008CESA_CelA_like(cd06421)1064119477.76.36质膜Plas3475
Lus10026610CESA_CelA_like(cd06421)1056117718.66.58质膜Plas4617
Lus10026609CESA_CelA_like(cd06421)1031115654.67.90质膜Plas6617
Lus10030455CESA_CelA_like(cd06421)953106594.37.26质膜Plas6917
Lus10030453CESA_CelA_like(cd06421)86998148.47.79质膜Plas8917
Lus10010024CESA_CelA_like(cd06421)1167130578.38.35质膜Plas61630
Lus10025046CESA_CelA_like(cd06421)1073120501.78.85叶绿体Chlo4294
Lus10002134CESA_CelA_like(cd06421)1060118537.25.58质膜Plas61106
Lus10012119CESA_CelA_like(cd06421)1065118230.76.31质膜Plas51186
Lus10023056CESA_CelA_like(cd06421)75384500.77.26叶绿体Chlo8325
Lus10003196CESA_CelA_like(cd06421)76986162.96.04质膜Plas71056
Lus10023057CESA_CelA_like(cd06421)74382891.87.18质膜Plas8325
Lus10032415CESA_CelA_like(cd06421)74483157.76.40叶绿体Chlo8291
Lus10016625CESA_CelA_like(cd06421)76286303.45.59质膜Plas8915
Lus10030035CESA_CelA_like(cd06421)83893042.26.81细胞核Nucl4416
Lus10009387CESA_CaSu_A2(cd06437)54162521.29.05质膜Plas5137
Lus10020539CESA_CaSu_A2(cd06437)40947401.18.30377
Lus10025886CESA_CaSu_A2(cd06437)69379117.19.08质膜Plas3605
Lus10038217CESA_CaSu_A2(cd06437)49556683.38.53质膜Plas228
Lus10007715CESA_CaSu_A2(cd06437)64073270.58.68质膜Plas6993
Lus10018651CESA_CaSu_A2(cd06437)61570871.78.62质膜Plas5461
Lus10020120CESA_CaSu_A2(cd06437)63672771.39.06质膜Plas5454
Lus10026923CESA_CaSu_A2(cd06437)70580606.69.07质膜Plas6651
Lus10039440CESA_CaSu_A2(cd06437)67677143.68.77质膜Plas633
Lus10039475CESA_CaSu_A2(cd06437)67677097.58.77633
Lus10001619无None1069119166.76.5061025
Lus10008225无None50858057.25.520157
Lus10008226无None47953298.38.92质膜Plas6157
Lus10012198无None1094122623.57.03质膜Plas81186
Lus10032416无None15617570.66.692291
Lus10038009无None10010938.010.422475

“—”:不明确 Unknown
新窗口打开
尽管亚麻全基因测序已完成,但并未公布测序亚麻品种的染色体物理图谱,所以目前亚麻CesA/ Csl家族基因仅能定位于scaffolds上,尚无法定位到染色体上。亚麻CesA/Csl家族基因在scaffolds上是分散分布的,无明显的成簇现象。在Scaffold 617中含有3个CesA/Csl,在Scaffold 33、Scaffold144、Scaffold 325、Scaffold 917、Scaffold 1060、Scaffold 1186中均各含有2个CesA/Csl,其他Scaffold上仅含有1个CesA/Csl

2.3 亚麻与杨树、棉花及拟南芥CesA/Csl的进化关系

对已鉴定含有纤维素合酶保守结构域的45个亚麻纤维素合酶CesA/Csl蛋白与杨树、棉花、拟南芥的CesA/Csl蛋白构建系统进化树(图1),主要聚为7个明显的分支。根据氨基酸序列比对和进化关系远近,将CesA/Csl蛋白分为CesA、Csl两类,而Csl蛋白被细分为6组,分别命名为CslA、CslB、CslC、CslD、CslE与CslG。不同组间的CesA/Csl之间直向相似度(ortholog)远大于平行(paralog)进化相似度,表明纤维素合酶在进化中产生分化的时期很早,在这4个物种分化之前,不同的纤维素合酶就已进化产生了不同的类型和组型。
显示原图|下载原图ZIP|生成PPT
图1亚麻与杨树、棉花、拟南芥CesA/Csl基因家族的进化关系
-->Fig. 1Phylogenetic relationship of CesA/Csl gene family among Flax, Populus, Gossypium and Arabidopsis
-->

在基因进化过程中,突变积累的数量和时间成正比,从进化树可以看出,亚麻CesA/Csl和毛果杨的遗传距离相对较近,与棉花次之,而与拟南芥的遗传距离相对较远,CesA/Csl与物种间的生物进化关系趋于一致。进一步分析发现,CesA在这4个物种中数目分布基本一致,但Csl在不同物种中数量分布具有较大差异,如亚麻CslD组基因数目较多,CslB、CslE组基因数目较少;拟南芥CslA组基因数目较多,CslE组基因数目较少;棉花CslE、CslG组基因数目较多,CslB、CslC组基因数目较少;而杨树各组基因数目分布较为均匀。推测在这4个物种的祖先中可能只存在少量的CesA/Csl,在物种分离之后,CesA/Csl通过基因重复的方式进行了扩增,但不同物种在不同组基因中扩张程度并不一致。
进化树上,CesA组与CslD组位于相邻的2个分支,进化关系最近。亚麻CesA组有13个基因成员,其中11个基因与杨树、棉花、拟南芥的CesA1CesA2CesA3CesA5CesA6CesA9CesA10聚在一起,在功能上可能参与初生细胞壁的合成;2个基因与CesA8聚在一起,在功能上可能参与次生细胞壁的合成,但没有发现CesA4CesA7的亚麻同源基因。亚麻CslD组有15个基因,为基因成员最多的一组。RICHMOND等[16]推测CslD为纤维素合酶超家族中最为古老的一个,可能在进化时间上早于CesA。4个基因与AtCslG1—AtCslG3聚为一组(CslG组),CslB与CslE组各有1个基因成员,2个基因与CslA聚为一组(CslA组),CslC组有8个基因成员。CslACslC组基因在进化树上位于最远的分支,与CesA组基因遗传距离最远,分化最大。

2.4 亚麻CesA/Csl家族的基因结构分析

拟南芥中已克隆了10个CesA,通过比较分析发现,拟南芥的10个CesA最大的差异在于某些区域中内含子的有无,内含子的位置是确定纤维素合成酶功能的关键因素之一[20]。基因结构分析显示,亚麻CesA/Csl的长度为2.1—6.8 kb,外显子数量为2—14。外显子数量在不同组间有较大变化(图2),CesA组成员外显子数目较多,在11—14,CslD组外显子数目较少(外显子数目为2—5)。不同组中,各组内部成员之间外显子数目相近,其中CesA组、CslC组及CslD组内部成员的基因结构保守性较高。
显示原图|下载原图ZIP|生成PPT
图2亚麻CesA/Csl基因家族进化树和基因结构
-->Fig. 2The phylogenetic tree and gene structures of CesA/Csl gene family in Flax
-->

2.5 亚麻CesA/Csl家族的蛋白基序分析

利用MEME在线工具对亚麻CesA/Csl蛋白序列进行了保守基序分析,预测出20个Motif(图3)。在同一组内,大多数成员的Motif组成基本相同,不同组间Motif组成有一定的差异。在进化上,CesA组与CslD组亲缘关系最近,Motif组成相对保守,但也存在分化,Motif13、Motif15特异分布于CesA组中,Motif14、Motif 19则特异分布于CslD组中。Motif13是CesA蛋白N末端特有的锌指结构域,是维持纤维素合成酶复合体稳定结构的重要功能区。亚麻CesA和Csl之间存在的最大区别是Csl蛋白(除5个CslD蛋白)缺少该锌指结构域(Motif 13)。与CslD相比,CslE、CslB、CslG、CslA、CslC组蛋白序列相对较短,保守基序数目显著减少。在进化上,CslE、B、G三组蛋白亲缘关系较近,Motif组成相对保守;CslA、CslC组蛋白则分支较远,序列保守程度低,保守基序数目较少。
显示原图|下载原图ZIP|生成PPT
图3亚麻CesA/Csl基因家族蛋白的保守基序
-->Fig. 3The conserved Motif of CesA/Csl gene family in Flax
-->

CesA组及CslD、CslE、CslB、CslG组成员均具有CESA_CelA_like(cd06421)保守结构域,与具有CESA_CaSu_A2(cd06437)保守结构域的CslA、CslC组成员在Motif组成上具有明显的差异。Motif 12、Motif 4、Motif 1、Motif 3、Motif 2特异分布于CesA及CslD、CslE、CslB、CslG组蛋白中,这些Motif主要分布于酶的中央结构域中,酶的中央结构域通常包含2个保守区(A区和B区),Motif 12、Motif 4、Motif 1、Motif 3位于A区中,该区域可结合纤维素合成的底物;Motif 2位于B区中,含有保守序列QxxRW, 与纤维素合酶的催化活性有关。Motif 20、Motif 18特异分布于CslA、C组蛋白中,Motif 20与Motif 3、Motif 18与Motif 2在功能上具有相似性,但经过长期的进化,除保守结构域D、QxxRW外,序列已发生明显改变

2.6 亚麻CesA/Csl的表达分析

亚麻不同发育时期、不同处理的RNA-Seq数据进行预处理和统计分析后,获得45个CesA/Csl基因家族成员对应表达量的RPKM值(图4),其中6个基因RPKM值都小于1,说明这些基因在5个样品中的表达量极低或不表达。通过分析发现亚麻CesA组基因中大多数基因在亚麻的苗期和现蕾期中均有较强表达,并且存在明显的共表达,表明这些基因是植株生长发育所必需的基因。Lus10039607、Lus10002939、Lus10007296、Lus10029245则表现为苗期低丰度表达,现蕾期高丰度表达,差异达到显著水平(P<0.05)。其中,Lus10007296、Lus10029245是AtCesA8的同源基因。笔者通过荧光定量PCR分析不同发育阶段亚麻Lus10007296、Lus10029245基因的表达特性,发现这2个基因表达模式相似,在快速生长期,基因的表达量达到最高;进入花期和绿熟期时基因的表达量再次上调。快速生长期是亚麻纤维细胞启动次生细胞壁加厚阶段,至花期、绿熟期亚麻次生细胞壁进一步加厚,纤维素沉积,纤维逐渐成熟,由此推测Lus10007296、Lus10029245基因与亚麻次生细胞壁加厚密切相关。
显示原图|下载原图ZIP|生成PPT
图4亚麻CesA/Csl的相对表达量
-->Fig. 4Relative expression of CesA/Csl gene family in Flax
-->

亚麻Csl蛋白被分为CslA、CslB、CslC、CslD、CslE、CslG共6个亚组。CslA催化(1,4)-b-D-甘露聚糖的合成,亚麻中2个CslA基因在苗期、现蕾期表现出相似的表达丰度,但它们均可被NaCl诱导上调表达,差异达到显著水平(P<0.05)。亚麻中有1个CslB(Lus10030035),该基因在不同发育时期、不同处理下均低丰度表达。CslC参与催化木葡聚糖骨架的形成,CslD则在多糖(木聚糖和半乳醛聚糖)的合成中起作用,亚麻中有8个CslC和15个CslD,其中Lus10039440、Lus10039475、Lus10007715、Lus10030453、Lus10009248的RPKM值为10—20,其他基因在不同发育时期、不同处理下均低丰度表达或无表达(RPKM<10)。其中,Lus10039475、Lus10007715 2个基因可被NaCl诱导上调表达,被Brz抑制表达,但差异未达到显著水平(P>0.05)。亚麻CslE组只有1个基因(Lus10016625),该基因在苗期高丰度表达,现蕾期低丰度表达,且可被Brz诱导上调表达。亚麻CslG组有4个基因,该组基因在不同发育时期均表现出明显的不同,其中3个基因Lus10023056、Lus10003196、Lus10023057 现蕾期与苗期相比较上调表达,1个基因(Lus10032415)现蕾期与苗期相比较下调表达。Lus10023056可被BR、NaCl、Brz诱导下调表达;Lus10003196可被NaCl诱导下调表达,差异均达到显著水平(P<0.05)。与其他Csl组比较,CslE、CslG组基因的表达量相对较高,而且在苗期和现蕾期,CslE、CslG组基因的表达丰度发生显著变化,由此推测CslE、CslG组基因可能在纤维发育中起重要作用。

3 讨论

本研究通过对亚麻全基因组生物信息学分析,共鉴定出2类,7组共45个亚麻CesA/Csl 蛋白超家族成员,该基因家族与拟南芥、杨树同源性较高,是一类植物进化中保守的家族。在亚麻中发现的CesA编码的蛋白质与杨树、拟南芥具有相似的结构,在N末端都有1个环形锌指结构或LIM结构域(Motif 13),此种结构域具有保守序列CxxC(半胱氨酸-xx-半胱氨酸)。KUREK等[21]通过酵母双杂交发现,GhCesA1和GhCesA2通过此锌指结构可以形成为同源或异源的二聚体。除草剂(CGA325’615)能够通过阻止各蛋白锌指结构域之间的相互作用从而破坏纤维素合成酶复合体的稳定结构[21]。由此推测,纤维素合成酶基因的锌指结构域与蛋白间的相互作用有关,是维持纤维素合成酶复合体稳定结构的重要功能区。CesA和Csl之间存在的最大区别是大多数Csl蛋白(除5个CslD蛋白)缺少锌指结构[22]。纤维素的合成必须在CesA蛋白复合体的作用下完成,相比而言Csl蛋白中大多数都没有锌指结构,因此,目前****认为类纤维素的合成很可能不需要Csl蛋白复合体结构,单一的Csl蛋白也具有催化类纤维素主链合成的活性[23]。RICHMOND和SOMERVILLE根据内含子与外显子排列组合的进化趋势,曾推测CslD基因家族为纤维素合酶超家族中最为古老的一个,可能在进化时间上早于CesA[16]。同时,本研究发现15个CslD蛋白中有5个成员与CesA相同,具有锌指结构,而且在进化上CslD蛋白与CesA蛋白亲缘关系最近,由此推测在进化上很可能由CslD蛋白分支出CesA和Csl类其他蛋白。
大多数亚麻CesA蛋白含有8个跨膜结构域,N-端有2个预测的跨膜区在第250个氨基酸残基附近,C-末端有6个预测的跨膜区,跨膜区是β-1,4-葡萄糖苷链穿过质膜进入细胞壁的重要通道[24]。锌指结构域和N端跨膜结构域之间有一个蛋白序列的高变区Ⅰ(HVRI),富含酸性氨基酸,功能尚不清楚。在第2和第3跨膜结构域之间是酶的中央结构域,其间有一个蛋白序列高变区Ⅱ(HVRII)。通过高变区可以区分不同的CesA蛋白,在功能上,高变区可能参与调控不同发育时期纤维素的合成[25]。高变区Ⅱ两边各有一个保守基序A区和B区,A区含有保守基序Motif 12、Motif 4、Motif 8、Motif 15、Motif 1、Motif 17和Motif 3,该区域可结合纤维素合成的底物,B区除含有一个保守的D-天冬氨酸残基外(Motif 9),还有保守序列QxxRW(Motif 2),该保守区与纤维素合成酶的催化活性有关[25]。除了蛋白序列高变区Ⅱ外,不同CesA蛋白之间中央结构域高度保守。CesA、CslD组蛋白相比保守基序数目极多,序列更加保守,而CslA、CslB、CslC、CslE和CslG组蛋白相对序列较短,保守基序数目极少,序列保守程度低,由此产生的遗传多样性对于植物更好地调控自身纤维素合成具有重要意义。
不同的CesA/Csl基因家族成员在时空上具有不同的表达模式,预示不同的CesA/Csl基因家族成员存在着功能特异性[26-28]。SUZUKI等[17]对杨树中的48个CesA/Csl的表达特性进行分析,PtCesA通常在叶片组织中表达量较低,PtCesA13PtCesA 18在发育的木质部中高丰度表达,PtCesA4PtCesA 5PtCesA 7、PtCesA 8PtCesA 17在木质部中特异表达,但表达量相对较低。与拟南芥类似,PtCsl的表达量明显低于PtCesA,30个PtCsl中只有21个基因被检测出表达量。PtCslA1PtCslA2PtCslA5PtCslD6在发育的木质部中高丰度表达,PtCslC1PtCslC4在茎尖中组织特异性表达,其他15个PtCsl的表达不表现出组织特异性。LI等[29] 研究发现,在陆地棉和海岛棉中CesA8在纤维素大量积累时期发挥重要作用。CesA2在非纤维组织中大量表达,CesA1则类似持家基因,在不同组织中组成型表达。同时,他们发现果胶质的积累与木葡聚糖的减少促进细胞壁的转化。本文通过对RNA-seq分析发现,亚麻大部分Csl的表达丰度都低于CesA,如CslB、CslC及CslD中的部分成员在不同发育时期表达丰度都极低,这与杨树、拟南芥的表达特性相同,推测基因表达量可能与纤维素、半纤维素在次生木质部中所占组分相关。苗期为亚麻纤维细胞分化,初生细胞壁形成阶段;现蕾期亚麻纤维细胞数快速增加,次生细胞壁迅速加厚。亚麻CesA/Csl中,部分CesA及全部CslE、CslG组基因在苗期、现蕾期表达丰度表现出明显的不同,暗示这些基因可能在参与纤维发育及初生、次生细胞壁合成中担任不同的角色。目前,Csl蛋白的生物学功能尚不清楚,有待于深入研究。
对亚麻CesA/Csl上游启动子区域进行预测,发现多个逆境响应的顺式调控元件。RNA-seq结果表明,CesA/Csl家族基因中个别基因可被NaCl诱导上调或下调表达,推测这些基因参与逆境胁迫信号通路。BR是植物中的甾醇类生长促进激素,参与调控纤维发育。SUN等[30]研究发现,BR受体基因BRI1抑制表达的转基因棉花,棉纤维的伸长受影响较小,但次生细胞壁的发育受到明显抑制;相反,过量表达BRI1的转基因棉花纤维素沉积显著增加。笔者前期研究发现,在亚麻现蕾期喷施适当浓度的外源BR及BR特异性合成抑制剂Brz能够影响亚麻纤维发育,提高亚麻的纤维产量。本研究中,BR、Brz处理与对照相比,部分CesA/Csl被BR、Brz诱导上调或下调表达,这些基因可能是植物激素BR信号调控通路的下游基因。
植物纤维素生物合成机制的研究对纤维作物改良、木材定向培育以及纺织业、造纸等化工业都具有积极的科学意义,因此,通过了解植物纤维素的生物合成机制,进而改善植物纤维的品质与产量就显得十分必要。纤维素生物合成的调节涉及CesA的表达调控、CesA蛋白修饰、CesA蛋白在高尔基体中的分泌、胞质中纤维素合酶复合体的装配、纤维素的沉积等多个方面[31],但由于纤维素合酶的生化研究难度大,该领域研究一直停滞不前。近年来,随着基因组学研究的进展及植物细胞壁突变体的发现使植物CesA的功能研究成为可能[32],但是总体来说人们对Csl蛋白的功能尚不十分清楚,尤其CesA/Csl的表达调控及CesA/Csl的运输、复合体的装配等问题更有待于深入研究。

4 结论

鉴定出45个亚麻CesA/Csl家族基因成员,分属于2类、7组,分散分布于scaffolds上,基因结构和蛋白基序具有组间多样性和组内保守性。不同的基因在不同发育阶段具有一定的时空特异性,CesA/Csl中部分基因响应激素BR、Brz及NaCl胁迫。
(责任编辑 李莉)
The authors have declared that no competing interests exist.

参考文献 原文顺序
文献年度倒序
文中引用次数倒序
被引期刊影响因子

相关话题/基因 结构 序列 植物 细胞