Identification and Expression Analysis of Multidrug and Toxic Compound Extrusion Protein Family Genes in Colored Cotton
WANG Zuo-Min,1, LIU Jin1, SUN Shi-Chao2, ZHANG Xin-Yu2, XUE Fei2, LI Yan-Jun,2,*, SUN Jie2通讯作者:
第一联系人:
收稿日期:2017-11-1接受日期:2018-04-11网络出版日期:2018-05-10
基金资助: |
Received:2017-11-1Accepted:2018-04-11Online:2018-05-10
Fund supported: |
摘要
关键词:
Abstract
Keywords:
PDF (7214KB)元数据多维度评价相关文章导出EndNote|Ris|Bibtex收藏本文
本文引用格式
王作敏, 刘瑾, 孙士超, 张新宇, 薛飞, 李艳军, 孙杰. 彩色棉多药和有毒化合物输出蛋白MATE家族基因的鉴定及表达分析[J]. 作物学报, 2018, 44(9): 1380-1392. doi:10.3724/SP.J.1006.2018.01380
WANG Zuo-Min, LIU Jin, SUN Shi-Chao, ZHANG Xin-Yu, XUE Fei, LI Yan-Jun, SUN Jie.
天然彩色棉成熟吐絮时纤维自身具有天然色彩[1]。其纤维在制成成品之前无需化学印染, 既可节省生产成本, 又可避免纺织品中化学染料对人体健康和环境造成的不良影响, 符合当前人们注重健康、环保, 崇尚自然的消费理念, 因此, 彩色棉及其纺织品的开发和利用具有十分广阔的市场前景[2,3]。然而, 天然彩色棉品种资源仅包括棕色和绿色两大色系, 纤维颜色单一, 着色不均匀, 色牢度和色饱和度低[4], 这些问题在很大程度上限制了彩色棉的利用和发展, 因此, 亟待对彩色棉纤维色泽品质进行改良以提高其市场价值。
棕色棉纤维色素形成的前体物质是原花青素[5,6], 又称缩合丹宁, 是一类通过植物类黄酮次生代谢途径合成的聚多酚类化合物[5,6,7]。原花青素生物合成途径的研究已取得巨大进展, 已知经公共苯丙烷途径、核心类黄酮-花青素途径、原花青素特异途径生成原花青素的前体物质表儿茶素[8,9,10]。原花青素的前体物质是在细胞质中合成的, 需经过转运蛋白运输到液泡内聚合生成多聚体才能呈现出各种颜色[11]。MATE家族蛋白(multidrug and compound extrusion)在原花青素的转运过程中发挥着重要作用, 因此, MATE基因可用作利用基因工程技术改良彩色棉纤维色泽品质的候选基因[12,13]。
MATE是一个新型的多药转运蛋白家族, 分布于原核生物、真核生物中, 大部分成员都有12个跨膜区域, 此类转运蛋白对氨基葡糖、阳离子染料、多种抗生素和药物具有转运作用[14,15]。研究者对拟南芥MATE家族的研究较为透彻, 拟南芥中至少有56个MATE基因, 根据系统进化关系可分为7个亚家族, 分别在Fe3+和Al3+等金属离子、类黄酮、四甲胺、水杨酸等次级代谢物质转运方面发挥作用[16,17]。拟南芥AtTT12基因编码一种类黄酮循环必需的MATE转运蛋白, 定位于液泡膜上, 它利用膜两侧的H+/Na+浓度梯度作为推动力, 将胞浆内合成的花青素、原花青素等多酚类色素的单体物质转运到液泡等亚细胞器官中[18,19]。蒺藜苜蓿MtMATE1能促进液泡吸收单宁的前体物质表儿茶素-3’-0-葡萄糖苷, 将MtMATE1转入拟南芥AtTT12突变体, 可以使其种皮颜色恢复至野生型, 同时原花青素的含量也恢复至野生型水平, 表明MtMATE1是蒺藜苜宿中原花青素跨膜转运的关键基因[12,20]。苹果MdMATE1和MdMATE2在系统进化树中均与AtTT12聚为一类, 将这2个基因分别转入拟南芥AtTT12突变体, 均可以使突变体恢复至野生型, 表明MdMATE1和MdMATE2是苹果中转运原花青素的关键基因[21]。
迄今为止, 陆地棉中仅分离出2个MATE家族基因[6,22], 陆地棉基因组测序的完成使得MATE家族基因的鉴定工作成为可能。本研究鉴定陆地棉中的MATE家族基因, 全面、系统地解析GhMATE基因的基本信息、保守域结构、进化关系、染色体定位以及组织表达分析等信息, 为进一步克隆和利用棉花MATE基因改良棉纤维的色泽品质提供一定的理论基础。
1 材料与方法
1.1 陆地棉MATE家族基因的鉴定
以已克隆的陆地棉MATE基因(CotAD_26128)的氨基酸序列作为查询(Query)序列, 利用BlastP从陆地棉全基因组数据库(1.2 MATE家族基因编码的氨基酸序列分析
利用ExPAsy (1.3 MATE家族基因进化树的构建
利用MEGA6.0提供的ClustalW程序对91个陆地棉和56个拟南芥的MATE蛋白进行多重序列比对, 然后通过邻位相连法(Neighbor-Joining, NJ, BootStrap = 1000)构建陆地棉和拟南芥中MATE基因家族的复合进化树。从拟南芥网站 (1.4 MATE家族基因的结构分析
采用DNAMAN和ClustalX对MATE家族蛋白氨基酸序列进行多重序列比对; 利用在线软件TMHMM (1.5 陆地棉MATE家族基因的染色体定位分析
从陆地棉全基因组数据库获得MATE家族基因的染色体定位信息, 以及陆地棉各条染色体的长度信息, 利用MapInspect软件绘制GhMATE家族基因的染色体定位图。1.6 陆地棉MATE家族基因在棉花不同组织中的表达分析
1.6.1 植物材料的准备 陆地棉(Gossypium hirsutum L.)品种“新陆早33”、“新彩棉5号”由新疆石河子大学棉花所提供, 播种于石河子大学试验农场, 常规管理。在棉花盛花期挂牌标记当日开花的花蕾, 以第3天为时间节点, 摘取3~27 DPA (days post-anthesis, 开花后天数)棉铃, 室内剥取胚珠及纤维; 取棉花种子用浓硫酸脱绒后播种于花盆(营养土∶蛭石=2∶1)中, 28℃培养2~3周, 待幼苗长出2片真叶时将其拔出, 水培2 d之后取其根、茎、叶, 花从田间摘取。将上述植物材料液氮速冻后, 保存于-80℃冰箱, 用于提取RNA。1.6.2 棉花总RNA的提取及cDNA第1链的合成
采用改良的CTAB酸酚法提取棉花样品总RNA[23], 用DNase I处理后利用Nanodrop1000紫外分光光度技测定OD260和OD280值, 计算RNA的浓度与纯度。用1.0%琼脂糖凝胶电泳检测RNA的完整性, 保存于-80℃备用。按照大连宝生物工程有限公司Reverse Transcriptase M-MLV (RNaseH-)说明书合成cDNA第1链。
1.6.3 陆地棉MATE家族基因的qRT-PCR分析
根据陆地棉MATE家族基因的cDNA序列, 采用Primer5.0软件在基因序列3′端特异性区域设计引物(表1), 扩增片段约为200 bp。分别以白色棉“新陆早33”、棕色棉“新彩棉5号”幼苗的根、茎、叶、花和不同发育时期棉纤维cDNA为模板, 利用qRT-PCR方法检测陆地棉MATE家族基因的表达情况, 内参基因为UBQ7 (GenBank登录号为DQ116441.1)。qRT-PCR反应体系为10.0 μL, 其中cDNA 1 μL、2×FASTSYBR混合物5.0 μL、基因特异正向引物(10 μmol L-1) 0.2 μL、反向引物(10 μmol L-1) 0.2 μL, RNase-Free H2O 3.6 μL。qRT-PCR在LightCycler 480II系统上进行, 反应程序为94℃预变性1 min; 95℃变性15 s, 56.5℃退火20 s, 72℃延伸30 s, 45个循环。按照2-??Ct计算基因的相对表达值。实验中采集每种材料3组重复样品, 每个样品的RNA提取需进行3次重复, 共计9组实验结果, 计算其平均值和标准差。
Table 1
表1
表1实验中所用的引物
Table 1
基因名称 Gene name | 上游引物序列 Forward primer sequence (5′-3′) | 下游引物序列 Reverse primer sequence (5′-3′) |
---|---|---|
GhA11G0040 | GCTGCCACGGTTTGGATGAT | GCCTCTTGCTCCCAGTTTGT |
GhA08G2343 | ATTGCTGGCTTGCTCCATACTT | CCACTTGTTAACTCGCGATTGA |
GhA13G0797 | TTTATCTCCGTTGTTGGCTTCT | CCTGTACCGCGACAGTGAGC |
GhD05G1622 | ATTGTATTTGCTCTGCGAGATGTTA | TTGCACCGAGGTCGTACTTGA |
GhA12G0971 | CATCCAAGGGCAGCCAAATA | CCTCCTCCCACAGCAACACC |
GhA03G0955 | GGCGGCAATAATAATAATGGT | GGATAAGGGTTAATGCTAGAAGC |
GhA03G1186 | GGTGTTATAGTATCCCTAATCCTCATC | TTCTTTATCCTTTCCTCCGCAAT |
GhA05G1901 | CGGTGCAGGAAATGCGAAAG | AGCCCAGATACCAGTGATACCAAA |
GhA06G0259 | GTTAGGCGTCACCATTCTACTCAA | GTTCCTCCAAAGATCATCCCAC |
GhA10G0781 | GGCAATCCTACGTGGCTTACAT | TTTGCTTTCTCAGCCTCCTTCT |
GhD02G1620 | TACGATAGCCCTTATTCTGATCATC | TCTCTTTAGTGTCAACGTCACCTCC |
GhD11G2314 | GAGGAAATGCAAAGGCAGTGAA | CAATAACCATCGGTTGAGACGT |
GhD11G2334 | AAGTAGCAAACTCCGTGGCAGAC | TTCCCAATCAGTCCTTGAGGTAAT |
GhA03G1321 | ATAGCAATGAGAAGGAAGTGGTGGAT | TTGTAACAATGGCGAGCAGAAT |
GhD01G1006 | TTACTTCCCTTACTTCTTCACTACCA | CCCATTTCTTTATACGCCTTTC |
GhD13G2211 | AACCGTGATAGGCACCGTCAT | TCCAAAGTCCCTTCCCTCCA |
GhA09G0412 | TGCTATGAGCGTTCGGGTTTC | CATGCGTTCCGTTGTTTGTTC |
GhA04G0282 | AATCGTTTCGTTTGGTCTTCGC | ACACCTGCCATCCGCTTCCTCT |
GhA12G0812 UBQ7 | AGCAGTTTCAGACTTGACTCCAC GAAGGCATTCCACCTGACCAAC | GACTCCAATAATCATACCCCACC CTTGACCTTCTTCTTCTTGTGCTTG |
新窗口打开|下载CSV
2 结果与分析
2.1 陆地棉MATE家族基因的鉴定与命名
用已克隆的棕色棉MATE基因(CotAD_26128)为探针序列, 在陆地棉全基因组数据库(Table 2
表2
表2陆地棉MATE蛋白家族成员的鉴定
Table 2
基因 Gene | 序列号 Sequence number | 染色体 Chr. | 编码序列 Coding sequence (bp) | 蛋白残基数 Protein length (aa) | 分子量 Molecular weight (kD) | 等电点 pI | 亚细胞定位预测 Subcellular location prediction |
---|---|---|---|---|---|---|---|
GhMATE1 | GhA01G0453 | 1 | 1455 | 484 | 48.1 | 7.72 | 细胞膜Cell membrane |
GhMATE2 | GhA01G0959 | 1 | 1455 | 484 | 49.3 | 8.62 | 细胞膜Cell membrane |
GhMATE3 | GhA03G0955 | 3 | 1383 | 460 | 46.4 | 5.21 | 叶绿体Chloroplast |
GhMATE4 | GhA03G1185 | 3 | 1554 | 517 | 48.1 | 9.05 | 细胞质Cytoplasm |
GhMATE5 | GhA03G1186 | 3 | 1545 | 514 | 48.2 | 6.48 | 细胞膜Cell membrane |
GhMATE6 | GhA03G1321 | 3 | 1470 | 489 | 47.1 | 7.58 | 液泡膜Tonoplast |
GhMATE7 | GhA03G1323 | 3 | 1467 | 488 | 47.2 | 7.58 | 细胞膜Cell membrane |
GhMATE8 | GhA04G0255 | 4 | 1275 | 424 | 45.3 | 8.62 | 细胞膜Cell membrane |
GhMATE9 | GhA04G0282 | 4 | 1416 | 471 | 47.0 | 7.96 | 细胞膜Cell membrane |
GhMATE10 | GhA05G1449 | 5 | 1575 | 524 | 48.0 | 5.85 | 细胞质Cytoplasm |
GhMATE11 | GhA05G1901 | 5 | 1476 | 491 | 47.5 | 8.36 | 叶绿体Chloroplast |
GhMATE12 | GhA06G0259 | 6 | 1479 | 492 | 48.5 | 8.36 | 细胞质Cytoplasm |
GhMATE13 | GhA09G0073 | 9 | 1470 | 489 | 48.1 | 8.86 | 液泡膜Tonoplast |
GhMATE14 | GhA08G2343 | 8 | 1497 | 498 | 53.7 | 5.60 | 细胞膜Cell membrane |
GhMATE15 | GhA09G0412 | 9 | 1521 | 506 | 49.9 | 5.49 | 细胞膜Cell membrane |
GhMATE16 | GhA10G0781 | 10 | 1458 | 485 | 49.3 | 5.55 | 细胞膜Cell membrane |
GhMATE17 | GhA11G0039 | 11 | 1404 | 467 | 45.6 | 8.52 | 细胞膜Cell membrane |
GhMATE18 | GhA11G0040 | 11 | 1533 | 510 | 48.5 | 8.65 | 细胞膜Cell membrane |
GhMATE19 | GhA11G1853 | 11 | 1473 | 490 | 49.5 | 8.34 | 细胞膜Cell membrane |
GhMATE20 | GhA11G2034 | 11 | 1452 | 483 | 48.7 | 8.58 | 细胞膜Cell membrane |
GhMATE21 | GhA11G3233 | 11 | 1473 | 490 | 48.2 | 8.22 | 液泡膜Tonoplast |
GhMATE22 | GhA11G3238 | 11 | 1419 | 472 | 48.8 | 8.43 | 细胞膜Cell membrane |
GhMATE23 | GhA12G0812 | 12 | 1503 | 500 | 53.8 | 6.99 | 液泡膜Tonoplast |
GhMATE24 | GhA12G0971 | 12 | 1368 | 455 | 36.6 | 6.21 | 细胞膜Cell membrane |
GhMATE25 | GhA12G2733 | 12 | 1431 | 476 | 42.8 | 8.28 | 细胞膜Cell membrane |
GhMATE26 | GhA13G0797 | 13 | 1518 | 505 | 48.7 | 8.17 | 细胞膜Cell membrane |
GhMATE27 | GhA13G1248 | 13 | 1455 | 484 | 48.0 | 6.18 | 细胞膜Cell membrane |
GhMATE28 | GhD01G0136 | 1 | 1586 | 528 | 49.5 | 5.08 | 细胞膜Cell membrane |
GhMATE29 | GhD01G1006 | 1 | 1452 | 483 | 49.5 | 8.89 | 细胞膜Cell membrane |
GhMATE30 | GhD02G1336 | 2 | 1518 | 505 | 50.8 | 5.59 | 叶绿体Chloroplast |
GhMATE31 | GhD02G1620 | 2 | 1563 | 520 | 48.1 | 9.00 | 细胞质Cytoplasm |
GhMATE32 | GhD02G1621 | 2 | 1545 | 514 | 48.4 | 7.66 | 细胞膜Cell membrane |
GhMATE33 | GhD02G1761 | 2 | 1449 | 482 | 47.2 | 8.38 | 细胞膜Cell membrane |
GhMATE34 | GhD02G1762 | 2 | 1470 | 489 | 47.0 | 7.96 | 细胞膜Cell membrane |
GhMATE35 | GhD05G1622 | 5 | 1557 | 518 | 47.4 | 5.98 | 细胞质Cytoplasm |
GhMATE36 | GhD05G2137 | 5 | 1476 | 491 | 47.8 | 8.34 | 叶绿体Chloroplast |
GhMATE37 | GhD05G3073 | 5 | 1488 | 495 | 45.9 | 7.05 | 细胞膜Cell membrane |
GhMATE38 | GhD05G3385 | 5 | 1416 | 471 | 44.2 | 8.28 | 细胞膜Cell membrane |
GhMATE39 | GhD06G0281 | 6 | 1479 | 492 | 52.6 | 5.17 | 细胞膜Cell membrane |
基因 Gene | 序列号 Sequence number | 染色体 Chr. | 编码序列 Coding sequence (bp) | 蛋白残基数 Protein length (aa) | 分子量 Molecular weight (kD) | 等电点 pI | 亚细胞定位预测 Subcellular location prediction |
GhMATE40 | GhD08G2334 | 8 | 1476 | 491 | 43.8 | 8.39 | 细胞膜Cell membrane |
GhMATE41 | GhD09G0426 | 9 | 1476 | 491 | 49.9 | 5.75 | 细胞膜Cell membrane |
GhMATE42 | GhD10G0979 | 10 | 1479 | 492 | 48.5 | 8.82 | 细胞膜Cell membrane |
GhMATE43 | GhD11G0038 | 11 | 1533 | 510 | 48.5 | 8.65 | 细胞膜Cell membrane |
GhMATE44 | GhD11G2135 | 11 | 1473 | 490 | 49.6 | 8.68 | 细胞质Cytoplasm |
GhMATE45 | GhD11G2314 | 11 | 1452 | 483 | 48.7 | 8.57 | 细胞膜Cell membrane |
GhMATE46 | GhD11G2334 | 11 | 1464 | 487 | 43.8 | 8.39 | 液泡膜Tonoplast |
GhMATE47 | GhD12G0830 | 12 | 1521 | 506 | 53.9 | 6.99 | 细胞膜Cell membrane |
GhMATE48 | GhD12G1083 | 12 | 1530 | 509 | 48.6 | 5.47 | 细胞膜Cell membrane |
GhMATE49 | GhD13G1038 | 13 | 1377 | 548 | 41.9 | 7.61 | 细胞膜Cell membrane |
GhMATE50 | GhD13G2211 | 13 | 1434 | 477 | 47.2 | 9.22 | 细胞膜Cell membrane |
GhMATE51 | GhD07G0751 | 7 | 1314 | 434 | 47.8 | 7.49 | 细胞膜Cell membrane |
GhMATE52 | GhD01G0461 | 1 | 1455 | 484 | 53.0 | 5.83 | 细胞膜Cell membrane |
GhMATE53 | GhA01G0098 | 1 | 1125 | 374 | 40.6 | 8.94 | 细胞膜Cell membrane |
GhMATE54 | GhA12G0513 | 12 | 1416 | 471 | 51.8 | 7.83 | 液泡膜Tonoplast |
GhMATE55 | GhA07G0673 | 7 | 1314 | 437 | 47.4 | 5.33 | 细胞膜Cell membrane |
GhMATE56 | GhA05G2769 | 5 | 1452 | 483 | 52.7 | 6.59 | 细胞膜Cell membrane |
GhMATE57 | GhD03G1484 | 3 | 1563 | 520 | 56.6 | 8.46 | 液泡膜Tonoplast |
GhMATE58 | GhA08G1613 | 8 | 1608 | 535 | 58.3 | 8.08 | 细胞膜Cell membrane |
GhMATE59 | GhA12G2353 | 12 | 1644 | 547 | 59.7 | 6.69 | 细胞膜Cell membrane |
GhMATE60 | GhA13G1249 | 13 | 1293 | 430 | 46.8 | 9.08 | 细胞膜Cell membrane |
GhMATE61 | GhD07G0089 | 7 | 1512 | 503 | 55.1 | 6.59 | 细胞膜Cell membrane |
GhMATE62 | GhA06G0589 | 6 | 1575 | 524 | 56.8 | 8.62 | 细胞膜Cell membrane |
GhMATE63 | GhD09G1100 | 9 | 1506 | 507 | 54.0 | 5.89 | 细胞质Cytoplasm |
GhMATE64 | GhA10G2322 | 10 | 1401 | 466 | 50.7 | 8.19 | 细胞膜Cell membrane |
GhMATE65 | GhD09G2422 | 9 | 1311 | 436 | 47.4 | 7.05 | 细胞膜Cell membrane |
GhMATE66 | GhA03G0114 | 3 | 1500 | 499 | 54.3 | 9.02 | 细胞膜Cell membrane |
GhMATE67 | GhD02G0545 | 2 | 1482 | 493 | 53.2 | 7.94 | 叶绿体Chloroplast |
GhMATE68 | GhA10G1472 | 10 | 1398 | 465 | 50.1 | 7.48 | 细胞膜Cell membrane |
GhMATE69 | GhA03G2015 | 3 | 1563 | 520 | 56.5 | 8.21 | 细胞膜Cell membrane |
GhMATE70 | GhA03G1320 | 3 | 1341 | 446 | 49.1 | 8.04 | 细胞膜Cell membrane |
GhMATE71 | GhD05G2075 | 5 | 1662 | 553 | 60.3 | 7.47 | 细胞质Cytoplasm |
GhMATE72 | GhD11G0087 | 11 | 1602 | 533 | 58.1 | 8.54 | 细胞膜Cell membrane |
GhMATE73 | GhA09G0385 | 9 | 1581 | 526 | 57.8 | 8.70 | 细胞膜Cell membrane |
GhMATE74 | GhA08G2165 | 8 | 1530 | 509 | 55.5 | 8.36 | 细胞膜Cell membrane |
GhMATE75 | GhD06G0667 | 6 | 1575 | 524 | 57.0 | 8.58 | 细胞膜Cell membrane |
GhMATE76 | GhA09G1094 | 9 | 1509 | 502 | 54.1 | 5.67 | 细胞膜Cell membrane |
GhMATE77 | GhD05G0259 | 5 | 1617 | 538 | 58.4 | 7.51 | 细胞膜Cell membrane |
GhMATE78 | GhD10G1146 | 10 | 1404 | 466 | 50.7 | 8.19 | 液泡膜Tonoplast |
GhMATE79 | GhA02G0487 | 2 | 1524 | 507 | 54.8 | 7.48 | 细胞膜Cell membrane |
GhMATE80 | GhA05G2384 | 5 | 1386 | 467 | 50.3 | 6.51 | 叶绿体Chloroplast |
GhMATE81 | GhD12G2539 | 12 | 1119 | 392 | 42.6 | 5.48 | 细胞膜Cell membrane |
GhMATE82 | GhD06G2314 | 6 | 1611 | 536 | 58.4 | 6.46 | 细胞膜Cell membrane |
GhMATE83 | GhD12G2490 | 12 | 1632 | 543 | 59.2 | 8.90 | 细胞膜Cell membrane |
基因 Gene | 序列号 Sequence number | 染色体 Chr. | 编码序列 Coding sequence (bp) | 蛋白残基数 Protein length (aa) | 分子量 Molecular weight (kD) | 等电点 pI | 亚细胞定位预测 Subcellular location prediction |
GhMATE84 | GhA11G0083 | 11 | 1602 | 533 | 58.1 | 8.34 | 细胞膜Cell membrane |
GhMATE85 | GhD09G0403 | 9 | 1611 | 536 | 58.8 | 8.15 | 细胞膜Cell membrane |
GhMATE86 | GhA09G2299 | 9 | 1404 | 467 | 50.7 | 7.09 | 细胞质Cytoplasm |
GhMATE87 | GhA05G0185 | 5 | 1614 | 537 | 58.3 | 7.50 | 细胞膜Cell membrane |
GhMATE88 | GhD03G1526 | 3 | 1500 | 499 | 54.0 | 8.85 | 叶绿体Chloroplast |
GhMATE89 | GhD11G3461 | 11 | 1569 | 522 | 56.1 | 5.02 | 细胞膜Cell membrane |
GhMATE90 | GhA03G0113 | 3 | 1500 | 424 | 45.7 | 8.40 | 细胞质Cytoplasm |
GhMATE91 | GhD10G1714 | 10 | 1530 | 509 | 54.9 | 6.98 | 细胞膜Cell membrane |
新窗口打开|下载CSV
2.2 陆地棉MATE家族基因的进化关系分析
图1显示, 56个拟南芥MATE蛋白被清晰地分成A、B、C、D、E、F、G 7个亚家族, 陆地棉MATE蛋白被分至不同的亚家族中。其中A亚家族是最大的一个进化分支, 包括23个GhMATE家族成员, 其次是E、F和G亚家族各包括13个成员, B亚家族包括11个成员, C和D亚家族各包括9个成员。有13个GhMATE基因和拟南芥AtTT12基因聚在一个分支, 属于E亚家族。图1
新窗口打开|下载原图ZIP|生成PPT图1陆地棉、拟南芥MATE家族蛋白成员进化分析
利用MEGA5.1软件及邻位相连法构建进化树, 设置Bootstrap参数为1000次重复, 有7个进化分支被命名为A~G, 7种不同的颜色代
Fig. 1Phylogenetic analysis of the MATE family proteins in Gossypium hirsutum L. and Arabidopsis
The phylogenetic tree was generated using the neighbor-joining criteria in MEGA 5.1 with 1000 Bootstrap replicates; the seven distinct clades were named as A-G. The seven different color boxes represent seven clades. N0. represents Gossypium hirsutum members in each clade.
2.3 陆地棉MATE家族基因的保守域和结构分析
GhMATE家族成员含有10~13个TM, 其中GhMATE43蛋白含有13个TM, GhMATE25、GhMATE67、GhMATE70和GhMATE73含有11个TM, GhMATE24、GhMATE90含有10个TM, 剩余84个GhMATE蛋白均含有12个TM, 部分GhMATE蛋白的12个跨膜结构域如图2所示。对获得的91个GhMATE家族基因的内含子和外显子的个数和排布情况分析表明, 大多数GhMATE基因(50个)由7~8个外显子和6~7个内含子组成, 其中27个基因含有8个外显子和7内含子, 23个基因含有7个外显子和6个内含子; 23个GhMATE基因仅由外显子组成, 不含有内含子, 这些基因分别存在于B、C、D、E、F和G亚家族中, 其中C和D亚家族中居多; 剩余的18个GhMATE基因中, 3个基因由9个外显子和8个内含子组成, 其他15个基因由2~6个外显子和1~5个内含子组成(图3)。图2
新窗口打开|下载原图ZIP|生成PPT图2不同亚家族中GhMATE蛋白的多重序列比对
Fig. 2Multiple sequence alignment of the GhMATE proteins in different subfamilies
图3
新窗口打开|下载原图ZIP|生成PPT图3陆地棉MATE基因的进化树和基因结构比较
蓝色表示UTR (上下游序列), 绿色表示编码区, 灰线表示内含子区。
Fig. 3Phylogenetic tree and structure of MATE genes in Gossypium hirsutum L.
The blue shows the UTR, the green indicates the exon, and the gray indicates the intron.
2.4 陆地棉MATE家族基因的染色体定位
91个GhMATE家族成员分布在25条染色体上, 其中48个分布在13个A基因组上, 43个分布在12个D基因组上, Chr.D4染色体上未发现GhMATE基因(图4)。染色体Chr.A3上分布的基因最多, 为8个; 其次是Chr.A11, 为7个, Chr.D2、Chr.D5和Chr.D11上各分布6个; 染色体Chr.A5、Chr.A9和Chr.A12上各分布5个; 染色体Chr.A2、Chr.D9和Chr.D12上各分布4个; 其余14个染色体上各分布1~3个。根据200 kb的核苷酸中含有3个以上基因即为1个基因簇的定义[24], GhMATE家族基因在3条染色体上形成了1个基因簇, 分别为Chr.A11 (GhMATE17、GhMATE18、GhMATE21和GhMATE84)、Chr.D2 (GhMATE31、GhMATE32、GhMATE33和GhMATE34)和Chr.D11 (GhMATE43、GhMATE45和GhMATE72)。在Chr.A3染色体上形成了2个基因簇, 即GhMATE66、GhMATE69、GhMATE90形成1个, GhMATE4、GhMATE5、GhMATE6、GhMATE70形成了另1个, 其他染色体上未形成基因簇。图4
新窗口打开|下载原图ZIP|生成PPT图4陆地棉MATE家族基因染色体定位
Fig. 4Genomic locations of MATE genes on Gossypium hirsutum L. chromosomes
2.5 陆地棉MATE家族基因的表达模式分析
从7个GhMATE亚家族中分别选取20多个基因进行表达模式分析, 包括所有定位于液泡膜上的GhMATE基因、13个E亚家族成员以及随机选取的其他亚家族成员。qRT-PCR结果发现, GhMATE家族基因在白色棉、棕色棉不同器官(根、茎、叶、花)及棉纤维细胞的不同发育时期均有表达。根据qRT-PCR结果, 从中筛选出GhMATE23、GhMATE4、GhMATE17、GhMATE25、GhMATE13、GhMATE28和GhMATE12共7个在棕色棉纤维中优势表达的GhMATE基因, qRT-PCR结果显示, GhMATE13和GhMATE23基因在棕色棉纤维中的表达量明显高于白色棉, 在棕色棉纤维中的表达量变化呈现先升高后降低的趋势, 分别在15DPA和21DPA达到最大值, 几乎是白色棉纤维表达量的7~10倍。GhMATE12、GhMATE4和GhMATE28基因在棕色棉纤维中的表达量均高于白色棉纤维, 均在21 DPA时达到最大值, 但仅为白色棉表达量的1.0~1.8倍。GhMATE17和GhMATE25在15~27 DPA的棕色棉纤维中的表达量高于白色棉纤维, 但两者表达量的倍数较低。在棉纤维发育过程中, 上述7个GhMATE基因在棕色棉纤维中表达量均高于白色棉, 其中GhMATE13和GhMATE23在棕色棉纤维中的表达优势最明显, 暗示它们可能与棕色棉纤维的颜色形成相关。图5
新窗口打开|下载原图ZIP|生成PPT图5MATE家族基因在棉花不同组织中的qRT-PCR分析
R: 根; S: 茎; L: 叶; F: 花; 6~27 DPA:开花后6、9、12、15、18、21、24、27 d纤维。
Fig. 5Quantitative Real-time PCR analyses of GhMATE family genes expression in different tissues
R: root; S: stem; L: leaf; F: flower; 6-27 DPA: fiber cells at 6, 9, 12, 15, 18, 21, 24, and 27 DPA, respectively.
3 讨论
MATE蛋白是一个新型的多药转运蛋白家族, 其成员数量庞大, 大概有203个已经测序的MATE基因广泛分布于古细菌、细菌、酵母、动物和植物中[13,14,15], 如拟南芥中58个、葡萄中57个、杨树中58个、玉米和短柄草中38个[25]。模式植物拟南芥和烟草中MATE家族基因的复杂相关特征和生物学功能已被挖掘和鉴定[17,26]。拟南芥中MATE转运蛋白可分为A、B、C、D、E、F和G亚家族, 分别在Fe3+和Al3+等金属离子、类黄酮、四甲胺、水杨酸等次级代谢物质转运方面发挥作用。A亚家族的ALF5 (At3g23560)与转运四甲铵毒素物质相关[27]; C亚家族的EDS5 (At4g39030)可能与转运水杨酸或其前体物质相关[28]; D亚家族的FRD3 (At3g08040)具有维持拟南芥内环境铁离子动态平衡功能[29]; E亚家族的ATDX1 (At2g04070)在植物体内介导生物碱、抗生素和其他有毒化合物转出[30]; AtTT12 (At3g59030)定位在液泡膜上, 与原花青素的前体物质向液泡的转运有关[16,17]。研究者从彩色棉中分离到4个黄酮类基因, 共获得5个色素合成相关基因GhCHI、GhF3H、GhDFR、GhANS和GhANR, 并据此推测棕色棉中的色素物质是原花青素[31]。原花青素是在细胞质中合成的, 再经转运蛋白运输到液泡中。MATE家族蛋白在花青素和原花青素的转运过程中起重要作用[12,13]。本研究在彩色棉属棕色棉中鉴定出91个GhMATE家族成员, 分为7个亚家族, 其中13个棕色棉MATE基因与拟南芥原花青素转运相关基因TT12聚为一类, 表明MATE基因可能参与细胞内原花青素向液泡的转运, 从而影响彩色棉纤维颜色的形成。转运蛋白的亚细胞定位对其行使生物学功能至关重要, 不同的亚细胞定位可能引起转运蛋白功能的差异。植物MATE蛋白主要定位于质膜或液泡膜[32]。转运原花青素的MATE转运蛋白大多定位在液泡膜上, 将原花青素的前体物质糖基化/酰基化的表儿茶素转运至液泡中[11,33]。本研究表明, 多数GhMATE定位在细胞膜上, 少数定位在液泡膜, 叶绿体膜和细胞质膜上。8个定位在液泡膜上的GhMATE基因可能与原花青素的前体物质糖基化/酰基化表儿茶素的转运有关, 使原花青素在液泡中积累、聚合形成不同聚合度的原花青素聚合物, 从而决定彩色棉纤维的颜色。由于E亚家族的GhMATE基因和定位于液泡膜的GhMATE基因可能与原花青素的转运相关, 推测它们可能存在较高的一致性, 比较后发现, 两组基因仅有一个重合的基因GhMATE13, 说明研究者对植物MATE家族基因的结构和功能研究尚不完善, 其他亚家族成员中也可能存在与原花青素转运相关的基因。
MATE蛋白家族长度在400~700个氨基酸之间, 大多数氨基酸成员包括400~550个残基[34]。本研究中GhMATE家族成员编码374~548个氨基酸残基, 符合MATE家族成员的基本特征。根据前人研究, MATE转运蛋白约有12个TM, 如拟南芥MATE蛋白家族含有8~13个TM, FRD3含有13个, EDS5含有11个TM[35]。12个TM是植物MATE蛋白行使功能的核心元件[36]。本研究发现84个蛋白序列均含有12个TM, 1个蛋白含有13个TM, 5个蛋白少于12个TM。12个TM符合MATE转运蛋白的基本特征, 表明大多数GhMATE蛋白均具有行使蛋白功能的完整核心元件。
GhMATE基因在棕色棉、白色棉不同组织和棉纤维细胞的不同发育时期均有表达, 从7个亚家族中共找到7个在棕色棉纤维中优势表达的GhMATE基因, 其中GhMATE13和GhMATE23在棕色棉纤维中的表达量明显高于白色棉, 且都定位于液泡膜上。拟南芥TT12是第一个被发现定位于液泡膜上, 参与原花青素前体表儿茶素3′-葡萄糖苷的转运蛋白[12,18,33]。苜蓿MATE1定位在液泡膜上, 优先运输原花青素合成前体表儿茶素3’-O-葡糖苷, 能够弥补拟南芥tt12突变体种子的表型缺陷[12,20]。葡萄中也鉴定出2个与MATE家族序列同源性很高的基因AM1和AM3, 在花青素生物合成的组织中表达, 特异运输酰基化的花青素[37]。Frank等[21]在苹果中克隆了2个MATE基因, 命名为MdMATE1和MdMATE2, 系统进化分析表明, 它们与TT12聚为一类, 这2个基因均能使拟南芥tt12突变体恢复至野生型, 证明MdMATE1和MdMATE2是苹果中转运原花青素的关键基因[16]。本研究通过系统发育分析, 发现GhMATE13蛋白与拟南芥原花青素转运相关蛋白TT12聚为一类, 且都定位在液泡膜上, 表明GhMATE13可能参与原花色素的转运及液泡积累, 在彩色棉纤维颜色形成过程中起重要作用。GhMATE23只定位于液泡膜上, 属于A亚家族成员, 推测在棕色棉颜色形成过程中可能发挥着重要作用, 其功能有待进一步研究。本研究有助于进一步研究GhMATE家族基因在棕色棉纤维颜色形成中的作用机制。
4 结论
鉴定出91个GhMATE家族基因, 将它们分为A、B、C、D、E、F和G 7个亚家族, 其中84个GhMATE蛋白具有12个典型的跨膜结构域, GhMATE家族成员被定位在25条染色体上, 共形成5个基因簇。GhMATE13和GhMATE23在棕色棉纤维中的表达量明显高于在白色棉中, 可能在棕色棉纤维的颜色形成过程中发挥重要作用。参考文献 原文顺序
文献年度倒序
文中引用次数倒序
被引期刊影响因子
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 2]
,
[本文引用: 3]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 2]
,
[本文引用: 5]
,
[本文引用: 3]
,
DOI:10.1038/nature09408URLPMID:20861838 [本文引用: 2]
Transporter proteins from the MATE (multidrug and toxic compound extrusion) family are vital in metabolite transport in plants, directly affecting crop yields worldwide. MATE transporters also mediate multiple-drug resistance (MDR) in bacteria and mammals, modulating the efficacy of many pharmaceutical drugs used in the treatment of a variety of diseases. MATE transporters couple substrate transport to electrochemical gradients and are the only remaining class of MDR transporters whose structure has not been determined. Here we report the X-ray structure of the MATE transporter NorM from Vibrio cholerae determined to 3.65, revealing an outward-facing conformation with two portals open to the outer leaflet of the membrane and a unique topology of the predicted 12 transmembrane helices distinct from any other known MDR transporter. We also report a cation-binding site in close proximity to residues previously deemed critical for transport. This conformation probably represents a stage of the transport cycle with high affinity for monovalent cations and low affinity for substrates.
,
[本文引用: 2]
,
[本文引用: 3]
,
DOI:10.1093/jxb/erp312URLPMID:2803208 [本文引用: 3]
FLOWER FLAVONOID TRANSPORTER (FFT) encodes a multidrug and toxin efflux family transporter in Arabidopsis thaliana. FFT (AtDTX35) is highly transcribed in floral tissues, the transcript being localized to epidermal guard cells, including those of the anthers, stigma, siliques and nectaries. Mutant analysis demonstrates that the absence of FFT transcript affects flavonoid levels in the plant and that the altered flavonoid metabolism has wide-ranging consequences. Root growth, seed development and germination, and pollen development, release and viability are all affected. Spectrometry of mutant versus wild-type flowers shows altered levels of a glycosylated flavonol whereas anthocyanin seems unlikely to be the substrate as previously speculated. Thus, as well as adding FFT to the incompletely described flavonoid transport network, it is found that correct reproductive development in Arabidopsis is perturbed when this particular transporter is missing.
,
[本文引用: 2]
[本文引用: 1]
,
[本文引用: 2]
,
[本文引用: 2]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
DOI:10.1021/jo035400uURL [本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
DOI:10.1016/j.bbrc.2007.04.084URLPMID:17482578 [本文引用: 1]
Five flavonoid structural genes, encoding chalcone isomerase, flavanone 3-hydroxylase, dihydroflavonol 4-reductase, anthocyanidin synthase, and anthocyanidin reductase, were cloned from a brown-fiber cotton line (T586). The predicted proteins of these genes exhibit high sequence similarity with corresponding enzymes from various plants. RT-PCR analysis showed these genes are developmentally co-regulated and preferentially expressed in developing fibers of T586. Expression analyses and dimethylaminocinnaldehyde staining demonstrated that high transcript levels of these genes in developing fibers and presence of proanthocyanidins in mature fibers co-segregated with brown fiber in a recombination inbred line population. Our results indicated that the cloned flavonoid structural genes and proanthocyanidins were involved in the pigmentation in brown cotton fibers.
,
[本文引用: 1]
,
[本文引用: 2]
,
DOI:10.1142/S021812740601454XURL [本文引用: 1]
Plants produce a large number of secondary metabolites, such as alkaloids, terpenoids, and phenolic compounds. Secondary metabolites have various functions including protection against pathogens and UV light in plants, and have been used as natural medicines for humans utilizing their diverse biological activities. Many of these natural compounds are accumulated in a particular compartment such as vacuoles, and some are even translocated from source cells to sink organs via long distance transport. Both primary and secondary transporters are involved in such compartmentation and translo-cation, and many transporter genes, especially genes belonging to the multidrug and toxin extrusion type transporter family, which consists of 56 members in Arabidopsis, have been identified as responsible for the membrane transport of secondary metabolites. Better understandings of these transporters as well as the biosynthetic genes of secondary metabolites will be important for metabolic engineering aiming to increase the production of commercially valuable secondary metabolites in plant cells.
,
[本文引用: 1]
,
DOI:10.1046/j.1432-1033.2003.03418.xURLPMID:12603313 [本文引用: 1]
The multidrug/oligosaccharidyl-lipid/polysaccharide (MOP) exporter superfamily (TC #2.A.66) consists of four previously recognized families: (a) the ubiquitous multi-drug and toxin extrusion (MATE) family; (b) the prokaryotic polysaccharide transporter (PST) family; (c) the eukaryotic oligosaccharidyl-lipid flippase (OLF) family and (d) the bacterial mouse virulence factor family (MVF). Of these four families, only members of the MATE family have been shown to function mechanistically as secondary carriers, and no member of the MVF family has been shown to function as a transporter . Establishment of a common origin for the MATE, PST, OLF and MVF families suggests a common mechanism of action as secondary carriers catalyzing substrate/cation antiport. Most protein members of these four families exhibit 12 putative transmembrane -helical segments (TMSs), and several have been shown to have arisen by an internal gene duplication event; topological variation is observed for some members of the superfamily. The PST family is more closely related to the MATE, OLF and MVF families than any of these latter three families are related to each other. This fact leads to the suggestion that primordial proteins most closely related to the PST family were the evolutionary precursors of all members of the MOP superfamily. Here, phylogenetic trees and average hydropathy, similarity and amphipathicity plots for members of the four families are derived and provide detailed evolutionary and structural information about these proteins. We show that each family exhibits unique characteristics. For example, the MATE and PST families are characterized by numerous paralogues within a single organism (58 paralogues of the MATE family are present in Arabidopsis thaliana ), while the OLF family consists exclusively of orthologues, and the MVF family consists primarily of orthologues. Only in the PST family has extensive lateral transfer of the encoding genes occurred, and in this family as well as the MVF family, topological variation is a characteristic feature. The results serve to define a large superfamily of transporters that we predict function to export substrates using a monovalent cation antiport mechanism.
,
[本文引用: 1]