删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

4种模式植物LRR VIII-2亚家族基因的鉴定和进化历史分析

本站小编 Free考研考试/2022-01-01

闫晨阳1,2, 陈赢男,1,2,*1南京林业大学, 林木遗传与生物技术省部共建教育部重点实验室, 南京 210037
2南京林业大学林学院, 南方现代林业协同创新中心, 南京 210037

Identification and Evolution of LRR VIII-2 Subfamily Genes in Four Model Plant Species

Chenyang Yan1,2, Yingnan Chen,1,2,*1Key Laboratory of Forest Genetics and Biotechnology of Ministry of Education, Nanjing Forestry University, Nanjing 210037, China
2Co-Innovation Center for the Sustainable Forestry in Southern China, College of Forestry, Nanjing Forestry University, Nanjing 210037, China

通讯作者: *E-mail: chenyingnan@njfu.edu.cn

责任编辑: 白羽红
收稿日期:2019-08-16接受日期:2020-03-23网络出版日期:2020-07-01
基金资助:青年人才托举工程(YESS20160121)
江苏省高校“青蓝工程”优秀青年骨干教师和江苏省优势学科PAPD


Corresponding authors: *E-mail: chenyingnan@njfu.edu.cn
Received:2019-08-16Accepted:2020-03-23Online:2020-07-01


摘要
全基因组重复与串联重复是发生基因重复的重要机制, 也是基因组和遗传系统多样化的重要动力。LRR-RLK编码富含亮氨酸重复的类受体蛋白激酶, 是被子植物进化史上发生大规模扩张而形成的多基因家族。拟南芥(Arabidopsis thaliana) AtLRR-RLK包含15个亚家族, AtLRR VIII-2是其中发生串联重复比例最高的亚家族。通过分析拟南芥、杨树(Populus trichocarpa)、葡萄(Vitis vinifera)和番木瓜(Carica papaya) 4种模式植物中LRR VIII-2亚家族基因的扩张及差异保留情况, 结果显示, LRR VIII-2在杨树中的扩张程度最高, 在拟南芥和葡萄中的扩张程度居中, 但在番木瓜中发生丢失。拟南芥、杨树和葡萄LRR VIII-2亚家族具有旁系同源基因对, 但在番木瓜中未发现旁系同源基因。除杨树中的1对旁系同源基因外, 4种模式植物中LRR VIII-2亚家族的旁系和直系同源基因都受到较强的纯化选择作用。对LRR VIII-2亚家族进化历史的深入分析有助于理解基因重复在植物进化中的作用和意义, 可为预测同源基因功能及解析其它基因家族进化历史提供参考。
关键词: 类受体蛋白激酶;富含亮氨酸重复;全基因组重复;串联重复

Abstract
Whole-genome duplication and tandem duplication are two important mechanisms for gene duplication, which play important roles in promoting the genomic and genetic diversity. In Arabidopsis, AtLRR-RLK encodes receptor-like kinases rich in leucine repeats, which is a multi-gene family arising from large-scale gene expansion during angiosperm evolution. It is composed of 15 subfamilies, among which, AtLRR VIII-2 is the subfamily with the highest proportion of tandem repeats. In this study, we use the genes in LRR VIII-2 as an example to analyze the gene expansion and differential retention in four model plants (Arabidopsis thaliana, Populus trichocarpa, Vitis vinifera and Carica papaya). Results showed that paralogous gene pairs were identified in the LRR VIII-2 subfamily in Arabidopsis, poplar and grape, while no such pair was found in papaya. The LRR VIII-2 subfamily expanded the most significantly in poplar and moderately expanded in Arabidopsis and grape, but some genes of the LRR VIII-2 subfamily in papaya have been lost. In addition, the paralogous and orthologous genes in the LRR VIII-2 subfamily were under strong purifying selection in the four investigated plant species, except for a pair of paralogous genes in poplar. An in-depth phylogenetic analysis of the LRR VIII-2 subfamily helps to understand the role and significance of gene duplication in plant evolution, and provides useful information for predicting the function of homologous gene among different species. This analytical pipeline is also applicable for deciphering the evolution history of other gene families.
Keywords:receptor-like protein kinases;leucine-rich repeats;whole-genome duplication;tandem duplication


PDF (1184KB)摘要页面多维度评价相关文章导出EndNote|Ris|Bibtex收藏本文
引用本文
闫晨阳, 陈赢男. 4种模式植物LRR VIII-2亚家族基因的鉴定和进化历史分析. 植物学报, 2020, 55(4): 442-456 doi:10.11983/CBB19157
Yan Chenyang, Chen Yingnan. Identification and Evolution of LRR VIII-2 Subfamily Genes in Four Model Plant Species. Chinese Bulletin of Botany, 2020, 55(4): 442-456 doi:10.11983/CBB19157


蛋白激酶参与的可逆磷酸化调控在植物体响应外界环境和内部细胞间的各种信号刺激过程中发挥重要作用(闫锋等, 2009; 张兆沛等, 2009; Lehti-Shiu and Shiu, 2012; 王鹤飞等, 2015)。植物蛋白激酶种类繁多, 根据激酶催化域氨基酸序列的相似性可分为5组(Stone and Walker, 1995)。(1) AGC组, 包括环核苷酸依赖的蛋白激酶家族(PKA和PKG)、蛋白激酶C家族(PKC)和核糖体S6激酶家族; (2) CaMK组, 包括Ca2+/钙调素依赖的蛋白激酶家族(CDPK)和SNF1/ AMPK家族; (3) CMGC组, 包括细胞周期蛋白依赖的蛋白激酶(CDK)、促分裂原活化蛋白激酶(MAPK)、糖原合成酶激酶-3 (GSK-3)和酪蛋白激酶II (CKII)家族; (4) 酪氨酸蛋白激酶(PTK)组; (5) 其它组, 包括类受体蛋白激酶(receptor-like protein kinase, RLK)等不能归于上述4组的蛋白激酶。

RLK是植物中普遍存在的、数量最多的一类蛋白激酶(郑超等, 2016), 在拟南芥(Arabidopsis thaliana)中约占所有蛋白激酶的60% (Shiu and Bleecker, 2003)。典型的植物RLKs具有胞外区、跨膜区和胞内激酶区(Shiu and Bleecker, 2001a)。根据胞外结构域特征和胞内激酶结构域序列的系统发生关系, 可以将拟南芥AtRLK分为45个亚家族(Shiu and Bleecker, 2001b)。富含亮氨酸重复序列(leucine-rich repeats, LRR)型是其中最大的一类, 包含15个亚家族(LRR I-XV)。其中LRR VIII分为LRR VIII-1LRR VIII-2。富含亮氨酸重复类受体蛋白激酶(LRR-RLKs)胞内激酶结构域相对保守, 胞外受体结构域含有富含亮氨酸的保守基序LXXLXLXX (L代表亮氨酸残基, X代表任意氨基酸残基) (Song et al., 2008)。LRR-RLKs在调控植物的生长发育、激素信号转导以及响应逆境胁迫等方面发挥重要作用。例如, 拟南芥CLV (LRR XI亚家族)信号途径能够调控茎顶端分生组织干细胞数量, 维持细胞分裂与分化之间的动态平衡(Clark et al., 1997; Ogawa et al., 2008); 拟南芥BAK1 (LRR II亚家族)与BRI1 (LRR X亚家族)形成的二聚体在油菜素内酯的信号转导过程中发挥关键作用(Colcombet et al., 2005; Albrecht et al., 2005); FLS2 (LRR XII亚家族)能够通过胞外的LRR结构域识别病原菌鞭毛蛋白, 介导植物的免疫反应(Gómez-Gómez and Boller, 2000)。此外, 拟南芥CRPK1 (LRR VIII-2亚家族)通过磷酸化14-3-3蛋白, 精确调控植物低温胁迫响应(Liu et al., 2017)。

基因重复(gene duplication)及随后的基因功能多样性分化是基因组和遗传系统分化的重要动力, 在生物进化过程中发挥极其重要的作用(Moore and Purugganan, 2003)。基因重复可以通过多种方式进行, 包括片段重复(segmental duplication)、全基因组重复(whole-genome duplication)、串联重复(tandem duplication)和转座重复(transpositional duplication) (Freeling, 2009)。在众多的植物基因家族中, 对RLKs基因家族的进化历史研究比较深入, 特别是其中的LRR-RLKs (Tang et al., 2010; Fischer et al., 2016)。植物基因组中存在大量的LRR-RLKs基因, 已发现在双子叶植物拟南芥、油菜(Brassica rapa)、番茄(Solanum lycopersicum)和杨树(Populus trichocarpa)基因组中分别有235、303、234和379个LRR- RLKs编码基因(Shiu and Bleecker, 2001a; Zan et al., 2013; Rameneni et al., 2015; Wei et al., 2015); 在单子叶植物水稻(Oryza sativa)中有309个, 小麦(Triticum aestivum)中多达531个(Sun and Wang, 2011; Shumayla et al., 2016)。在多种植物中开展的生物信息学分析表明, 串联重复和片段或全基因组重复(segmental or whole-genome duplication, S/ WGD)是LRR-RLKs类基因发生扩张的主要机制(Shiu and Bleecker, 2001b, 2003; Sun and Wang, 2011; Zan et al., 2013)。在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003)。此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b)。

基因组共线性分析揭示了拟南芥、杨树、葡萄(Vitis vinifera)和番木瓜(Carica papaya)起源于共同的古六倍体祖先。在长期的进化过程中, 拟南芥基因组经历了3次全基因组重复(α-二倍化、β-二倍化和γ-三倍化), 杨树基因组存在2次全基因组重复(γ-三倍化和p-二倍化), 在葡萄和番木瓜中仅存在1次全基因组重复事件(γ-三倍化) (The Arabidopsis Genome Initiative, 2000; Tang et al., 2008a, 2008b; Guo et al., 2014; Dai et al., 2014)。由于全基因组重复事件祖先基因发生倍增, 导致基因剂量增加, 并可能经历不同的进化命运: (1) 新功能化(neofunctionalization), 倍增后的2个拷贝都保留下来, 其中1个拷贝保留了祖先基因的功能, 而另外1个拷贝获得了新功能; (2) 假基因化(non-functionalization), 1个冗余拷贝由于随机突变成为无功能的假基因或者发生DNA序列丢失; (3) 亚功能化(subfunctionalization), 2个拷贝都由于突变导致功能部分受损, 必须互补合作才能完成原来祖先基因的功能(孙红正和葛颂, 2010); (4) 剂量选择(dosage selection), 对有利剂量效应的选择使2个拷贝均保留下来并保持原有的功能(Conant and Wolfe, 2008)。追溯祖先基因在现代植物基因组中的扩张和保留情况有助于深入理解倍增基因在生物体进化过程中的作用和意义。本研究选用基因组共线性关系明确的4种模式植物拟南芥、杨树、番木瓜和葡萄, 以LRR VIII-2亚家族为例, 通过在不同植物中鉴定该亚家族基因成员, 分析其在不同植物中发生基因扩张、差异保留及表达分化情况, 以期为深入揭示LRR VIII-2亚家族基因的功能及从系统发育角度阐明其它基因家族的进化历史提供参考。

1 材料与方法

1.1 基因组序列来源

拟南芥(Arabidopsis thaliana, TAIR10)、毛果杨(Populus trichocarpa, v3.0)、番木瓜(Carica papaya, ASGPB v0.4)以及葡萄(Vitis vinifera, Genoscope. 12×) 4种模式植物的基因组数据从Phytozome数据库(https: //phytozome.jgi.doe.gov/pz/portal.html)下载。

1.2 4种模式植物LRR VIII-2亚家族成员鉴定

利用拟南芥AtLRR VIII-2亚家族14个成员的蛋白序列(Shiu and Bleecker, 2001b), 分别与毛果杨、番木瓜和葡萄的蛋白序列进行BlastP比对, 查找不同植物中LRR VIII-2亚家族的候选基因, 设置E-value≤e-20 (Shiu and Bleecker, 2001b), Identity≥40% (Tian and Skolnick, 2003)。利用在线工具SMART (Letunic and Bork, 2018)、Pfam (Finn et al., 2014)和NCBI CD-search (Marchler-Bauer et al., 2011), 在比对出的候选基因中筛选出具有AtLRR VIII-2蛋白结构域的成员, 选择默认参数。同时, 应用Hmmbuild在线工具(Finn et al., 2011)构建AtLRR VIII-2亚家族的隐马尔科夫模型, 基于该模型对候选基因进行筛选。取上述2种筛选方法中共同保留下来的候选基因, 进一步利用PAUP (Phylogenetic Analysis Using Parsimony) 软件(Cummings, 2004), 基于邻接法, 最小进化、最大简约性标准(Shiu and Bleecker, 2001b), 与拟南芥所有235个LRR-RLKs成员(Shiu and Bleecker, 2001a)构建系统发育树。以葡萄球菌属(Staphylococcus)的氨基糖苷激酶APH3 (Shiu and Bleecker, 2001b)为外类群, 将其中与AtLRR VIII-2聚类在同一分支的基因鉴定为该物种的LRR VIII-2亚家族成员。

1.3 旁系同源与直系同源基因鉴定

4种模式植物LRR VIII-2亚家族中旁系同源(paralogous)与直系同源(orthologous)基因的鉴定基于转录本序列。从Phytozome数据库中获取各基因的转录本序列, 通过Blastn方法鉴定相似序列, 结合系统发育树分析结果, 相似性阈值设为≥300 bp且Identity≥ 40% (Blanc and Wolfe, 2004)。在旁系同源基因的鉴定中, 将同一植物中LRR VIII-2亚家族成员进行两两比对, 筛选出相似序列。在直系同源基因的鉴定中, 每2种植物作为1对进行分析。首先用makeblastdb对2个物种的全部CDS序列分别建库, 再用Blastn交叉搜索, 如果2个基因互为最佳匹配且相似性超过阈值, 则认为这2个基因是直系同源对(Blanc and Wolfe, 2004)。将LRR VIII-2同源基因对的CDS序列依次输入MEGA7, 进行密码子比对。将比对结果通过DnaSP (Librado and Rozas, 2009)计算KaKs值。

1.4 LRR VIII-2亚家族系统发育树构建

将4种模式植物的LRR VIII-2亚家族的蛋白序列导入PAUP软件(Cummings, 2004), 以APH3为外类群构建多物种系统发育树, 采用邻接法(neighbor joining, NJ), Bootstrap=1 000。利用在线软件LRRsearch (http://www.lrrsearch.com/) (Bej et al., 2014)预测胞外结构域。

1.5 LRR VIII-2亚家族基因重复方式分析

在基因组进化过程中, 基因可以通过串联重复、片段重复或全基因组重复等方式发生扩张(Freeling, 2009)。串联重复基因同时满足2个条件: (1) 位于同一染色体上、基因间隔区≤100 kb (Guo et al., 2014); (2) 基因序列相似性超过阈值(相似区域覆盖较长序列的70%以上, 且Identity>70%) (Yang et al., 2008)。为鉴定LRR VIII-2亚家族中通过片段/全基因组重复(S/WGD)方式扩张产生的基因, 首先从PGDD (plant genome duplication database)数据库(Lee et al., 2012)下载4种植物种内及种间基因组共线性数据, 从中筛选出含有LRR VIII-2亚家族基因的成对共线性区段(Block pair), 计算Block pair上所有共线性基因对(包括LRR VIII-2及其侧翼共线性同源基因)的Ks中值, 并根据Ks中值估算该染色体区段(Block)所经历的S/WGD事件, 即位于该区段的LRR VIII-2亚家族基因的扩张方式(Guo et al., 2014)。对于既不属于串联重复也不属于S/WGD方式产生的旁系同源基因, 则认为通过其它重复方式产生(Hwang et al., 2011)。

1.6 低温胁迫下LRR VIII-2基因的表达分析

利用NCBI基因表达数据库(gene expression omnibus, GEO)获得拟南芥在低温胁迫条件下的数字表达谱(GSE130729) (Jia et al., 2016), 从中提取LRR VIII-2亚家族成员的表达信息。利用TBtools (Chen et al., 2002)绘制热图, 并对每个基因的表达数据进行正态标准化(Yu et al., 2014), 即Z-score标准化(均值为0, 标准差为1)。

选取生根培养1个月、长势一致的山新杨(P. davidiana × P. bolleana)组培苗, 置于23°C光照培养箱预培养1天, 然后置于4°C光照培养箱进行不同时间的低温处理。以处理0小时的样品为对照, 每个处理设3次重复。提取叶片和根系的总RNA, 进行荧光定量PCR反应。引物序列见表1

Table 1
表1
表1实时定量PCR所用引物
Table 1Primers for real-time qPCR
Primer namePrimer sequence (5'-3')Length (bp)
P7-FGGGTATTTTATGAGAAAGGGGA128
P7-RCAACTTTGACACTTCCTGGGT
P8-FCTCCGGCCTTCCATGTCTAC285
P8-RTGGGAATTTCTCTCGCGTTG
P26-FCAGAGCTACACAAACCACAGAAG158
P26-RTGAGCATTCCCTTGTAAACAGAG
P27-FTACGAGCACCCTTCAACACC300
P27-RAAGCGTCATGGTCGTGCTT
UBQ-FGTTGATTTTTGCTGGGAAGC192
UBQ-RGATCTTGGCCTTCACGTTGT

新窗口打开|下载CSV

2 结果与讨论

2.1 LRR VIII-2亚家族基因的特征

利用AtLRR VIII-2亚家族成员蛋白序列, 分别在杨树、葡萄和番木瓜基因组中检索到LRR VIII-2候选基因877、452和234个。在此基础上, 结合蛋白结构域分析和隐马尔科夫模型筛选, 在上述3种模式植物中分别筛选出205、91和60个高质量的蛋白序列。进一步结合系统发生树, 在杨树、葡萄和番木瓜基因组中分别鉴定出LRR VIII-2亚家族基因38、21和11个。以物种拉丁名首字母为前缀, 并根据基因在染色体上的位置, 将这些基因按顺序进行编号(表2)。

Table 2
表2
表24种模式植物中84个LRR VIII-2基因的特征
Table 2Features of 84 LRR VIII-2 genes identified in four model plant species
CodeGene IDChr.Genomic locationNo. of exonsProtein length (aa)Extracellular domain
A1AT1G07650At12359111-2366736251020LRR10
A2AT1G16670At15697216-56998706390K
A3AT1G29720At110393659-10399873251019LRR12
A4AT1G29730At110400564-1040591324969LRR11
A5AT1G29740At110407220-10413119261078LRR5
A6AT1G29750At110413853-10420774241021LRR9
A7AT1G53420At119926626-1993149423953LRR10
A8AT1G53430At119934987-19941185231030LRR9
A9AT1G53440At119945869-19951562231035LRR11
A10AT1G56120At120987128-20993572231047LRR11
A11AT1G56130At120994746-21001013241032LRR6
A12AT1G56140At121001269-21007855241033LRR6
A13AT3G09010At32749908-27523906393K
A14AT3G14840At34988008-4994109241020LRR11
P1Potri.001G308600Pt0131227276-31234883241006LRR10
P2Potri.001G385200Pt0140032658-40043384241007LRR11
P3Potri.001G385300Pt0140046269-40056753241021LRR13
P4Potri.001G385400Pt0140060761-40069904241036LRR10
P5Potri.001G385900Pt0140135506-4014555622982LRR7
P6Potri.001G386300Pt0140164017-4017801423989LRR5
P7Potri.001G393200Pt0141232410-412354196396K
P8Potri.001G438400Pt0147008564-470131546396K
P9Potri.003G025600Pt033062484-306954022944LRR3
P10Potri.003G025800Pt033088186-310088924999LRR3
P11Potri.003G148000Pt0316311568-16319951211041LRR13
P12Potri.004G040200Pt043050127-30550206373K
P13Potri.004G063200Pt045205009-5216081231092LRR12
P14Potri.004G063500Pt045238500-5250295241011LRR9
P15Potri.004G063600Pt045255561-52590936468TK
P16Potri.004G063900Pt045275636-52790616464TK
P17Potri.004G135500Pt0415551257-15559647241029LRR12
CodeGene IDChr.Genomic locationNo. of exonsProtein length (aa)Extracellular domain
P18Potri.006G128500Pt0610474234-104770755471K
P19Potri.007G067900Pt078907797-8916407241036LRR12
P20Potri.008G040800Pt082314252-23201064341K
P21Potri.010G221400Pt1020632758-206350636366K
P22Potri.011G049600Pt114238297-42436765374K
P23Potri.011G072300Pt116917401-6930365241024LRR8
P24Potri.011G075400Pt117247330-7259126221003LRR9
P25Potri.011G106400Pt1112955841-12965039221015LRR11
P26Potri.011G112000Pt1113684010-136892526396K
P27Potri.011G142100Pt1116335090-163388636393K
P28Potri.016G114800Pt1611913776-119184107385K
P29Potri.019G005200Pt19554428-56452024801LRR5
P30Potri.019G005300Pt19582783-593615241003LRR8
P31Potri.019G005700Pt19655851-66447923978LRR6
P32Potri.019G005900Pt19681330-69021024990LRR3
P33Potri.019G006000Pt19699799-70889124964LRR5
P34Potri.019G007900Pt19921639-930444231002LRR3
P35Potri.019G008900Pt191038688-104704924972LRR9
P36Potri.019G009700Pt191141831-115130113988LRR3
P37Potri.019G009800Pt191159163-116775624989LRR9
P38Potri.T072700scaffold_7911693-1861322945LRR8
V1GSVIVT01006444001chrUn26044571-260500968441K
V2GSVIVT01013608001chrUn1284866-130107224994LRR12
V3GSVIVT01013612001chrUn1429686-145382621897LRR10
V4GSVIVT01013621001chrUn1735676-179322324911LRR11
V5GSVIVT01014113001Vv19501306-518217231036LRR9
V6GSVIVT01014134001Vv19669185-677944241021LRR10
V7GSVIVT01014138001Vv19719037-72646523935LRR10
V8GSVIVT01014145001Vv19793325-80096421904LRR5
V9GSVIVT01014147001Vv19813603-825355241063LRR5
V10GSVIVT01014150001Vv19846312-864401301181LRR11
V11GSVIVT01014221001Vv191629917-16366136385K
V12GSVIVT01020456001Vv1919137067-191421166385K
V13GSVIVT01020786001Vv121992495-2002600241011LRR10
V14GSVIVT01021280001Vv103340198-3390494241107LRR10
V15GSVIVT01021285001Vv103439036-3462765291144LRR12
V16GSVIVT01021289001Vv103527408-3540220241008LRR10
V17GSVIVT01021291001Vv103556246-3578182241017LRR11
V18GSVIVT01024760001Vv67166910-71697396372K
V19GSVIVT01025676001Vv813018070-130205947433K
V20GSVIVT01033973001Vv816186419-161928096380K
V21GSVIVT01038011001Vv1012545889-12562513241003LRR11
C1evm.model.supercontig_124.16supercontig_124342359-3550549651TK
C2evm.model.supercontig_124.19supercontig_124400979-4173738604TK
C3evm.model.supercontig_131.56supercontig_131437441-4404616380K
C4evm.model.supercontig_163.18supercontig_163423778-4272536397K
CodeGene IDChr.Genomic locationNo. of exonsProtein length (aa)Extracellular domain
C5evm.model.supercontig_2076.1supercontig_2076157-7662173K
C6evm.model.supercontig_748.4supercontig_74817410-219519583TK
C7evm.model.supercontig_77.35supercontig_77331417-33485610636LRR1
C8evm.model.supercontig_77.40supercontig_77398441-40447522880LRR10
C9evm.model.supercontig_77.43supercontig_77453480-45944923829LRR9
C10evm.model.supercontig_864.1supercontig_86413501-169446419K
C11evm.TU.contig_37590.1contig_37590240-21616365LRR1
LRR后的数字表示富含亮氨酸重复序列数; K表示没有LRR结构域的激酶; TK表示没有LRR结构域的跨膜激酶。
The number after LRR indicates the number of leucine-rich repeat; K indicates kinase without LRR domain; TK indicates transmembrane kinase without LRR domain.

新窗口打开|下载CSV

2.2 LRR VIII-2亚家族旁系同源与直系同源基因的鉴定与比较

分别在拟南芥、杨树和葡萄LRR VIII-2亚家族基因中鉴定出旁系同源基因5、90和20对, 但在番木瓜的LRR VIII-2中未鉴定出旁系同源基因(表3)。在4种模式植物中鉴定出6对直系同源基因, 其中番木瓜和葡萄的直系同源基因最多(3对) (表3)。在所有直系和旁系同源基因的Ka/Ks值中, 仅发现P15-P16Ka/Ks大于1, 其余分布在0-0.859 0之间, 均值为0.39, 表明LRR VIII-2亚家族基因受到较强的纯化选择作用。拟南芥、杨树和葡萄旁系同源基因的Ka/Ks均值分别为0.26、0.41和0.38, 可见, 拟南芥LRR VIII-2中旁系同源基因受到的纯化选择作用最强。

Table 3
表3
表34种模式植物LRR VIII-2亚家族基因旁系同源与直系同源基因对
Table 3Paralogous and orthologous gene pairs in LRR VIII-2 subfamily identified in four model plant species
Gene pairKa/KsGene pairKa/KsGene pairKa/Ks
ParalogousA4-A50.2184P9-P250.3214P32-P360.4003
A8-A90.2680P10-P170.1596P32-P370.6808
A10-A110.2870P10-P250.3488P32-P380.3088
A10-A120.2910P12-P220.2362P33-P340.6734
A11-A120.2498P13-P230.2871P33-P350.5076
P1-P290.3010P14-P150.2140P33-P360.5615
P1-P300.3292P14-P160.1985P33-P370.6011
P1-P310.3020P15-P161.4030P33-P380.3093
P1-P320.3077P15-P240.3642P34-P350.5274
P1-P330.2955P16-P240.3469P34-P360.6011
P1-P340.3075P20-P210.1211P34-P370.7145
P1-P350.3188P29-P300.3678P34-P380.3139
P1-P360.2997P29-P310.3321P35-P360.3943
P1-P370.3122P29-P320.3381P35-P370.5829
P1-P380P29-P330.3334P35-P380.3204
P3-P40.3683P29-P340.3317P36-P370.4718
P3-P50.3731P29-P350.3411P36-P380.2992
P3-P60.4963P29-P360.3215P37-P380.3134
P3-P90.3791P29-P370.3392V2-V30.3479
P3-P100.4125P29-P380.3169V2-V40.2818
P3-P250.3422P30-P310.5422V2-V210.5377
P4-P50.4843P30-P320.6659V3-V40.3152
P4-P60.3907P30-P330.6512V3-V210.3481
P4-P90.7093P30-P340.8013V4-V210.2963
P4-P100.4706P30-P350.5957V6-V70.3152
P4-P170.1770P30-P360.5292V6-V80.2935
P4-P250.3206P30-P370.6763V6-V90.3034
P5-P60.3712P30-P380.3368V6-V100.2833
P5-P90.6021P31-P320.4655V7-V80.7300
P5-P100.8590P31-P330.4989V7-V90.5629
P5-P170.1715P31-P340.5435V7-V100.4047
P5-P250.3456P31-P350.4251V8-V90.4763
P6-P90.4063P31-P360.3099V8-V100.3629
P6-P100.4357P31-P370.5370V9-V100.3855
P6-P250.3556P31-P380.3142V14-V150.4844
P7-P260.5268P32-P330.5711V14-V160.2626
P8-P270.2579P32-P340.6597V15-V160.3233
P9-P100.6507P32-P350.5461V16-V170.2770
P9-P170.1859
OrthologousP7-C30.2223P28-C40.2070C4-V200.1760
P25-V100.2441C3-V110.2574C9-V100.2076
Ka: 非同义替换率; Ks: 同义替换率
Ka: Nonsynonymous substitution rate; Ks: Synonymous substitution rate

新窗口打开|下载CSV

2.3 LRR VIII-2亚家族基因的系统发生关系

4种模式植物的84个LRR VIII-2亚家族基因分布在2个大的一级分支下(Clade I和Clade II) (图1)。Clade I包含53个基因, 杨树LRR VIII-2基因在这一分支下发生明显扩张, 其次是葡萄。番木瓜中C5C7C8C11序列相似性更高, 在Clade I下聚集成1个独立的小分支; 而其余7个CpLRR VIII-2基因与其它植物的基因聚集在一起, 分散在进化树的不同分支。Clade II包含31个基因, 在鉴定出的6对直系同源基因中, 有4对分布在这一分支下, 说明Clade II下的LRR VIII-2亚家族基因在不同植物间具有共同的祖先基因。Clade II的基因可以分成3组, 其中Clade II-2具有完整的胞外LRR结构域、跨膜区及胞内激酶结构域; 而Clade II-1和Clade II-3只有胞内激酶结构域。

图1

新窗口打开|下载原图ZIP|生成PPT
图14种模式植物LRR VIII-2亚家族基因系统发生树

左侧部分为LRR VIII-2亚家族基因系统发生树, 右侧部分为每个基因的保守结构域分析。
Figure 1Phylogenetic tree of LRR VIII-2 subfamily genes in four model plant species

The left panel is the phylogenetic tree of LRR VIII-2 subfamily genes, and the right panel is the conserved domains of each gene.


2.4 LRR VIII-2亚家族基因重复方式

基于4种模式植物的基因组共线性数据, 我们筛选出42对包含33个LRR VIII-2亚家族基因的Block pair (表4)。计算每对Block pair的Ks中值, 结果显示, 杨树基因组内16对Block pair的Ks中值分布在2个区间: 0.259 2-0.355 1和1.278 45-1.491 2; 拟南芥基因组内唯一的1对Block pair的Ks中值为0.789 6; 葡萄基因组中检测到2对Block pair的Ks中值分别为1.131 35和1.112 55 (表4)。比较基因组学研究表明, 几乎所有被子植物基因组都经历过片段重复或全基因组重复事件(S/WGD), 可以利用Ks中值评估共线性染色体区段的历史重复事件(Blanc et al., 2003)。根据Tang等(2008b)的报道, 拟南芥基因组中与α重复事件相关的Ks中值为0.86; 毛果杨基因组中与γ和p重复事件相关的Ks中值分别为1.54和0.27; 番木瓜和葡萄基因组中与γ重复事件相关的Ks中值分别为1.76和1.22。参考以上Ks中值与全基因组重复事件的关系, 我们对筛选出的19对种内Block pair经历的重复事件进行了评估。结果表明, 杨树中与p和γ重复事件相关的Block pair分别有9对和7对; 拟南芥的1对Block pair与α重复事件相关; 葡萄中的2对Block pair均与γ重复事件相关(表4)。由于拟南芥、杨树、葡萄和番木瓜由共同的古六倍体祖先进化而来(Tang et al., 2008b), 共享γ重复事件, 因此将种间Block pair的关系归于γ重复事件。

Table 4
表4
表44种模式植物LRR VIII-2亚家族基因共线性同源基因及Ks
Table 4Collinearity of LRR VIII-2 subfamily homologous genes and Ks value in four model plant species
Block pair No.Code of locus 1Code of locus 2Block median KsS/WGD
Block pair within species21PN2P110.2592p
267P12P220.26815p
442P20P210.26975p
64P8P270.27455p
61PN1P250.2765p
61P7P260.2765p
303P17PN30.2983p
121P1P340.3034p
267P13P230.3551p
372P18P210.3625p
515P22P280.8329γ
284P12P280.93355γ
26P2P131.27845γ
274P14P251.3549γ
361P18P201.4912γ
503P23P251.6122γ
57A7A140.7968α
104V18V201.13135γ
28VN2V191.11255γ
Block pair between species608A13P281.6761γ
214A2P261.6727γ
35A2P71.986γ
32A6VN11.59645γ
382A13V201.7376γ
110A2V111.88175γ
932CN1P251.162γ
930CN1P21.09745γ
153CN2P131.1864γ
299CN3P281.2174γ
523CN4P221.12095γ
517CN4P121.1073γ
203CN5P260.98095γ
241P14VN11.0883γ
668P23V101.52975γ
657P23V131.4531γ
249P13V131.5376γ
978PN5V51.8582γ
668PN4V51.52975γ
81CN6V141.15γ
108CN5V111.0547γ
287CN4V11.0255γ
164CN3V201.06385γ
Block pair No.代表含有locus 1和2的成对共线性区段编号。基因编号中带字母N的表示该基因已不具备LRR VIII-2亚家族成员的特征结构域, 即非LRR VIII-2特征基因。S/WGD: 片段/全基因组重复; Ks: 同义替换率
Block pair No. indicates the number of the Block pair which contains the locus 1 and locus 2. Gene code containing a letter N represents that the gene has evolved into non-LRR VIII-2 that does not harbor the characteristic domain of LRR VIII-2 subfami-ly. S/WGD: Segmental/whole-genome duplication; Ks: Synonymous substitution rate

新窗口打开|下载CSV

根据上述分析结果, 我们绘制了4种模式植物LRR VIII-2祖先基因在全基因组重复后的保留和扩张全景图(图2), 图中位于同一行的基因起源于同一个古基因位点(ancestral locus)。同一个古基因通过多倍化事件产生的重复基因经历了不同的进化命运。例如, 图2第1行, 葡萄保留了γ重复事件后的3个拷贝(V1V18V20), 且都具备LRR VIII-2特征结构域; 番木瓜也保留了γ重复事件后的3个拷贝(C4CN3CN4), 但其中2个拷贝(CN3CN4)已亚功能化, 不再具备LRR VIII-2特征结构域; 杨树保留了p重复事件后的3个拷贝(P12P22P28), 3个拷贝发生基因丢失; 拟南芥仅保留1个(A13), 其余发生了基因丢失或共线性区段(syntenic chromosomal block, SCB)完全丢失。在4种模式植物中有36个基因的扩张方式与S/WGD事件相关, 在葡萄、番木瓜、杨树和拟南芥中分别为9、3、19和5个。

图2

新窗口打开|下载原图ZIP|生成PPT
图24种模式植物中LRR VIII-2祖先基因在古多倍化后的差异保留和扩张

左侧第1个数字为行号。方框代表种内和种间染色体共线性区段(SCB)。方框中的编码为定位于该SCB上的LRR VIII-2基因编号; 基因编号中带字母N的表示该基因与LRR VIII-2基因存在共线性同源关系, 但该基因已不具备LRR VIII-2亚家族成员的特征结构域; 字母L表示SCB上和LRR VIII-2亚家族对应的共线性基因丢失, 但该区段被保留下来; 空白位置表示SCB完全丢失。
Figure 2Differential retention and expansion of the ancestral LRR VIII-2 gene associated with paleopolyploidy events in four model plant species

The left first digit indicates the row number. Squares in the same line represent the syntenic chromosomal blocks (SCBs) within and between species. Gene codes in the square correspond to the associated LRR VIII-2 genes; gene code containing a letter N indicates that the gene has a collinear homologous relationship with the LRR VIII-2 gene, but the gene no longer has the characteristic domain of the members of the LRR VIII-2 subfamily; the letter L represents the corresponding SCB has been retained, but the duplicated LRR VIII-2 gene on the SCB has been lost; blank regions indicate the SCBs has been completely lost.


串联重复是基因扩张的一种重要方式。在拟南芥中发现7个LRR VIII-2基因(A4-A5A8-A9A10-A11-A12)具有串联重复关系; 在杨树中发现15个LRR VIII-2基因(P3-P4-P5-P6P9-P10P15-P16P30-P31-P32-P33P35-P36-P37)通过串联重复方式扩张, 这些基因大部分成簇聚集在Clade I下的2个分支(图1); 在葡萄中有6个LRR VIII-2基因(V6-V7-V8-V9V15-V16)通过串联重复方式扩张。而在番木瓜中未发现通过串联重复方式产生的LRR VIII-2基因。

以上对基因扩张方式的分析基本涵盖了表3中的所有同源基因。个别旁系同源基因未能推断出其扩张历史, 包括杨树的P24P29P38以及葡萄的V2V3V4V17V21。由于旁系同源基因由基因重复而来, 因此这些基因可能通过其它重复方式产生。除以上可以追溯扩张方式的LRR VIII-2亚家族成员外, 我们还检测了一些物种特异基因, 包括拟南芥2个(A1A3)、番木瓜8个(C1C2C5C6C7、C8C10C11)、杨树1个(P19)和葡萄1个(V12)。这些基因与LRR VIII-2亚家族的其它成员不存在同源关系, 它们可能是物种特有的LRR VIII-2古基因的遗迹(relics), 或由于基因高度分化导致同缘关系不可追溯。综上, 我们总结出4种模式植物LRR VIII-2亚家族基因的扩张方式(表5)。

Table 5
表5
表54种模式植物LRR VIII-2亚家族基因扩张方式
Table 5Expansion modes of LRR VIII-2 subfamily genes in four model plant species
Gene expansion modeArabidopsis thalianaPopulus trichocarpaCarica papayaVitis vinifera
No. of genes associated with S/WGD51939
No. of genes associated with tandem duplication71506
No. of genes expanded through other modes0305
No. of unique genes2181
Total number of genes in LRR VIII-2 subfamily14381121
S/WGD同表4
S/WGD is the same as Table 4.

新窗口打开|下载CSV

2.5 低温胁迫下LRR VIII-2基因的表达模式

AtLRR VIII-2成员AtCRPK1 (对应A2基因)在拟南芥响应低温胁迫中发挥调控作用。该基因在拟南芥各器官中组成型表达(Liu et al., 2017)。根据拟南芥低温(4°C)胁迫数字表达谱, 获得AtLRR VIII-2成员的表达水平(图3A)。A2基因在低温处理3小时表达量上调并在处理24小时下调; AtLRR VIII-2旁系同源基因中, 有串联重复关系的A4-A5A11-A12表达模式比较相近, 但A8-A9在低温处理24小时表达模式不同; 源于α重复事件的A7-A14在处理3和24小时的表达模式均不相同。

图3

新窗口打开|下载原图ZIP|生成PPT
图3低温胁迫对拟南芥和山新杨LRR VIII-2亚家族基因表达的影响

(A) 低温胁迫下拟南芥AtLRR VIII-2亚家族基因表达热图; (B) 低温胁迫下4个山新杨LRR VIII-2亚家族基因相对表达量。*表示差异显著(t-检验, P<0.05)。
Figure 3Expression of LRR VIII-2 genes under low temperature treatment in Arabidopsis thaliana and Populus davidiana × P. bolleana

(A) Transcriptome analysis of AtLRR VIII-2 genes in Arabidopsis treated with low temperature; (B) Relative expression of four LRR VIII-2 genes in P. davidiana × P. bolleana under low temperature stress. * indicate significant differences (t-test, P<0.05).


杨树P7P26A2起源于同一个祖先基因(图2); 但在序列的相似性上, P8P27与A2的相似性最高(图1)。此外, P7-P26P8-P27分别为p重复事件产生的旁系同源基因(图2)。为了探究低温对这些基因转录水平的影响, 我们用低温(4°C)处理山新杨组培苗, Real-time PCR检测结果表明, 在处理的不同时间点P8P27对低温胁迫的响应模式相近, 在叶片中表达量先升高(6和12小时)后下降(24和48小时), 但在根系中的表达量变化不明显(图3B)。P7P26的表达模式差异较大, P7在低温处理6小时的植株根系中表达量急剧上升, 然后迅速下降; 而P26在低温处理48小时的植株叶片中表达量才急剧上升(图3B)。由此推测, P8-P27在发生基因重复后功能上出现冗余, 而P7-P26基因重复后功能发生分化, P7P26分别参与植株根系和地上部对低温胁迫的响应。

2.6 讨论

基因组学研究表明, 现代蔷薇类植物起源于共同的古六倍体祖先(Tang et al., 2008b), 在随后的进化过程中, 不同谱系的植物可能经历过1轮或多轮全基因组重复事件。基因发生重复后的保留偏好性及其功能分化一直是生物学领域的热点问题。基于4种模式植物中LRR VIII-2古基因的差异保留和扩张全景图(图2), 我们推测出12个LRR VIII-2古基因, 这些古基因在番木瓜中发生丢失, 而在其它3种植物中发生不同程度的基因扩张, 在杨树中的扩张程度最高。拟南芥虽然经历过更多的全基因组重复事件, 但其基因扩张比例却低于杨树, 原因可能在于拟南芥基因组的碱基替换速率较其它3种植物高(Guo et al., 2014)。Fischer等(2016)鉴定了31种显花植物基因组中同时具备LRRs和激酶结构域的LRR-RLKs基因的数量, 并估算出被子植物祖先物种中LRR-RLKs古基因有150个。通过比较这些植物现代基因组中LRR-RLKs与古基因的数量, Fischer等(2016)发现番木瓜和百脉根(Lotus japonicus)是仅有的2种LRR-RLKs基因数目比古基因数目少的植物; 拟南芥和葡萄基因组中LRR-RLKs基因扩张比例分别为1.48和1.29, 处于中等水平; 而杨树是该基因家族扩张程度较高的植物, PtLRR-RLKs基因扩张比例超过2倍。上述研究结果与本研究针对LRR VIII-2亚家族的分析结果一致。

在拟南芥AtLRR VIII-2中有2个基因(A2A13)不具备胞外LRR结构域, 因此本研究鉴定的LRR VIII-2亚家族中一部分成员只有胞内的激酶结构域, 这些基因聚集成2个相对独立的分支Clade II-1和Clade II-3 (图1)。这些成员的构象与类受体胞内激酶(receptor-like cytoplasmic kinases, RLCKs)非常相近。在拟南芥235个LRR-RLKs基因中, 4.7%的成员无胞外结构域, 其可能是现存LRR-RLKs中激酶结构域的祖先形式, 在长期进化过程中通过结构域融合被募集到LRR-RLKs构象中(Shiu and Bleecker, 2001a)。本研究推断的12个LRR VIII-2古基因中, 7个具有完整的胞外LRR结构域、跨膜区及胞内激酶活性结构域, 这与Fischer等(2016)通过协调树构建法(tree reconciliation approach)鉴定的LRR VIII-2亚家族古基因数目(8个)非常接近。此外, 12个古基因中, 仅有3个在4种植物的现代基因组中能找到被保留下来的拷贝(图2, 第1-3行); 其余9个古基因仅在某一种植物中保留, 而在其它植物中丢失。例如, 葡萄的V5、杨树的P8和拟南芥的A7, 这些在某一特定物种保留下来的基因起源于不同的祖先基因, 可能在该物种中行使必不可少的功能。

物种内旁系同源和物种间直系同源基因的识别不仅有助于比较和进化基因组学研究, 对同源基因的功能预测和注释也有重要意义。常用的同源基因鉴定方法有基于序列相似性、系统发生关系、基因组共线性分析等, 但每种方法都有其自身的局限性。例如, 根据同一物种内基因序列相似性可以鉴定旁系同源基因, 但在长期的进化过程中, 同源基因序列的相似性可能被严重侵蚀, 从而导致鉴定结果有误。本研究中, 通过基因组共线性分析表明A7-A14源于α重复事件, P2-P14源于p重复事件, 具有旁系同源关系, 但在根据序列相似性鉴定旁系同源基因的过程中未发现它们是旁系同源基因。因此, 在同源基因的鉴定过程中需要结合使用多种方法。通常认为, 直系同源基因具有相似的结构和生物学功能(Feng et al., 2007); 而由基因重复产生的旁系同源基因常伴随基因功能的分化(Sonnhammer and Koonin, 2002; Gabaldón et al., 2009)。基因重复后的2个拷贝在表达上的分化是功能分化的重要一步(Li et al., 2005)。本研究中, 杨树P8P27与已有功能报道的A2直系同源, P8P27对低温胁迫的响应情况也与A2相似。此外, P7P26旁系同源, 但这2个基因在响应低温胁迫时的表达情况差异明显, 推测这2个基因出现了功能分化。

参考文献 原文顺序
文献年度倒序
文中引用次数倒序
被引期刊影响因子

孙红正, 葛颂 (2010). 重复基因的进化——回顾与进展
植物学报 45, 13-22.

[本文引用: 1]

王鹤飞, 李雪, 董玲丽, 张俊成, 赵茂林, 邢国珍, 王道文, 郑文明 (2015). 小麦受体样蛋白激酶及其衍生蛋白的研究进展
植物学报 50, 255-262.

[本文引用: 1]

闫锋, 祝传书, 庞保平 (2009). 植物类受体蛋白激酶的研究进展
西北植物学报 29, 851-858.

[本文引用: 1]

张兆沛, 王志伟, 张慧蓉 (2009). 植物类受体蛋白激酶研究概况
山西农业科学 37, 75-78.

[本文引用: 1]

郑超, 李登高, 白薇 (2016). 植物富含半胱氨酸的类受体激酶的研究进展
生物技术通报 32, 10-17.

[本文引用: 1]

Albrecht C, Russinova E, Hecht V, Baaijens E, de Vries S (2005). The Arabidopsis thaliana SOMATIC EMBRYOGENESIS RECEPTOR-LIKE KINASES 1 and 2 control male sporogenesis
Plant Cell 17, 3337-3349.

DOI:10.1105/tpc.105.036814URLPMID:16284305 [本文引用: 1]
The Arabidopsis thaliana SOMATIC EMBRYOGENESIS RECEPTOR-LIKE KINASE (SERK) family of plasma membrane receptors consists of five closely related members. The SERK1 and SERK2 genes show a complex expression pattern throughout development. Both are expressed in anther primordia up to the second parietal division. After this point, expression ceases in the sporocytes and is continued in the tapetum and middle layer precursors. Single knockout mutants of SERK1 and SERK2 show no obvious phenotypes. Double mutants of SERK1 and SERK2 are completely male sterile due to a failure in tapetum specification. Fertility can be restored by a single copy of either gene. The SERK1 and SERK2 proteins can form homodimers or heterodimers in vivo, suggesting they are interchangeable in the SERK1/SERK2 signaling complex.

Bej A, Sahoo BR, Swain B, Basu M, Jayasankar P, Samanta M (2014). LRRsearch: an asynchronous server- based application for the prediction of leucine-rich repeat motifs and an integrative database of NOD-like receptors
Comput Biol Med 53, 164-170.

DOI:10.1016/j.compbiomed.2014.07.016URLPMID:25150822 [本文引用: 1]
The leucine-rich repeat (LRR) motifs of the nucleotide-binding oligomerization domain like receptors (NLRs) play key roles in recognizing and binding various pathogen associated molecular patterns (PAMPs) resulting in the activation of downstream signaling and innate immunity. Therefore, identification of LRR motifs is very important to study ligand-receptor interaction. To date, available resources pose restrictions including both false negative and false positive prediction of LRR motifs from the primary protein sequence as their algorithms are relied either only on sequence based comparison or alignment techniques or are over biased for a particular LRR containing protein family. Therefore, to minimize the error (
Blanc G, Hokamp K, Wolfe KH (2003). A recent polyploidy superimposed on older large-scale duplications in the Arabidopsis genome
Genome Res 13, 137-144.

DOI:10.1101/gr.751803URLPMID:12566392 [本文引用: 1]
The Arabidopsis genome contains numerous large duplicated chromosomal segments, but the different approaches used in previous analyses led to different interpretations regarding the number and timing of ancestral large-scale duplication events. Here, using more appropriate methodology and a more recent version of the genome sequence annotation, we investigate the scale and timing of segmental duplications in Arabidopsis. We used protein sequence similarity searches to detect duplicated blocks in the genome, used the level of synonymous substitution between duplicated genes to estimate the relative ages of the blocks containing them, and analyzed the degree of overlap between adjacent duplicated blocks. We conclude that the Arabidopsis lineage underwent at least two distinct episodes of duplication. One was a polyploidy that occurred much more recently than estimated previously, before the Arabidopsis/Brassica rapa split and probably during the early emergence of the crucifer family (24-40 Mya). An older set of duplicated blocks was formed after the monocot/dicot divergence, and the relatively low level of overlap among these blocks indicates that at least some of them are remnants of a larger duplication such as a polyploidy or aneuploidy.

Blanc G, Wolfe KH (2004). Widespread paleopolyploidy in model plant species inferred from age distributions of duplicate genes
Plant Cell 16, 1667-1678.

DOI:10.1105/tpc.021345URLPMID:15208399 [本文引用: 2]
It is often anticipated that many of today's diploid plant species are in fact paleopolyploids. Given that an ancient large-scale duplication will result in an excess of relatively old duplicated genes with similar ages, we analyzed the timing of duplication of pairs of paralogous genes in 14 model plant species. Using EST contigs (unigenes), we identified pairs of paralogous genes in each species and used the level of synonymous nucleotide substitution to estimate the relative ages of gene duplication. For nine of the investigated species (wheat [Triticum aestivum], maize [Zea mays], tetraploid cotton [Gossypium hirsutum], diploid cotton [G. arboretum], tomato [Lycopersicon esculentum], potato [Solanum tuberosum], soybean [Glycine max], barrel medic [Medicago truncatula], and Arabidopsis thaliana), the age distributions of duplicated genes contain peaks corresponding to short evolutionary periods during which large numbers of duplicated genes were accumulated. Large-scale duplications (polyploidy or aneuploidy) are strongly suspected to be the cause of these temporal peaks of gene duplication. However, the unusual age profile of tandem gene duplications in Arabidopsis indicates that other scenarios, such as variation in the rate at which duplicated genes are deleted, must also be considered.

Chen C, Chen H, Zhang Y, Thomas HR, Frank MH, He Y, Xia R (2002). TBtools, an integrative toolkit developed for interactive analyses of big biological data
Mol Plant 13, 1194-1202.

URLPMID:32585190 [本文引用: 1]

Clark SE, Williams RW, Meyerowitz EM (1997). The CLAVATA1 gene encodes a putative receptor kinase that controls shoot and floral meristem size in Arabidopsis
Cell 89, 575-585.

URLPMID:9160749 [本文引用: 1]

Colcombet J, Boisson-Dernier A, Ros-Palau R, Vera CE, Schroeder JI (2005). Arabidopsis SOMATIC EMBRYOGENESIS RECEPTOR KINASES 1 and 2 are essential for tapetum development and microspore maturation
Plant Cell 17, 3350-3361.

URLPMID:16284306 [本文引用: 1]

Conant GC, Wolfe KH (2008). Turning a hobby into a job: how duplicated genes find new functions
Nat Rev Genet 9, 938-950.

URLPMID:19015656 [本文引用: 1]

Cummings MP (2004). PAUP* (phylogenetic analysis using parsimony (and other methods))
Santa Monica: American Cancer Society. pp. 37-45.

[本文引用: 2]

Dai XG, Hu QJ, Cai QL, Feng K, Ye N, Tuskan GA, Milne R, Chen YN, Wan ZB, Wang ZF, Luo WC, Wang K, Wan DS, Wang MX, Wang J, Liu JQ, Yin TM (2014). The willow genome and divergent evolution from poplar after the common genome duplication
Cell Res 24, 1274-1277.

DOI:10.1038/cr.2014.83URLPMID:24980958 [本文引用: 1]

Feng C, Mackey AJ, Vermunt JK, Roos DS (2007). Assessing performance of orthology detection strategies applied to eukaryotic genomes
PLoS One 2, e383.

URLPMID:17440619 [本文引用: 1]

Finn RD, Bateman A, Clements J, Coggill P, Eberhardt RY, Eddy SR, Heger A, Hetherington K, Holm L, Mistry J, Sonnhammer ELL, Tate J, Punta M (2014). Pfam: the protein families database
Nucleic Acids Res 42, D222-D230.

URLPMID:24288371 [本文引用: 1]

Finn RD, Clements J, Eddy SR (2011). HMMER web server: interactive sequence similarity searching
Nucleic Acids Res 39, W29-W37.

DOI:10.1093/nar/gkr367URLPMID:21593126 [本文引用: 1]
HMMER is a software suite for protein sequence similarity searches using probabilistic methods. Previously, HMMER has mainly been available only as a computationally intensive UNIX command-line tool, restricting its use. Recent advances in the software, HMMER3, have resulted in a 100-fold speed gain relative to previous versions. It is now feasible to make efficient profile hidden Markov model (profile HMM) searches via the web. A HMMER web server (http://hmmer.janelia.org) has been designed and implemented such that most protein database searches return within a few seconds. Methods are available for searching either a single protein sequence, multiple protein sequence alignment or profile HMM against a target sequence database, and for searching a protein sequence against Pfam. The web server is designed to cater to a range of different user expertise and accepts batch uploading of multiple queries at once. All search methods are also available as RESTful web services, thereby allowing them to be readily integrated as remotely executed tasks in locally scripted workflows. We have focused on minimizing search times and the ability to rapidly display tabular results, regardless of the number of matches found, developing graphical summaries of the search results to provide quick, intuitive appraisement of them.

Fischer I, Diévart A, Droc G, Dufayard JF, Chantret N (2016). Evolutionary dynamics of the leucine-rich repeat receptor-like kinase (LRR-RLK) subfamily in angiosperms
Plant Physiol 170, 1595-1610.

DOI:10.1104/pp.15.01470URLPMID:26773008 [本文引用: 4]
Gene duplications are an important factor in plant evolution, and lineage-specific expanded (LSE) genes are of particular interest. Receptor-like kinases expanded massively in land plants, and leucine-rich repeat receptor-like kinases (LRR-RLK) constitute the largest receptor-like kinases family. Based on the phylogeny of 7,554 LRR-RLK genes from 31 fully sequenced flowering plant genomes, the complex evolutionary dynamics of this family was characterized in depth. We studied the involvement of selection during the expansion of this family among angiosperms. LRR-RLK subgroups harbor extremely contrasting rates of duplication, retention, or loss, and LSE copies are predominantly found in subgroups involved in environmental interactions. Expansion rates also differ significantly depending on the time when rounds of expansion or loss occurred on the angiosperm phylogenetic tree. Finally, using a dN/dS-based test in a phylogenetic framework, we searched for selection footprints on LSE and single-copy LRR-RLK genes. Selective constraint appeared to be globally relaxed at LSE genes, and codons under positive selection were detected in 50% of them. Moreover, the leucine-rich repeat domains, and specifically four amino acids in them, were found to be the main targets of positive selection. Here, we provide an extensive overview of the expansion and evolution of this very large gene family.

Freeling M (2009). Bias in plant gene content following different sorts of duplication: tandem, whole-genome, segmental, or by transposition
Annu Rev Plant Biol 60, 433-453.

DOI:10.1146/annurev.arplant.043008.092122URLPMID:19575588 [本文引用: 2]
Each mode of gene duplication (tandem, tetraploid, segmental, transpositional) retains genes in a biased manner. A reciprocal relationship exists between plant genes retained postpaleotetraploidy versus genes retained after an ancient tandem duplication. Among the models (C, neofunctionalization, balanced gene drive) and ideas that might explain this relationship, only balanced gene drive predicts reciprocity. The gene balance hypothesis explains that more

Gabaldón T, Dessimoz C, Huxley-Jones J, Vilella AJ, Sonnhammer EL, Lewis S (2009). Joining forces in the quest for orthologs
Genome Biol 10, 403.

DOI:10.1186/gb-2009-10-9-403URLPMID:19785718 [本文引用: 1]
Better orthology-prediction resources would be beneficial for the whole biological community. A recent meeting discussed how to coordinate and leverage current efforts.

Gómez-Gómez GL, Boller T (2000). FLS2: an LRR receptor-like kinase involved in the perception of the bacterial elicitor flagellin in Arabidopsis
Mol Cell 5, 1003-1011.

DOI:10.1016/s1097-2765(00)80265-8URLPMID:10911994 [本文引用: 1]
Flagellin, the main protein of the bacterial flagella, elicits defence responses and alters growth in Arabidopsis seedlings. Previously, we identified the FLS1 locus, which confers flagellin insensitivity in Ws-0. To identify additional components involved in flagellin perception, we screened for flagellin insensitivity mutants in the flagellin-sensitive accession La-er. Here, we describe the identification of a new locus, FLS2, by a map-based strategy. The FLS2 gene is ubiquitously expressed and encodes a putative receptor kinase. FLS2 shares structural and functional homologies with known plant resistance genes and with components involved in the innate immune system of mammals and insects.

Guo LH, Chen YN, Ye N, Dai XG, Yang WX, Yin TM (2014). Differential retention and expansion of the ancestral genes associated with the paleopolyploidies in modern rosid plants, as revealed by analysis of the extensins super-gene family
BMC Genomics 15, 612.

URLPMID:25047956 [本文引用: 4]

Hwang SG, Kim DS, Jang CS (2011). Comparative analysis of evolutionary dynamics of genes encoding leucine- rich repeat receptor-like kinase between rice and Arabidopsis
Genetics 139, 1023.

[本文引用: 1]

Jia YX, Ding YL, Shi YT, Zhang XY, Gong ZZ, Yang SH (2016). The cbfs triple mutants reveal the essential functions of cbfs in cold acclimation and allow the definition of CBF regulons in Arabidopsis
New Phytol 212, 345-353.

[本文引用: 1]

Lee TH, Tang HB, Wang XY, Paterson AH (2012). PGDD: a database of gene and genome duplication in plants
Nucleic Acids Res 41, D1152-D1158.

URLPMID:23180799 [本文引用: 1]

Lehti-Shiu MD, Shiu SH (2012). Diversity, classification and function of the plant protein kinase superfamily
Philos Trans R Soc B Biol Sci 367, 2619-2639.

[本文引用: 1]

Letunic I, Bork P (2018). 20 years of the SMART protein domain annotation resource
Nucleic Acids Res 46, D493-D496.

URLPMID:29040681 [本文引用: 1]

Li WH, Yang J, Gu X (2005). Expression divergence between duplicate genes
Trends Genet 21, 602-607.

DOI:10.1016/j.tig.2005.08.006URLPMID:16140417 [本文引用: 1]
A general picture of the role of expression divergence in the evolution of duplicate genes is emerging, thanks to the availability of completely sequenced genomes and functional genomic data, such as microarray data. It is now clear that expression divergence, regulatory-motif divergence and coding-sequence divergence all increase with the age of duplicate genes, although their exact interrelationships remain to be determined. It is also clear that gene duplication increases expression diversity and enables tissue or developmental specialization to evolve. However, the relative roles of subfunctionalization and neofunctionalization in the retention of duplicate genes remain to be clarified, especially for higher eukaryotes. In addition, the relationship between gene duplication and evolution of transcriptional regulatory networks is largely unexplored.

Librado P, Rozas J (2009). DnaSP v5: a software for comprehensive analysis of DNA polymorphism data
Bioinformatics 25, 1451-1452.

DOI:10.1093/bioinformatics/btp187URLPMID:19346325 [本文引用: 1]
MOTIVATION: DnaSP is a software package for a comprehensive analysis of DNA polymorphism data. Version 5 implements a number of new features and analytical methods allowing extensive DNA polymorphism analyses on large datasets. Among other features, the newly implemented methods allow for: (i) analyses on multiple data files; (ii) haplotype phasing; (iii) analyses on insertion/deletion polymorphism data; (iv) visualizing sliding window results integrated with available genome annotations in the UCSC browser. AVAILABILITY: Freely available to academic users from: (http://www.ub.edu/dnasp).

Liu ZY, Jia YX, Ding YL, Shi YT, Li Z, Guo Y, Gong ZZ, Yang SH (2017). Plasma membrane CRPK1-mediated phosphorylation of 14-3-3 proteins induces their nuclear import to fine-tune CBF signaling during cold response
Mol Cell 66, 117-128.

DOI:10.1016/j.molcel.2017.02.016URLPMID:28344081 [本文引用: 2]
In plant cells, changes in fluidity of the plasma membrane may serve as the primary sensor of cold stress; however, the precise mechanism and how the cell transduces and fine-tunes cold signals remain elusive. Here we show that the cold-activated plasma membrane protein cold-responsive protein kinase 1 (CRPK1) phosphorylates 14-3-3 proteins. The phosphorylated 14-3-3 proteins shuttle from the cytosol to the nucleus, where they interact with and destabilize the key cold-responsive C-repeat-binding factor (CBF) proteins. Consistent with this, the crpk1 and 14-3-3kappalambda mutants show enhanced freezing tolerance, and transgenic plants overexpressing 14-3-3lambda show reduced freezing tolerance. Further study shows that CRPK1 is essential for the nuclear translocation of 14-3-3 proteins and for 14-3-3 function in freezing tolerance. Thus, our study reveals that the CRPK1-14-3-3 module transduces the cold signal from the plasma membrane to the nucleus to modulate CBF stability, which ensures a faithfully adjusted response to cold stress of plants.

Marchler-Bauer A, Lu SN, Anderson JB, Chitsaz F, Derbyshire MK, DeWeese-Scott C, Fong JH, Geer LY, Geer RC, Gonzales NR, Gwadz M, Hurwitz DI, Jackson JD, Ke ZX, Lanczycki CJ, Lu F, Marchler GH, Mullokandov M, Omelchenko MV, Robertson CL, Song JS, Thanki N, Yamashita RA, Zhang DC, Zhang NG, Zheng CJ, Bryant SH (2011). CDD: a conserved domain database for the functional annotation of proteins
Nucleic Acids Res 39, D225-D229.

URLPMID:21109532 [本文引用: 1]

Moore RC, Purugganan MD (2003). The early stages of duplicate gene evolution
Proc Natl Acad Sci USA 100, 15682-15687.

DOI:10.1073/pnas.2535513100URLPMID:14671323 [本文引用: 1]
Gene duplications are one of the primary driving forces in the evolution of genomes and genetic systems. Gene duplicates account for 8-20% of the genes in eukaryotic genomes, and the rates of gene duplication are estimated at between 0.2% and 2% per gene per million years. Duplicate genes are believed to be a major mechanism for the establishment of new gene functions and the generation of evolutionary novelty, yet very little is known about the early stages of the evolution of duplicated gene pairs. It is unclear, for example, to what extent selection, rather than neutral genetic drift, drives the fixation and early evolution of duplicate loci. Analysis of recently duplicated genes in the Arabidopsis thaliana genome reveals significantly reduced species-wide levels of nucleotide polymorphisms in the progenitor and/or duplicate gene copies, suggesting that selective sweeps accompany the initial stages of the evolution of these duplicated gene pairs. Our results support recent theoretical work that indicates that fates of duplicate gene pairs may be determined in the initial phases of duplicate gene evolution and that positive selection plays a prominent role in the evolutionary dynamics of the very early histories of duplicate nuclear genes.

Ogawa M, Shinohara H, Sakagami Y, Matsubayashi Y (2008). Arabidopsis CLV3 peptide directly binds CLV1 ectodomain
Science 319, 294.

URLPMID:18202283 [本文引用: 1]

Rameneni JJ, Lee Y, Dhandapani V, Yu XN, Choi SR, Oh MH, Lim YP (2015). Genomic and post-translational modification analysis of leucine-rich-repeat receptor-like kinases in Brassica rapa
PLoS One 10, e0142255.

URLPMID:26588465 [本文引用: 1]

Shiu HS, Bleecker AB (2003). Expansion of the receptor-like kinase/Pelle gene family and receptor-like proteins in Arabidopsis
Plant Physiol 132, 530-543.

URLPMID:12805585 [本文引用: 3]

Shiu SH, Bleecker AB (2001a). Plant receptor-like kinase gene family: diversity, function, and signaling
Sci STKE 2001, re22.

URLPMID:11752632 [本文引用: 4]

Shiu SH, Bleecker AB (2001 b). Receptor-like kinases from Arabidopsis form a monophyletic gene family related to animal receptor kinases
Proc Natl Acad Sci USA 98, 10763-10768.

URLPMID:11526204 [本文引用: 8]

Shumayla, Sharma S, Kumar R, Mendu V, Singh K, Upadhyay SK (2016). Genomic dissection and expression profiling revealed functional divergence in Triticum aestivum leucine rich repeat receptor like kinases (TaLRRKs)
Front Plant Sci 7, 1374.

URLPMID:27713749 [本文引用: 1]

Song DH, Li GJ, Song FM, Zheng Z (2008). Molecular characterization and expression analysis of OsBISERK1, a gene encoding a leucine-rich repeat receptor-like kinase, during disease resistance responses in rice
Mol Biol Rep 35, 275-283.

DOI:10.1007/s11033-007-9080-8URLPMID:17520342 [本文引用: 1]
A rice gene, OsBISERK1, encoding a protein belonging to SOMATIC EMBRYOGENESIS RECEPTOR KINASE (SERK) type of leucine-rich repeat receptor-like kinases (LRR-RLKs) was identified. The OsBISERK1 encodes a 624 aa protein with high level of identity to known plant SERKs. OsBISERK1 contains a hydrophobic signal peptide, a leucine zipper, and five leucine-rich repeat motifs in the extracellular domain; the cytoplasmic region carries a proline-rich region and a single transmembrane domain, as well as a conserved intracellular serine/threonine protein kinase domain. OsBISERK1 has a low level of basal expression in leaf tissue. However, expression of OsBISERK1 was induced by treatment with benzothiadiazole (BTH), which is capable of inducing disease resistance in rice, and also up-regulated after inoculation with Magnaporthe grisea in BTH-treated rice seedlings and during incompatible interaction between a blast-resistant rice genotype and M. grisea. The results suggest that OsBISERK1 may be involved in disease resistance responses in rice.

Sonnhammer ELL, Koonin EV (2002). Orthology, paralogy and proposed classification for paralog subtypes
Trends Genet 18, 619-620.

DOI:10.1016/s0168-9525(02)02793-2URLPMID:12446146 [本文引用: 1]

Stone JM, Walker JC (1995). Plant protein kinase families and signal transduction
Plant Physiol 108, 451-457.

URLPMID:7610156 [本文引用: 1]

Sun XL, Wang GL (2011). Genome-wide identification, characterization and phylogenetic analysis of the rice LRR-kinases
PLoS One 6, e16079.

URLPMID:21408199 [本文引用: 2]

Tang HB, Bowers JE, Wang XY, Ming R, Alam M, Paterson AH (2008a). Synteny and collinearity in plant genomes
Science 320, 486-488.

DOI:10.1126/science.1153917URLPMID:18436778 [本文引用: 1]
Correlated gene arrangements among taxa provide a valuable framework for inference of shared ancestry of genes and for the utilization of findings from model organisms to study less-well-understood systems. In angiosperms, comparisons of gene arrangements are complicated by recurring polyploidy and extensive genome rearrangement. New genome sequences and improved analytical approaches are clarifying angiosperm evolution and revealing patterns of differential gene loss after genome duplication and differential gene retention associated with evolution of some morphological complexity. Because of variability in DNA substitution rates among taxa and genes, deviation from collinearity might be a more reliable phylogenetic character.

Tang HB, Wang XY, Bowers JE, Ming R, Alam M, Paterson AH (2008b). Unraveling ancient hexaploidy through multiply-aligned angiosperm gene maps
Genome Res 18, 1944-1954.

DOI:10.1101/gr.080978.108URLPMID:18832442 [本文引用: 4]
Large-scale (segmental or whole) genome duplication has been recurring in angiosperm evolution. Subsequent gene loss and rearrangements further affect gene copy numbers and fractionate ancestral gene linkages across multiple chromosomes. The fragmented

Tang P, Zhang Y, Sun XQ, Tian DC, Yang SH, Ding J (2010). Disease resistance signature of the leucine-rich repeat receptor-like kinase genes in four plant species
Plant Sci 179, 399-406.

[本文引用: 1]

The Arabidopsis Genome Initiative (2000). Analysis of the genome sequence of the flowering plant Arabidopsis thaliana
Nature 408, 796-815.

URLPMID:11130711 [本文引用: 1]

Tian WD, Skolnick J (2003). How well is enzyme function conserved as a function of pairwise sequence identity?
J Mol Biol 333, 863-882.

DOI:10.1016/j.jmb.2003.08.057URLPMID:14568541 [本文引用: 1]
Enzyme function conservation has been used to derive the threshold of sequence identity necessary to transfer function from a protein of known function to an unknown protein. Using pairwise sequence comparison, several studies suggested that when the sequence identity is above 40%, enzyme function is well conserved. In contrast, Rost argued that because of database bias, the results from such simple pairwise comparisons might be misleading. Thus, by grouping enzyme sequences into families based on sequence similarity and selecting representative sequences for comparison, he showed that enzyme function starts to diverge quickly when the sequence identity is below 70%. Here, we employ a strategy similar to Rost's to reduce the database bias; however, we classify enzyme families based not only on sequence similarity, but also on functional similarity, i.e. sequences in each family must have the same four digits or the same first three digits of the enzyme commission (EC) number. Furthermore, instead of selecting representative sequences for comparison, we calculate the function conservation of each enzyme family and then average the degree of enzyme function conservation across all enzyme families. Our analysis suggests that for functional transferability, 40% sequence identity can still be used as a confident threshold to transfer the first three digits of an EC number; however, to transfer all four digits of an EC number, above 60% sequence identity is needed to have at least 90% accuracy. Moreover, when PSI-BLAST is used, the magnitude of the E-value is found to be weakly correlated with the extent of enzyme function conservation in the third iteration of PSI-BLAST. As a result, functional annotation based on the E-values from PSI-BLAST should be used with caution. We also show that by employing an enzyme family-specific sequence identity threshold above which 100% functional conservation is required, functional inference of unknown sequences can be accurately accomplished. However, this comes at a cost: those true positive sequences below this threshold cannot be uniquely identified.

Wei ZR, Wang JH, Yang SH, Song YJ (2015). Identification and expression analysis of the LRR-RLK gene family in tomato(Solanum lycopersicum) Heinz 1706
Genome 58, 121-134.

DOI:10.1139/gen-2015-0035URL [本文引用: 1]

Yang SH, Zhang XH, Yue JX, Tian DC, Chen JQ (2008). Recent duplications dominate NBS-encoding gene expansion in two woody species
Mol Genet Genomic 280, 187-198.

DOI:10.1007/s00438-008-0355-0URL [本文引用: 1]

Yu Y, Fuscoe JC, Zhao C, Guo C, Jia MW, Tao Q, Bannon DI, Lancashire L, Bao WJ, Du TT, Luo H, Su ZQ, Jones WD, Moland CL, Branham WS, Qian F, Ning BT, Li Y, Hong HX, Guo L, Mei N, Shi TL, Wang KY, Wolfinger RD, Nikolsky Y, Walker SJ, Duerksen- Hughes P, Mason CE, Tong WD, Thierry-Mieg J, Thierry-Mieg D, Shi LM, Wang C (2014). A rat RNA-Seq transcriptomic BodyMap across 11 organs and 4 developmental stages
Nat Commun 5, 3230.

DOI:10.1038/ncomms4230URLPMID:24510058 [本文引用: 1]
The rat has been used extensively as a model for evaluating chemical toxicities and for understanding drug mechanisms. However, its transcriptome across multiple organs, or developmental stages, has not yet been reported. Here we show, as part of the SEQC consortium efforts, a comprehensive rat transcriptomic BodyMap created by performing RNA-Seq on 320 samples from 11 organs of both sexes of juvenile, adolescent, adult and aged Fischer 344 rats. We catalogue the expression profiles of 40,064 genes, 65,167 transcripts, 31,909 alternatively spliced transcript variants and 2,367 non-coding genes/non-coding RNAs (ncRNAs) annotated in AceView. We find that organ-enriched, differentially expressed genes reflect the known organ-specific biological activities. A large number of transcripts show organ-specific, age-dependent or sex-specific differential expression patterns. We create a web-based, open-access rat BodyMap database of expression profiles with crosslinks to other widely used databases, anticipating that it will serve as a primary resource for biomedical research using the rat model.

Zan YJ, Ji Y, Zhang Y, Yang SH, Song YJ, Wang JH (2013). Genome-wide identification, characterization and expression analysis of Populus leucine-rich repeat receptor-like protein kinase genes
BMC Genomics 14, 318.

URLPMID:23663326 [本文引用: 2]

重复基因的进化——回顾与进展
1
2010

... 基因组共线性分析揭示了拟南芥、杨树、葡萄(Vitis vinifera)和番木瓜(Carica papaya)起源于共同的古六倍体祖先.在长期的进化过程中, 拟南芥基因组经历了3次全基因组重复(α-二倍化、β-二倍化和γ-三倍化), 杨树基因组存在2次全基因组重复(γ-三倍化和p-二倍化), 在葡萄和番木瓜中仅存在1次全基因组重复事件(γ-三倍化) (The Arabidopsis Genome Initiative, 2000; Tang et al., 2008a, 2008b; Guo et al., 2014; Dai et al., 2014).由于全基因组重复事件祖先基因发生倍增, 导致基因剂量增加, 并可能经历不同的进化命运: (1) 新功能化(neofunctionalization), 倍增后的2个拷贝都保留下来, 其中1个拷贝保留了祖先基因的功能, 而另外1个拷贝获得了新功能; (2) 假基因化(non-functionalization), 1个冗余拷贝由于随机突变成为无功能的假基因或者发生DNA序列丢失; (3) 亚功能化(subfunctionalization), 2个拷贝都由于突变导致功能部分受损, 必须互补合作才能完成原来祖先基因的功能(孙红正和葛颂, 2010); (4) 剂量选择(dosage selection), 对有利剂量效应的选择使2个拷贝均保留下来并保持原有的功能(Conant and Wolfe, 2008).追溯祖先基因在现代植物基因组中的扩张和保留情况有助于深入理解倍增基因在生物体进化过程中的作用和意义.本研究选用基因组共线性关系明确的4种模式植物拟南芥、杨树、番木瓜和葡萄, 以LRR VIII-2亚家族为例, 通过在不同植物中鉴定该亚家族基因成员, 分析其在不同植物中发生基因扩张、差异保留及表达分化情况, 以期为深入揭示LRR VIII-2亚家族基因的功能及从系统发育角度阐明其它基因家族的进化历史提供参考. ...

小麦受体样蛋白激酶及其衍生蛋白的研究进展
1
2015

... 蛋白激酶参与的可逆磷酸化调控在植物体响应外界环境和内部细胞间的各种信号刺激过程中发挥重要作用(闫锋等, 2009; 张兆沛等, 2009; Lehti-Shiu and Shiu, 2012; 王鹤飞等, 2015).植物蛋白激酶种类繁多, 根据激酶催化域氨基酸序列的相似性可分为5组(Stone and Walker, 1995).(1) AGC组, 包括环核苷酸依赖的蛋白激酶家族(PKA和PKG)、蛋白激酶C家族(PKC)和核糖体S6激酶家族; (2) CaMK组, 包括Ca2+/钙调素依赖的蛋白激酶家族(CDPK)和SNF1/ AMPK家族; (3) CMGC组, 包括细胞周期蛋白依赖的蛋白激酶(CDK)、促分裂原活化蛋白激酶(MAPK)、糖原合成酶激酶-3 (GSK-3)和酪蛋白激酶II (CKII)家族; (4) 酪氨酸蛋白激酶(PTK)组; (5) 其它组, 包括类受体蛋白激酶(receptor-like protein kinase, RLK)等不能归于上述4组的蛋白激酶. ...

植物类受体蛋白激酶的研究进展
1
2009

... 蛋白激酶参与的可逆磷酸化调控在植物体响应外界环境和内部细胞间的各种信号刺激过程中发挥重要作用(闫锋等, 2009; 张兆沛等, 2009; Lehti-Shiu and Shiu, 2012; 王鹤飞等, 2015).植物蛋白激酶种类繁多, 根据激酶催化域氨基酸序列的相似性可分为5组(Stone and Walker, 1995).(1) AGC组, 包括环核苷酸依赖的蛋白激酶家族(PKA和PKG)、蛋白激酶C家族(PKC)和核糖体S6激酶家族; (2) CaMK组, 包括Ca2+/钙调素依赖的蛋白激酶家族(CDPK)和SNF1/ AMPK家族; (3) CMGC组, 包括细胞周期蛋白依赖的蛋白激酶(CDK)、促分裂原活化蛋白激酶(MAPK)、糖原合成酶激酶-3 (GSK-3)和酪蛋白激酶II (CKII)家族; (4) 酪氨酸蛋白激酶(PTK)组; (5) 其它组, 包括类受体蛋白激酶(receptor-like protein kinase, RLK)等不能归于上述4组的蛋白激酶. ...

植物类受体蛋白激酶研究概况
1
2009

... 蛋白激酶参与的可逆磷酸化调控在植物体响应外界环境和内部细胞间的各种信号刺激过程中发挥重要作用(闫锋等, 2009; 张兆沛等, 2009; Lehti-Shiu and Shiu, 2012; 王鹤飞等, 2015).植物蛋白激酶种类繁多, 根据激酶催化域氨基酸序列的相似性可分为5组(Stone and Walker, 1995).(1) AGC组, 包括环核苷酸依赖的蛋白激酶家族(PKA和PKG)、蛋白激酶C家族(PKC)和核糖体S6激酶家族; (2) CaMK组, 包括Ca2+/钙调素依赖的蛋白激酶家族(CDPK)和SNF1/ AMPK家族; (3) CMGC组, 包括细胞周期蛋白依赖的蛋白激酶(CDK)、促分裂原活化蛋白激酶(MAPK)、糖原合成酶激酶-3 (GSK-3)和酪蛋白激酶II (CKII)家族; (4) 酪氨酸蛋白激酶(PTK)组; (5) 其它组, 包括类受体蛋白激酶(receptor-like protein kinase, RLK)等不能归于上述4组的蛋白激酶. ...

植物富含半胱氨酸的类受体激酶的研究进展
1
2016

... RLK是植物中普遍存在的、数量最多的一类蛋白激酶(郑超等, 2016), 在拟南芥(Arabidopsis thaliana)中约占所有蛋白激酶的60% (Shiu and Bleecker, 2003).典型的植物RLKs具有胞外区、跨膜区和胞内激酶区(Shiu and Bleecker, 2001a).根据胞外结构域特征和胞内激酶结构域序列的系统发生关系, 可以将拟南芥AtRLK分为45个亚家族(Shiu and Bleecker, 2001b).富含亮氨酸重复序列(leucine-rich repeats, LRR)型是其中最大的一类, 包含15个亚家族(LRR I-XV).其中LRR VIII分为LRR VIII-1LRR VIII-2.富含亮氨酸重复类受体蛋白激酶(LRR-RLKs)胞内激酶结构域相对保守, 胞外受体结构域含有富含亮氨酸的保守基序LXXLXLXX (L代表亮氨酸残基, X代表任意氨基酸残基) (Song et al., 2008).LRR-RLKs在调控植物的生长发育、激素信号转导以及响应逆境胁迫等方面发挥重要作用.例如, 拟南芥CLV (LRR XI亚家族)信号途径能够调控茎顶端分生组织干细胞数量, 维持细胞分裂与分化之间的动态平衡(Clark et al., 1997; Ogawa et al., 2008); 拟南芥BAK1 (LRR II亚家族)与BRI1 (LRR X亚家族)形成的二聚体在油菜素内酯的信号转导过程中发挥关键作用(Colcombet et al., 2005; Albrecht et al., 2005); FLS2 (LRR XII亚家族)能够通过胞外的LRR结构域识别病原菌鞭毛蛋白, 介导植物的免疫反应(Gómez-Gómez and Boller, 2000).此外, 拟南芥CRPK1 (LRR VIII-2亚家族)通过磷酸化14-3-3蛋白, 精确调控植物低温胁迫响应(Liu et al., 2017). ...

The Arabidopsis thaliana SOMATIC EMBRYOGENESIS RECEPTOR-LIKE KINASES 1 and 2 control male sporogenesis
1
2005

... RLK是植物中普遍存在的、数量最多的一类蛋白激酶(郑超等, 2016), 在拟南芥(Arabidopsis thaliana)中约占所有蛋白激酶的60% (Shiu and Bleecker, 2003).典型的植物RLKs具有胞外区、跨膜区和胞内激酶区(Shiu and Bleecker, 2001a).根据胞外结构域特征和胞内激酶结构域序列的系统发生关系, 可以将拟南芥AtRLK分为45个亚家族(Shiu and Bleecker, 2001b).富含亮氨酸重复序列(leucine-rich repeats, LRR)型是其中最大的一类, 包含15个亚家族(LRR I-XV).其中LRR VIII分为LRR VIII-1LRR VIII-2.富含亮氨酸重复类受体蛋白激酶(LRR-RLKs)胞内激酶结构域相对保守, 胞外受体结构域含有富含亮氨酸的保守基序LXXLXLXX (L代表亮氨酸残基, X代表任意氨基酸残基) (Song et al., 2008).LRR-RLKs在调控植物的生长发育、激素信号转导以及响应逆境胁迫等方面发挥重要作用.例如, 拟南芥CLV (LRR XI亚家族)信号途径能够调控茎顶端分生组织干细胞数量, 维持细胞分裂与分化之间的动态平衡(Clark et al., 1997; Ogawa et al., 2008); 拟南芥BAK1 (LRR II亚家族)与BRI1 (LRR X亚家族)形成的二聚体在油菜素内酯的信号转导过程中发挥关键作用(Colcombet et al., 2005; Albrecht et al., 2005); FLS2 (LRR XII亚家族)能够通过胞外的LRR结构域识别病原菌鞭毛蛋白, 介导植物的免疫反应(Gómez-Gómez and Boller, 2000).此外, 拟南芥CRPK1 (LRR VIII-2亚家族)通过磷酸化14-3-3蛋白, 精确调控植物低温胁迫响应(Liu et al., 2017). ...

LRRsearch: an asynchronous server- based application for the prediction of leucine-rich repeat motifs and an integrative database of NOD-like receptors
1
2014

... 将4种模式植物的LRR VIII-2亚家族的蛋白序列导入PAUP软件(Cummings, 2004), 以APH3为外类群构建多物种系统发育树, 采用邻接法(neighbor joining, NJ), Bootstrap=1 000.利用在线软件LRRsearch (http://www.lrrsearch.com/) (Bej et al., 2014)预测胞外结构域. ...

A recent polyploidy superimposed on older large-scale duplications in the Arabidopsis genome
1
2003

... 基于4种模式植物的基因组共线性数据, 我们筛选出42对包含33个LRR VIII-2亚家族基因的Block pair (表4).计算每对Block pair的Ks中值, 结果显示, 杨树基因组内16对Block pair的Ks中值分布在2个区间: 0.259 2-0.355 1和1.278 45-1.491 2; 拟南芥基因组内唯一的1对Block pair的Ks中值为0.789 6; 葡萄基因组中检测到2对Block pair的Ks中值分别为1.131 35和1.112 55 (表4).比较基因组学研究表明, 几乎所有被子植物基因组都经历过片段重复或全基因组重复事件(S/WGD), 可以利用Ks中值评估共线性染色体区段的历史重复事件(Blanc et al., 2003).根据Tang等(2008b)的报道, 拟南芥基因组中与α重复事件相关的Ks中值为0.86; 毛果杨基因组中与γ和p重复事件相关的Ks中值分别为1.54和0.27; 番木瓜和葡萄基因组中与γ重复事件相关的Ks中值分别为1.76和1.22.参考以上Ks中值与全基因组重复事件的关系, 我们对筛选出的19对种内Block pair经历的重复事件进行了评估.结果表明, 杨树中与p和γ重复事件相关的Block pair分别有9对和7对; 拟南芥的1对Block pair与α重复事件相关; 葡萄中的2对Block pair均与γ重复事件相关(表4).由于拟南芥、杨树、葡萄和番木瓜由共同的古六倍体祖先进化而来(Tang et al., 2008b), 共享γ重复事件, 因此将种间Block pair的关系归于γ重复事件. ...

Widespread paleopolyploidy in model plant species inferred from age distributions of duplicate genes
2
2004

... 4种模式植物LRR VIII-2亚家族中旁系同源(paralogous)与直系同源(orthologous)基因的鉴定基于转录本序列.从Phytozome数据库中获取各基因的转录本序列, 通过Blastn方法鉴定相似序列, 结合系统发育树分析结果, 相似性阈值设为≥300 bp且Identity≥ 40% (Blanc and Wolfe, 2004).在旁系同源基因的鉴定中, 将同一植物中LRR VIII-2亚家族成员进行两两比对, 筛选出相似序列.在直系同源基因的鉴定中, 每2种植物作为1对进行分析.首先用makeblastdb对2个物种的全部CDS序列分别建库, 再用Blastn交叉搜索, 如果2个基因互为最佳匹配且相似性超过阈值, 则认为这2个基因是直系同源对(Blanc and Wolfe, 2004).将LRR VIII-2同源基因对的CDS序列依次输入MEGA7, 进行密码子比对.将比对结果通过DnaSP (Librado and Rozas, 2009)计算KaKs值. ...

... 亚家族成员进行两两比对, 筛选出相似序列.在直系同源基因的鉴定中, 每2种植物作为1对进行分析.首先用makeblastdb对2个物种的全部CDS序列分别建库, 再用Blastn交叉搜索, 如果2个基因互为最佳匹配且相似性超过阈值, 则认为这2个基因是直系同源对(Blanc and Wolfe, 2004).将LRR VIII-2同源基因对的CDS序列依次输入MEGA7, 进行密码子比对.将比对结果通过DnaSP (Librado and Rozas, 2009)计算KaKs值. ...

TBtools, an integrative toolkit developed for interactive analyses of big biological data
1
2002

... 利用NCBI基因表达数据库(gene expression omnibus, GEO)获得拟南芥在低温胁迫条件下的数字表达谱(GSE130729) (Jia et al., 2016), 从中提取LRR VIII-2亚家族成员的表达信息.利用TBtools (Chen et al., 2002)绘制热图, 并对每个基因的表达数据进行正态标准化(Yu et al., 2014), 即Z-score标准化(均值为0, 标准差为1). ...

The CLAVATA1 gene encodes a putative receptor kinase that controls shoot and floral meristem size in Arabidopsis
1
1997

... RLK是植物中普遍存在的、数量最多的一类蛋白激酶(郑超等, 2016), 在拟南芥(Arabidopsis thaliana)中约占所有蛋白激酶的60% (Shiu and Bleecker, 2003).典型的植物RLKs具有胞外区、跨膜区和胞内激酶区(Shiu and Bleecker, 2001a).根据胞外结构域特征和胞内激酶结构域序列的系统发生关系, 可以将拟南芥AtRLK分为45个亚家族(Shiu and Bleecker, 2001b).富含亮氨酸重复序列(leucine-rich repeats, LRR)型是其中最大的一类, 包含15个亚家族(LRR I-XV).其中LRR VIII分为LRR VIII-1LRR VIII-2.富含亮氨酸重复类受体蛋白激酶(LRR-RLKs)胞内激酶结构域相对保守, 胞外受体结构域含有富含亮氨酸的保守基序LXXLXLXX (L代表亮氨酸残基, X代表任意氨基酸残基) (Song et al., 2008).LRR-RLKs在调控植物的生长发育、激素信号转导以及响应逆境胁迫等方面发挥重要作用.例如, 拟南芥CLV (LRR XI亚家族)信号途径能够调控茎顶端分生组织干细胞数量, 维持细胞分裂与分化之间的动态平衡(Clark et al., 1997; Ogawa et al., 2008); 拟南芥BAK1 (LRR II亚家族)与BRI1 (LRR X亚家族)形成的二聚体在油菜素内酯的信号转导过程中发挥关键作用(Colcombet et al., 2005; Albrecht et al., 2005); FLS2 (LRR XII亚家族)能够通过胞外的LRR结构域识别病原菌鞭毛蛋白, 介导植物的免疫反应(Gómez-Gómez and Boller, 2000).此外, 拟南芥CRPK1 (LRR VIII-2亚家族)通过磷酸化14-3-3蛋白, 精确调控植物低温胁迫响应(Liu et al., 2017). ...

Arabidopsis SOMATIC EMBRYOGENESIS RECEPTOR KINASES 1 and 2 are essential for tapetum development and microspore maturation
1
2005

... RLK是植物中普遍存在的、数量最多的一类蛋白激酶(郑超等, 2016), 在拟南芥(Arabidopsis thaliana)中约占所有蛋白激酶的60% (Shiu and Bleecker, 2003).典型的植物RLKs具有胞外区、跨膜区和胞内激酶区(Shiu and Bleecker, 2001a).根据胞外结构域特征和胞内激酶结构域序列的系统发生关系, 可以将拟南芥AtRLK分为45个亚家族(Shiu and Bleecker, 2001b).富含亮氨酸重复序列(leucine-rich repeats, LRR)型是其中最大的一类, 包含15个亚家族(LRR I-XV).其中LRR VIII分为LRR VIII-1LRR VIII-2.富含亮氨酸重复类受体蛋白激酶(LRR-RLKs)胞内激酶结构域相对保守, 胞外受体结构域含有富含亮氨酸的保守基序LXXLXLXX (L代表亮氨酸残基, X代表任意氨基酸残基) (Song et al., 2008).LRR-RLKs在调控植物的生长发育、激素信号转导以及响应逆境胁迫等方面发挥重要作用.例如, 拟南芥CLV (LRR XI亚家族)信号途径能够调控茎顶端分生组织干细胞数量, 维持细胞分裂与分化之间的动态平衡(Clark et al., 1997; Ogawa et al., 2008); 拟南芥BAK1 (LRR II亚家族)与BRI1 (LRR X亚家族)形成的二聚体在油菜素内酯的信号转导过程中发挥关键作用(Colcombet et al., 2005; Albrecht et al., 2005); FLS2 (LRR XII亚家族)能够通过胞外的LRR结构域识别病原菌鞭毛蛋白, 介导植物的免疫反应(Gómez-Gómez and Boller, 2000).此外, 拟南芥CRPK1 (LRR VIII-2亚家族)通过磷酸化14-3-3蛋白, 精确调控植物低温胁迫响应(Liu et al., 2017). ...

Turning a hobby into a job: how duplicated genes find new functions
1
2008

... 基因组共线性分析揭示了拟南芥、杨树、葡萄(Vitis vinifera)和番木瓜(Carica papaya)起源于共同的古六倍体祖先.在长期的进化过程中, 拟南芥基因组经历了3次全基因组重复(α-二倍化、β-二倍化和γ-三倍化), 杨树基因组存在2次全基因组重复(γ-三倍化和p-二倍化), 在葡萄和番木瓜中仅存在1次全基因组重复事件(γ-三倍化) (The Arabidopsis Genome Initiative, 2000; Tang et al., 2008a, 2008b; Guo et al., 2014; Dai et al., 2014).由于全基因组重复事件祖先基因发生倍增, 导致基因剂量增加, 并可能经历不同的进化命运: (1) 新功能化(neofunctionalization), 倍增后的2个拷贝都保留下来, 其中1个拷贝保留了祖先基因的功能, 而另外1个拷贝获得了新功能; (2) 假基因化(non-functionalization), 1个冗余拷贝由于随机突变成为无功能的假基因或者发生DNA序列丢失; (3) 亚功能化(subfunctionalization), 2个拷贝都由于突变导致功能部分受损, 必须互补合作才能完成原来祖先基因的功能(孙红正和葛颂, 2010); (4) 剂量选择(dosage selection), 对有利剂量效应的选择使2个拷贝均保留下来并保持原有的功能(Conant and Wolfe, 2008).追溯祖先基因在现代植物基因组中的扩张和保留情况有助于深入理解倍增基因在生物体进化过程中的作用和意义.本研究选用基因组共线性关系明确的4种模式植物拟南芥、杨树、番木瓜和葡萄, 以LRR VIII-2亚家族为例, 通过在不同植物中鉴定该亚家族基因成员, 分析其在不同植物中发生基因扩张、差异保留及表达分化情况, 以期为深入揭示LRR VIII-2亚家族基因的功能及从系统发育角度阐明其它基因家族的进化历史提供参考. ...

PAUP* (phylogenetic analysis using parsimony (and other methods))
2
2004

... 利用拟南芥AtLRR VIII-2亚家族14个成员的蛋白序列(Shiu and Bleecker, 2001b), 分别与毛果杨、番木瓜和葡萄的蛋白序列进行BlastP比对, 查找不同植物中LRR VIII-2亚家族的候选基因, 设置E-value≤e-20 (Shiu and Bleecker, 2001b), Identity≥40% (Tian and Skolnick, 2003).利用在线工具SMART (Letunic and Bork, 2018)、Pfam (Finn et al., 2014)和NCBI CD-search (Marchler-Bauer et al., 2011), 在比对出的候选基因中筛选出具有AtLRR VIII-2蛋白结构域的成员, 选择默认参数.同时, 应用Hmmbuild在线工具(Finn et al., 2011)构建AtLRR VIII-2亚家族的隐马尔科夫模型, 基于该模型对候选基因进行筛选.取上述2种筛选方法中共同保留下来的候选基因, 进一步利用PAUP (Phylogenetic Analysis Using Parsimony) 软件(Cummings, 2004), 基于邻接法, 最小进化、最大简约性标准(Shiu and Bleecker, 2001b), 与拟南芥所有235个LRR-RLKs成员(Shiu and Bleecker, 2001a)构建系统发育树.以葡萄球菌属(Staphylococcus)的氨基糖苷激酶APH3 (Shiu and Bleecker, 2001b)为外类群, 将其中与AtLRR VIII-2聚类在同一分支的基因鉴定为该物种的LRR VIII-2亚家族成员. ...

... 将4种模式植物的LRR VIII-2亚家族的蛋白序列导入PAUP软件(Cummings, 2004), 以APH3为外类群构建多物种系统发育树, 采用邻接法(neighbor joining, NJ), Bootstrap=1 000.利用在线软件LRRsearch (http://www.lrrsearch.com/) (Bej et al., 2014)预测胞外结构域. ...

The willow genome and divergent evolution from poplar after the common genome duplication
1
2014

... 基因组共线性分析揭示了拟南芥、杨树、葡萄(Vitis vinifera)和番木瓜(Carica papaya)起源于共同的古六倍体祖先.在长期的进化过程中, 拟南芥基因组经历了3次全基因组重复(α-二倍化、β-二倍化和γ-三倍化), 杨树基因组存在2次全基因组重复(γ-三倍化和p-二倍化), 在葡萄和番木瓜中仅存在1次全基因组重复事件(γ-三倍化) (The Arabidopsis Genome Initiative, 2000; Tang et al., 2008a, 2008b; Guo et al., 2014; Dai et al., 2014).由于全基因组重复事件祖先基因发生倍增, 导致基因剂量增加, 并可能经历不同的进化命运: (1) 新功能化(neofunctionalization), 倍增后的2个拷贝都保留下来, 其中1个拷贝保留了祖先基因的功能, 而另外1个拷贝获得了新功能; (2) 假基因化(non-functionalization), 1个冗余拷贝由于随机突变成为无功能的假基因或者发生DNA序列丢失; (3) 亚功能化(subfunctionalization), 2个拷贝都由于突变导致功能部分受损, 必须互补合作才能完成原来祖先基因的功能(孙红正和葛颂, 2010); (4) 剂量选择(dosage selection), 对有利剂量效应的选择使2个拷贝均保留下来并保持原有的功能(Conant and Wolfe, 2008).追溯祖先基因在现代植物基因组中的扩张和保留情况有助于深入理解倍增基因在生物体进化过程中的作用和意义.本研究选用基因组共线性关系明确的4种模式植物拟南芥、杨树、番木瓜和葡萄, 以LRR VIII-2亚家族为例, 通过在不同植物中鉴定该亚家族基因成员, 分析其在不同植物中发生基因扩张、差异保留及表达分化情况, 以期为深入揭示LRR VIII-2亚家族基因的功能及从系统发育角度阐明其它基因家族的进化历史提供参考. ...

Assessing performance of orthology detection strategies applied to eukaryotic genomes
1
2007

... 物种内旁系同源和物种间直系同源基因的识别不仅有助于比较和进化基因组学研究, 对同源基因的功能预测和注释也有重要意义.常用的同源基因鉴定方法有基于序列相似性、系统发生关系、基因组共线性分析等, 但每种方法都有其自身的局限性.例如, 根据同一物种内基因序列相似性可以鉴定旁系同源基因, 但在长期的进化过程中, 同源基因序列的相似性可能被严重侵蚀, 从而导致鉴定结果有误.本研究中, 通过基因组共线性分析表明A7-A14源于α重复事件, P2-P14源于p重复事件, 具有旁系同源关系, 但在根据序列相似性鉴定旁系同源基因的过程中未发现它们是旁系同源基因.因此, 在同源基因的鉴定过程中需要结合使用多种方法.通常认为, 直系同源基因具有相似的结构和生物学功能(Feng et al., 2007); 而由基因重复产生的旁系同源基因常伴随基因功能的分化(Sonnhammer and Koonin, 2002; Gabaldón et al., 2009).基因重复后的2个拷贝在表达上的分化是功能分化的重要一步(Li et al., 2005).本研究中, 杨树P8P27与已有功能报道的A2直系同源, P8P27对低温胁迫的响应情况也与A2相似.此外, P7P26旁系同源, 但这2个基因在响应低温胁迫时的表达情况差异明显, 推测这2个基因出现了功能分化. ...

Pfam: the protein families database
1
2014

... 利用拟南芥AtLRR VIII-2亚家族14个成员的蛋白序列(Shiu and Bleecker, 2001b), 分别与毛果杨、番木瓜和葡萄的蛋白序列进行BlastP比对, 查找不同植物中LRR VIII-2亚家族的候选基因, 设置E-value≤e-20 (Shiu and Bleecker, 2001b), Identity≥40% (Tian and Skolnick, 2003).利用在线工具SMART (Letunic and Bork, 2018)、Pfam (Finn et al., 2014)和NCBI CD-search (Marchler-Bauer et al., 2011), 在比对出的候选基因中筛选出具有AtLRR VIII-2蛋白结构域的成员, 选择默认参数.同时, 应用Hmmbuild在线工具(Finn et al., 2011)构建AtLRR VIII-2亚家族的隐马尔科夫模型, 基于该模型对候选基因进行筛选.取上述2种筛选方法中共同保留下来的候选基因, 进一步利用PAUP (Phylogenetic Analysis Using Parsimony) 软件(Cummings, 2004), 基于邻接法, 最小进化、最大简约性标准(Shiu and Bleecker, 2001b), 与拟南芥所有235个LRR-RLKs成员(Shiu and Bleecker, 2001a)构建系统发育树.以葡萄球菌属(Staphylococcus)的氨基糖苷激酶APH3 (Shiu and Bleecker, 2001b)为外类群, 将其中与AtLRR VIII-2聚类在同一分支的基因鉴定为该物种的LRR VIII-2亚家族成员. ...

HMMER web server: interactive sequence similarity searching
1
2011

... 利用拟南芥AtLRR VIII-2亚家族14个成员的蛋白序列(Shiu and Bleecker, 2001b), 分别与毛果杨、番木瓜和葡萄的蛋白序列进行BlastP比对, 查找不同植物中LRR VIII-2亚家族的候选基因, 设置E-value≤e-20 (Shiu and Bleecker, 2001b), Identity≥40% (Tian and Skolnick, 2003).利用在线工具SMART (Letunic and Bork, 2018)、Pfam (Finn et al., 2014)和NCBI CD-search (Marchler-Bauer et al., 2011), 在比对出的候选基因中筛选出具有AtLRR VIII-2蛋白结构域的成员, 选择默认参数.同时, 应用Hmmbuild在线工具(Finn et al., 2011)构建AtLRR VIII-2亚家族的隐马尔科夫模型, 基于该模型对候选基因进行筛选.取上述2种筛选方法中共同保留下来的候选基因, 进一步利用PAUP (Phylogenetic Analysis Using Parsimony) 软件(Cummings, 2004), 基于邻接法, 最小进化、最大简约性标准(Shiu and Bleecker, 2001b), 与拟南芥所有235个LRR-RLKs成员(Shiu and Bleecker, 2001a)构建系统发育树.以葡萄球菌属(Staphylococcus)的氨基糖苷激酶APH3 (Shiu and Bleecker, 2001b)为外类群, 将其中与AtLRR VIII-2聚类在同一分支的基因鉴定为该物种的LRR VIII-2亚家族成员. ...

Evolutionary dynamics of the leucine-rich repeat receptor-like kinase (LRR-RLK) subfamily in angiosperms
4
2016

... 基因重复(gene duplication)及随后的基因功能多样性分化是基因组和遗传系统分化的重要动力, 在生物进化过程中发挥极其重要的作用(Moore and Purugganan, 2003).基因重复可以通过多种方式进行, 包括片段重复(segmental duplication)、全基因组重复(whole-genome duplication)、串联重复(tandem duplication)和转座重复(transpositional duplication) (Freeling, 2009).在众多的植物基因家族中, 对RLKs基因家族的进化历史研究比较深入, 特别是其中的LRR-RLKs (Tang et al., 2010; Fischer et al., 2016).植物基因组中存在大量的LRR-RLKs基因, 已发现在双子叶植物拟南芥、油菜(Brassica rapa)、番茄(Solanum lycopersicum)和杨树(Populus trichocarpa)基因组中分别有235、303、234和379个LRR- RLKs编码基因(Shiu and Bleecker, 2001a; Zan et al., 2013; Rameneni et al., 2015; Wei et al., 2015); 在单子叶植物水稻(Oryza sativa)中有309个, 小麦(Triticum aestivum)中多达531个(Sun and Wang, 2011; Shumayla et al., 2016).在多种植物中开展的生物信息学分析表明, 串联重复和片段或全基因组重复(segmental or whole-genome duplication, S/ WGD)是LRR-RLKs类基因发生扩张的主要机制(Shiu and Bleecker, 2001b, 2003; Sun and Wang, 2011; Zan et al., 2013).在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

... 基因组学研究表明, 现代蔷薇类植物起源于共同的古六倍体祖先(Tang et al., 2008b), 在随后的进化过程中, 不同谱系的植物可能经历过1轮或多轮全基因组重复事件.基因发生重复后的保留偏好性及其功能分化一直是生物学领域的热点问题.基于4种模式植物中LRR VIII-2古基因的差异保留和扩张全景图(图2), 我们推测出12个LRR VIII-2古基因, 这些古基因在番木瓜中发生丢失, 而在其它3种植物中发生不同程度的基因扩张, 在杨树中的扩张程度最高.拟南芥虽然经历过更多的全基因组重复事件, 但其基因扩张比例却低于杨树, 原因可能在于拟南芥基因组的碱基替换速率较其它3种植物高(Guo et al., 2014).Fischer等(2016)鉴定了31种显花植物基因组中同时具备LRRs和激酶结构域的LRR-RLKs基因的数量, 并估算出被子植物祖先物种中LRR-RLKs古基因有150个.通过比较这些植物现代基因组中LRR-RLKs与古基因的数量, Fischer等(2016)发现番木瓜和百脉根(Lotus japonicus)是仅有的2种LRR-RLKs基因数目比古基因数目少的植物; 拟南芥和葡萄基因组中LRR-RLKs基因扩张比例分别为1.48和1.29, 处于中等水平; 而杨树是该基因家族扩张程度较高的植物, PtLRR-RLKs基因扩张比例超过2倍.上述研究结果与本研究针对LRR VIII-2亚家族的分析结果一致. ...

... 与古基因的数量, Fischer等(2016)发现番木瓜和百脉根(Lotus japonicus)是仅有的2种LRR-RLKs基因数目比古基因数目少的植物; 拟南芥和葡萄基因组中LRR-RLKs基因扩张比例分别为1.48和1.29, 处于中等水平; 而杨树是该基因家族扩张程度较高的植物, PtLRR-RLKs基因扩张比例超过2倍.上述研究结果与本研究针对LRR VIII-2亚家族的分析结果一致. ...

... 在拟南芥AtLRR VIII-2中有2个基因(A2A13)不具备胞外LRR结构域, 因此本研究鉴定的LRR VIII-2亚家族中一部分成员只有胞内的激酶结构域, 这些基因聚集成2个相对独立的分支Clade II-1和Clade II-3 (图1).这些成员的构象与类受体胞内激酶(receptor-like cytoplasmic kinases, RLCKs)非常相近.在拟南芥235个LRR-RLKs基因中, 4.7%的成员无胞外结构域, 其可能是现存LRR-RLKs中激酶结构域的祖先形式, 在长期进化过程中通过结构域融合被募集到LRR-RLKs构象中(Shiu and Bleecker, 2001a).本研究推断的12个LRR VIII-2古基因中, 7个具有完整的胞外LRR结构域、跨膜区及胞内激酶活性结构域, 这与Fischer等(2016)通过协调树构建法(tree reconciliation approach)鉴定的LRR VIII-2亚家族古基因数目(8个)非常接近.此外, 12个古基因中, 仅有3个在4种植物的现代基因组中能找到被保留下来的拷贝(图2, 第1-3行); 其余9个古基因仅在某一种植物中保留, 而在其它植物中丢失.例如, 葡萄的V5、杨树的P8和拟南芥的A7, 这些在某一特定物种保留下来的基因起源于不同的祖先基因, 可能在该物种中行使必不可少的功能. ...

Bias in plant gene content following different sorts of duplication: tandem, whole-genome, segmental, or by transposition
2
2009

... 基因重复(gene duplication)及随后的基因功能多样性分化是基因组和遗传系统分化的重要动力, 在生物进化过程中发挥极其重要的作用(Moore and Purugganan, 2003).基因重复可以通过多种方式进行, 包括片段重复(segmental duplication)、全基因组重复(whole-genome duplication)、串联重复(tandem duplication)和转座重复(transpositional duplication) (Freeling, 2009).在众多的植物基因家族中, 对RLKs基因家族的进化历史研究比较深入, 特别是其中的LRR-RLKs (Tang et al., 2010; Fischer et al., 2016).植物基因组中存在大量的LRR-RLKs基因, 已发现在双子叶植物拟南芥、油菜(Brassica rapa)、番茄(Solanum lycopersicum)和杨树(Populus trichocarpa)基因组中分别有235、303、234和379个LRR- RLKs编码基因(Shiu and Bleecker, 2001a; Zan et al., 2013; Rameneni et al., 2015; Wei et al., 2015); 在单子叶植物水稻(Oryza sativa)中有309个, 小麦(Triticum aestivum)中多达531个(Sun and Wang, 2011; Shumayla et al., 2016).在多种植物中开展的生物信息学分析表明, 串联重复和片段或全基因组重复(segmental or whole-genome duplication, S/ WGD)是LRR-RLKs类基因发生扩张的主要机制(Shiu and Bleecker, 2001b, 2003; Sun and Wang, 2011; Zan et al., 2013).在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

... 在基因组进化过程中, 基因可以通过串联重复、片段重复或全基因组重复等方式发生扩张(Freeling, 2009).串联重复基因同时满足2个条件: (1) 位于同一染色体上、基因间隔区≤100 kb (Guo et al., 2014); (2) 基因序列相似性超过阈值(相似区域覆盖较长序列的70%以上, 且Identity>70%) (Yang et al., 2008).为鉴定LRR VIII-2亚家族中通过片段/全基因组重复(S/WGD)方式扩张产生的基因, 首先从PGDD (plant genome duplication database)数据库(Lee et al., 2012)下载4种植物种内及种间基因组共线性数据, 从中筛选出含有LRR VIII-2亚家族基因的成对共线性区段(Block pair), 计算Block pair上所有共线性基因对(包括LRR VIII-2及其侧翼共线性同源基因)的Ks中值, 并根据Ks中值估算该染色体区段(Block)所经历的S/WGD事件, 即位于该区段的LRR VIII-2亚家族基因的扩张方式(Guo et al., 2014).对于既不属于串联重复也不属于S/WGD方式产生的旁系同源基因, 则认为通过其它重复方式产生(Hwang et al., 2011). ...

Joining forces in the quest for orthologs
1
2009

... 物种内旁系同源和物种间直系同源基因的识别不仅有助于比较和进化基因组学研究, 对同源基因的功能预测和注释也有重要意义.常用的同源基因鉴定方法有基于序列相似性、系统发生关系、基因组共线性分析等, 但每种方法都有其自身的局限性.例如, 根据同一物种内基因序列相似性可以鉴定旁系同源基因, 但在长期的进化过程中, 同源基因序列的相似性可能被严重侵蚀, 从而导致鉴定结果有误.本研究中, 通过基因组共线性分析表明A7-A14源于α重复事件, P2-P14源于p重复事件, 具有旁系同源关系, 但在根据序列相似性鉴定旁系同源基因的过程中未发现它们是旁系同源基因.因此, 在同源基因的鉴定过程中需要结合使用多种方法.通常认为, 直系同源基因具有相似的结构和生物学功能(Feng et al., 2007); 而由基因重复产生的旁系同源基因常伴随基因功能的分化(Sonnhammer and Koonin, 2002; Gabaldón et al., 2009).基因重复后的2个拷贝在表达上的分化是功能分化的重要一步(Li et al., 2005).本研究中, 杨树P8P27与已有功能报道的A2直系同源, P8P27对低温胁迫的响应情况也与A2相似.此外, P7P26旁系同源, 但这2个基因在响应低温胁迫时的表达情况差异明显, 推测这2个基因出现了功能分化. ...

FLS2: an LRR receptor-like kinase involved in the perception of the bacterial elicitor flagellin in Arabidopsis
1
2000

... RLK是植物中普遍存在的、数量最多的一类蛋白激酶(郑超等, 2016), 在拟南芥(Arabidopsis thaliana)中约占所有蛋白激酶的60% (Shiu and Bleecker, 2003).典型的植物RLKs具有胞外区、跨膜区和胞内激酶区(Shiu and Bleecker, 2001a).根据胞外结构域特征和胞内激酶结构域序列的系统发生关系, 可以将拟南芥AtRLK分为45个亚家族(Shiu and Bleecker, 2001b).富含亮氨酸重复序列(leucine-rich repeats, LRR)型是其中最大的一类, 包含15个亚家族(LRR I-XV).其中LRR VIII分为LRR VIII-1LRR VIII-2.富含亮氨酸重复类受体蛋白激酶(LRR-RLKs)胞内激酶结构域相对保守, 胞外受体结构域含有富含亮氨酸的保守基序LXXLXLXX (L代表亮氨酸残基, X代表任意氨基酸残基) (Song et al., 2008).LRR-RLKs在调控植物的生长发育、激素信号转导以及响应逆境胁迫等方面发挥重要作用.例如, 拟南芥CLV (LRR XI亚家族)信号途径能够调控茎顶端分生组织干细胞数量, 维持细胞分裂与分化之间的动态平衡(Clark et al., 1997; Ogawa et al., 2008); 拟南芥BAK1 (LRR II亚家族)与BRI1 (LRR X亚家族)形成的二聚体在油菜素内酯的信号转导过程中发挥关键作用(Colcombet et al., 2005; Albrecht et al., 2005); FLS2 (LRR XII亚家族)能够通过胞外的LRR结构域识别病原菌鞭毛蛋白, 介导植物的免疫反应(Gómez-Gómez and Boller, 2000).此外, 拟南芥CRPK1 (LRR VIII-2亚家族)通过磷酸化14-3-3蛋白, 精确调控植物低温胁迫响应(Liu et al., 2017). ...

Differential retention and expansion of the ancestral genes associated with the paleopolyploidies in modern rosid plants, as revealed by analysis of the extensins super-gene family
4
2014

... 基因组共线性分析揭示了拟南芥、杨树、葡萄(Vitis vinifera)和番木瓜(Carica papaya)起源于共同的古六倍体祖先.在长期的进化过程中, 拟南芥基因组经历了3次全基因组重复(α-二倍化、β-二倍化和γ-三倍化), 杨树基因组存在2次全基因组重复(γ-三倍化和p-二倍化), 在葡萄和番木瓜中仅存在1次全基因组重复事件(γ-三倍化) (The Arabidopsis Genome Initiative, 2000; Tang et al., 2008a, 2008b; Guo et al., 2014; Dai et al., 2014).由于全基因组重复事件祖先基因发生倍增, 导致基因剂量增加, 并可能经历不同的进化命运: (1) 新功能化(neofunctionalization), 倍增后的2个拷贝都保留下来, 其中1个拷贝保留了祖先基因的功能, 而另外1个拷贝获得了新功能; (2) 假基因化(non-functionalization), 1个冗余拷贝由于随机突变成为无功能的假基因或者发生DNA序列丢失; (3) 亚功能化(subfunctionalization), 2个拷贝都由于突变导致功能部分受损, 必须互补合作才能完成原来祖先基因的功能(孙红正和葛颂, 2010); (4) 剂量选择(dosage selection), 对有利剂量效应的选择使2个拷贝均保留下来并保持原有的功能(Conant and Wolfe, 2008).追溯祖先基因在现代植物基因组中的扩张和保留情况有助于深入理解倍增基因在生物体进化过程中的作用和意义.本研究选用基因组共线性关系明确的4种模式植物拟南芥、杨树、番木瓜和葡萄, 以LRR VIII-2亚家族为例, 通过在不同植物中鉴定该亚家族基因成员, 分析其在不同植物中发生基因扩张、差异保留及表达分化情况, 以期为深入揭示LRR VIII-2亚家族基因的功能及从系统发育角度阐明其它基因家族的进化历史提供参考. ...

... 在基因组进化过程中, 基因可以通过串联重复、片段重复或全基因组重复等方式发生扩张(Freeling, 2009).串联重复基因同时满足2个条件: (1) 位于同一染色体上、基因间隔区≤100 kb (Guo et al., 2014); (2) 基因序列相似性超过阈值(相似区域覆盖较长序列的70%以上, 且Identity>70%) (Yang et al., 2008).为鉴定LRR VIII-2亚家族中通过片段/全基因组重复(S/WGD)方式扩张产生的基因, 首先从PGDD (plant genome duplication database)数据库(Lee et al., 2012)下载4种植物种内及种间基因组共线性数据, 从中筛选出含有LRR VIII-2亚家族基因的成对共线性区段(Block pair), 计算Block pair上所有共线性基因对(包括LRR VIII-2及其侧翼共线性同源基因)的Ks中值, 并根据Ks中值估算该染色体区段(Block)所经历的S/WGD事件, 即位于该区段的LRR VIII-2亚家族基因的扩张方式(Guo et al., 2014).对于既不属于串联重复也不属于S/WGD方式产生的旁系同源基因, 则认为通过其它重复方式产生(Hwang et al., 2011). ...

... 亚家族基因的扩张方式(Guo et al., 2014).对于既不属于串联重复也不属于S/WGD方式产生的旁系同源基因, 则认为通过其它重复方式产生(Hwang et al., 2011). ...

... 基因组学研究表明, 现代蔷薇类植物起源于共同的古六倍体祖先(Tang et al., 2008b), 在随后的进化过程中, 不同谱系的植物可能经历过1轮或多轮全基因组重复事件.基因发生重复后的保留偏好性及其功能分化一直是生物学领域的热点问题.基于4种模式植物中LRR VIII-2古基因的差异保留和扩张全景图(图2), 我们推测出12个LRR VIII-2古基因, 这些古基因在番木瓜中发生丢失, 而在其它3种植物中发生不同程度的基因扩张, 在杨树中的扩张程度最高.拟南芥虽然经历过更多的全基因组重复事件, 但其基因扩张比例却低于杨树, 原因可能在于拟南芥基因组的碱基替换速率较其它3种植物高(Guo et al., 2014).Fischer等(2016)鉴定了31种显花植物基因组中同时具备LRRs和激酶结构域的LRR-RLKs基因的数量, 并估算出被子植物祖先物种中LRR-RLKs古基因有150个.通过比较这些植物现代基因组中LRR-RLKs与古基因的数量, Fischer等(2016)发现番木瓜和百脉根(Lotus japonicus)是仅有的2种LRR-RLKs基因数目比古基因数目少的植物; 拟南芥和葡萄基因组中LRR-RLKs基因扩张比例分别为1.48和1.29, 处于中等水平; 而杨树是该基因家族扩张程度较高的植物, PtLRR-RLKs基因扩张比例超过2倍.上述研究结果与本研究针对LRR VIII-2亚家族的分析结果一致. ...

Comparative analysis of evolutionary dynamics of genes encoding leucine- rich repeat receptor-like kinase between rice and Arabidopsis
1
2011

... 在基因组进化过程中, 基因可以通过串联重复、片段重复或全基因组重复等方式发生扩张(Freeling, 2009).串联重复基因同时满足2个条件: (1) 位于同一染色体上、基因间隔区≤100 kb (Guo et al., 2014); (2) 基因序列相似性超过阈值(相似区域覆盖较长序列的70%以上, 且Identity>70%) (Yang et al., 2008).为鉴定LRR VIII-2亚家族中通过片段/全基因组重复(S/WGD)方式扩张产生的基因, 首先从PGDD (plant genome duplication database)数据库(Lee et al., 2012)下载4种植物种内及种间基因组共线性数据, 从中筛选出含有LRR VIII-2亚家族基因的成对共线性区段(Block pair), 计算Block pair上所有共线性基因对(包括LRR VIII-2及其侧翼共线性同源基因)的Ks中值, 并根据Ks中值估算该染色体区段(Block)所经历的S/WGD事件, 即位于该区段的LRR VIII-2亚家族基因的扩张方式(Guo et al., 2014).对于既不属于串联重复也不属于S/WGD方式产生的旁系同源基因, 则认为通过其它重复方式产生(Hwang et al., 2011). ...

The cbfs triple mutants reveal the essential functions of cbfs in cold acclimation and allow the definition of CBF regulons in Arabidopsis
1
2016

... 利用NCBI基因表达数据库(gene expression omnibus, GEO)获得拟南芥在低温胁迫条件下的数字表达谱(GSE130729) (Jia et al., 2016), 从中提取LRR VIII-2亚家族成员的表达信息.利用TBtools (Chen et al., 2002)绘制热图, 并对每个基因的表达数据进行正态标准化(Yu et al., 2014), 即Z-score标准化(均值为0, 标准差为1). ...

PGDD: a database of gene and genome duplication in plants
1
2012

... 在基因组进化过程中, 基因可以通过串联重复、片段重复或全基因组重复等方式发生扩张(Freeling, 2009).串联重复基因同时满足2个条件: (1) 位于同一染色体上、基因间隔区≤100 kb (Guo et al., 2014); (2) 基因序列相似性超过阈值(相似区域覆盖较长序列的70%以上, 且Identity>70%) (Yang et al., 2008).为鉴定LRR VIII-2亚家族中通过片段/全基因组重复(S/WGD)方式扩张产生的基因, 首先从PGDD (plant genome duplication database)数据库(Lee et al., 2012)下载4种植物种内及种间基因组共线性数据, 从中筛选出含有LRR VIII-2亚家族基因的成对共线性区段(Block pair), 计算Block pair上所有共线性基因对(包括LRR VIII-2及其侧翼共线性同源基因)的Ks中值, 并根据Ks中值估算该染色体区段(Block)所经历的S/WGD事件, 即位于该区段的LRR VIII-2亚家族基因的扩张方式(Guo et al., 2014).对于既不属于串联重复也不属于S/WGD方式产生的旁系同源基因, 则认为通过其它重复方式产生(Hwang et al., 2011). ...

Diversity, classification and function of the plant protein kinase superfamily
1
2012

... 蛋白激酶参与的可逆磷酸化调控在植物体响应外界环境和内部细胞间的各种信号刺激过程中发挥重要作用(闫锋等, 2009; 张兆沛等, 2009; Lehti-Shiu and Shiu, 2012; 王鹤飞等, 2015).植物蛋白激酶种类繁多, 根据激酶催化域氨基酸序列的相似性可分为5组(Stone and Walker, 1995).(1) AGC组, 包括环核苷酸依赖的蛋白激酶家族(PKA和PKG)、蛋白激酶C家族(PKC)和核糖体S6激酶家族; (2) CaMK组, 包括Ca2+/钙调素依赖的蛋白激酶家族(CDPK)和SNF1/ AMPK家族; (3) CMGC组, 包括细胞周期蛋白依赖的蛋白激酶(CDK)、促分裂原活化蛋白激酶(MAPK)、糖原合成酶激酶-3 (GSK-3)和酪蛋白激酶II (CKII)家族; (4) 酪氨酸蛋白激酶(PTK)组; (5) 其它组, 包括类受体蛋白激酶(receptor-like protein kinase, RLK)等不能归于上述4组的蛋白激酶. ...

20 years of the SMART protein domain annotation resource
1
2018

... 利用拟南芥AtLRR VIII-2亚家族14个成员的蛋白序列(Shiu and Bleecker, 2001b), 分别与毛果杨、番木瓜和葡萄的蛋白序列进行BlastP比对, 查找不同植物中LRR VIII-2亚家族的候选基因, 设置E-value≤e-20 (Shiu and Bleecker, 2001b), Identity≥40% (Tian and Skolnick, 2003).利用在线工具SMART (Letunic and Bork, 2018)、Pfam (Finn et al., 2014)和NCBI CD-search (Marchler-Bauer et al., 2011), 在比对出的候选基因中筛选出具有AtLRR VIII-2蛋白结构域的成员, 选择默认参数.同时, 应用Hmmbuild在线工具(Finn et al., 2011)构建AtLRR VIII-2亚家族的隐马尔科夫模型, 基于该模型对候选基因进行筛选.取上述2种筛选方法中共同保留下来的候选基因, 进一步利用PAUP (Phylogenetic Analysis Using Parsimony) 软件(Cummings, 2004), 基于邻接法, 最小进化、最大简约性标准(Shiu and Bleecker, 2001b), 与拟南芥所有235个LRR-RLKs成员(Shiu and Bleecker, 2001a)构建系统发育树.以葡萄球菌属(Staphylococcus)的氨基糖苷激酶APH3 (Shiu and Bleecker, 2001b)为外类群, 将其中与AtLRR VIII-2聚类在同一分支的基因鉴定为该物种的LRR VIII-2亚家族成员. ...

Expression divergence between duplicate genes
1
2005

... 物种内旁系同源和物种间直系同源基因的识别不仅有助于比较和进化基因组学研究, 对同源基因的功能预测和注释也有重要意义.常用的同源基因鉴定方法有基于序列相似性、系统发生关系、基因组共线性分析等, 但每种方法都有其自身的局限性.例如, 根据同一物种内基因序列相似性可以鉴定旁系同源基因, 但在长期的进化过程中, 同源基因序列的相似性可能被严重侵蚀, 从而导致鉴定结果有误.本研究中, 通过基因组共线性分析表明A7-A14源于α重复事件, P2-P14源于p重复事件, 具有旁系同源关系, 但在根据序列相似性鉴定旁系同源基因的过程中未发现它们是旁系同源基因.因此, 在同源基因的鉴定过程中需要结合使用多种方法.通常认为, 直系同源基因具有相似的结构和生物学功能(Feng et al., 2007); 而由基因重复产生的旁系同源基因常伴随基因功能的分化(Sonnhammer and Koonin, 2002; Gabaldón et al., 2009).基因重复后的2个拷贝在表达上的分化是功能分化的重要一步(Li et al., 2005).本研究中, 杨树P8P27与已有功能报道的A2直系同源, P8P27对低温胁迫的响应情况也与A2相似.此外, P7P26旁系同源, 但这2个基因在响应低温胁迫时的表达情况差异明显, 推测这2个基因出现了功能分化. ...

DnaSP v5: a software for comprehensive analysis of DNA polymorphism data
1
2009

... 4种模式植物LRR VIII-2亚家族中旁系同源(paralogous)与直系同源(orthologous)基因的鉴定基于转录本序列.从Phytozome数据库中获取各基因的转录本序列, 通过Blastn方法鉴定相似序列, 结合系统发育树分析结果, 相似性阈值设为≥300 bp且Identity≥ 40% (Blanc and Wolfe, 2004).在旁系同源基因的鉴定中, 将同一植物中LRR VIII-2亚家族成员进行两两比对, 筛选出相似序列.在直系同源基因的鉴定中, 每2种植物作为1对进行分析.首先用makeblastdb对2个物种的全部CDS序列分别建库, 再用Blastn交叉搜索, 如果2个基因互为最佳匹配且相似性超过阈值, 则认为这2个基因是直系同源对(Blanc and Wolfe, 2004).将LRR VIII-2同源基因对的CDS序列依次输入MEGA7, 进行密码子比对.将比对结果通过DnaSP (Librado and Rozas, 2009)计算KaKs值. ...

Plasma membrane CRPK1-mediated phosphorylation of 14-3-3 proteins induces their nuclear import to fine-tune CBF signaling during cold response
2
2017

... RLK是植物中普遍存在的、数量最多的一类蛋白激酶(郑超等, 2016), 在拟南芥(Arabidopsis thaliana)中约占所有蛋白激酶的60% (Shiu and Bleecker, 2003).典型的植物RLKs具有胞外区、跨膜区和胞内激酶区(Shiu and Bleecker, 2001a).根据胞外结构域特征和胞内激酶结构域序列的系统发生关系, 可以将拟南芥AtRLK分为45个亚家族(Shiu and Bleecker, 2001b).富含亮氨酸重复序列(leucine-rich repeats, LRR)型是其中最大的一类, 包含15个亚家族(LRR I-XV).其中LRR VIII分为LRR VIII-1LRR VIII-2.富含亮氨酸重复类受体蛋白激酶(LRR-RLKs)胞内激酶结构域相对保守, 胞外受体结构域含有富含亮氨酸的保守基序LXXLXLXX (L代表亮氨酸残基, X代表任意氨基酸残基) (Song et al., 2008).LRR-RLKs在调控植物的生长发育、激素信号转导以及响应逆境胁迫等方面发挥重要作用.例如, 拟南芥CLV (LRR XI亚家族)信号途径能够调控茎顶端分生组织干细胞数量, 维持细胞分裂与分化之间的动态平衡(Clark et al., 1997; Ogawa et al., 2008); 拟南芥BAK1 (LRR II亚家族)与BRI1 (LRR X亚家族)形成的二聚体在油菜素内酯的信号转导过程中发挥关键作用(Colcombet et al., 2005; Albrecht et al., 2005); FLS2 (LRR XII亚家族)能够通过胞外的LRR结构域识别病原菌鞭毛蛋白, 介导植物的免疫反应(Gómez-Gómez and Boller, 2000).此外, 拟南芥CRPK1 (LRR VIII-2亚家族)通过磷酸化14-3-3蛋白, 精确调控植物低温胁迫响应(Liu et al., 2017). ...

... AtLRR VIII-2成员AtCRPK1 (对应A2基因)在拟南芥响应低温胁迫中发挥调控作用.该基因在拟南芥各器官中组成型表达(Liu et al., 2017).根据拟南芥低温(4°C)胁迫数字表达谱, 获得AtLRR VIII-2成员的表达水平(图3A).A2基因在低温处理3小时表达量上调并在处理24小时下调; AtLRR VIII-2旁系同源基因中, 有串联重复关系的A4-A5A11-A12表达模式比较相近, 但A8-A9在低温处理24小时表达模式不同; 源于α重复事件的A7-A14在处理3和24小时的表达模式均不相同. ...

CDD: a conserved domain database for the functional annotation of proteins
1
2011

... 利用拟南芥AtLRR VIII-2亚家族14个成员的蛋白序列(Shiu and Bleecker, 2001b), 分别与毛果杨、番木瓜和葡萄的蛋白序列进行BlastP比对, 查找不同植物中LRR VIII-2亚家族的候选基因, 设置E-value≤e-20 (Shiu and Bleecker, 2001b), Identity≥40% (Tian and Skolnick, 2003).利用在线工具SMART (Letunic and Bork, 2018)、Pfam (Finn et al., 2014)和NCBI CD-search (Marchler-Bauer et al., 2011), 在比对出的候选基因中筛选出具有AtLRR VIII-2蛋白结构域的成员, 选择默认参数.同时, 应用Hmmbuild在线工具(Finn et al., 2011)构建AtLRR VIII-2亚家族的隐马尔科夫模型, 基于该模型对候选基因进行筛选.取上述2种筛选方法中共同保留下来的候选基因, 进一步利用PAUP (Phylogenetic Analysis Using Parsimony) 软件(Cummings, 2004), 基于邻接法, 最小进化、最大简约性标准(Shiu and Bleecker, 2001b), 与拟南芥所有235个LRR-RLKs成员(Shiu and Bleecker, 2001a)构建系统发育树.以葡萄球菌属(Staphylococcus)的氨基糖苷激酶APH3 (Shiu and Bleecker, 2001b)为外类群, 将其中与AtLRR VIII-2聚类在同一分支的基因鉴定为该物种的LRR VIII-2亚家族成员. ...

The early stages of duplicate gene evolution
1
2003

... 基因重复(gene duplication)及随后的基因功能多样性分化是基因组和遗传系统分化的重要动力, 在生物进化过程中发挥极其重要的作用(Moore and Purugganan, 2003).基因重复可以通过多种方式进行, 包括片段重复(segmental duplication)、全基因组重复(whole-genome duplication)、串联重复(tandem duplication)和转座重复(transpositional duplication) (Freeling, 2009).在众多的植物基因家族中, 对RLKs基因家族的进化历史研究比较深入, 特别是其中的LRR-RLKs (Tang et al., 2010; Fischer et al., 2016).植物基因组中存在大量的LRR-RLKs基因, 已发现在双子叶植物拟南芥、油菜(Brassica rapa)、番茄(Solanum lycopersicum)和杨树(Populus trichocarpa)基因组中分别有235、303、234和379个LRR- RLKs编码基因(Shiu and Bleecker, 2001a; Zan et al., 2013; Rameneni et al., 2015; Wei et al., 2015); 在单子叶植物水稻(Oryza sativa)中有309个, 小麦(Triticum aestivum)中多达531个(Sun and Wang, 2011; Shumayla et al., 2016).在多种植物中开展的生物信息学分析表明, 串联重复和片段或全基因组重复(segmental or whole-genome duplication, S/ WGD)是LRR-RLKs类基因发生扩张的主要机制(Shiu and Bleecker, 2001b, 2003; Sun and Wang, 2011; Zan et al., 2013).在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

Arabidopsis CLV3 peptide directly binds CLV1 ectodomain
1
2008

... RLK是植物中普遍存在的、数量最多的一类蛋白激酶(郑超等, 2016), 在拟南芥(Arabidopsis thaliana)中约占所有蛋白激酶的60% (Shiu and Bleecker, 2003).典型的植物RLKs具有胞外区、跨膜区和胞内激酶区(Shiu and Bleecker, 2001a).根据胞外结构域特征和胞内激酶结构域序列的系统发生关系, 可以将拟南芥AtRLK分为45个亚家族(Shiu and Bleecker, 2001b).富含亮氨酸重复序列(leucine-rich repeats, LRR)型是其中最大的一类, 包含15个亚家族(LRR I-XV).其中LRR VIII分为LRR VIII-1LRR VIII-2.富含亮氨酸重复类受体蛋白激酶(LRR-RLKs)胞内激酶结构域相对保守, 胞外受体结构域含有富含亮氨酸的保守基序LXXLXLXX (L代表亮氨酸残基, X代表任意氨基酸残基) (Song et al., 2008).LRR-RLKs在调控植物的生长发育、激素信号转导以及响应逆境胁迫等方面发挥重要作用.例如, 拟南芥CLV (LRR XI亚家族)信号途径能够调控茎顶端分生组织干细胞数量, 维持细胞分裂与分化之间的动态平衡(Clark et al., 1997; Ogawa et al., 2008); 拟南芥BAK1 (LRR II亚家族)与BRI1 (LRR X亚家族)形成的二聚体在油菜素内酯的信号转导过程中发挥关键作用(Colcombet et al., 2005; Albrecht et al., 2005); FLS2 (LRR XII亚家族)能够通过胞外的LRR结构域识别病原菌鞭毛蛋白, 介导植物的免疫反应(Gómez-Gómez and Boller, 2000).此外, 拟南芥CRPK1 (LRR VIII-2亚家族)通过磷酸化14-3-3蛋白, 精确调控植物低温胁迫响应(Liu et al., 2017). ...

Genomic and post-translational modification analysis of leucine-rich-repeat receptor-like kinases in Brassica rapa
1
2015

... 基因重复(gene duplication)及随后的基因功能多样性分化是基因组和遗传系统分化的重要动力, 在生物进化过程中发挥极其重要的作用(Moore and Purugganan, 2003).基因重复可以通过多种方式进行, 包括片段重复(segmental duplication)、全基因组重复(whole-genome duplication)、串联重复(tandem duplication)和转座重复(transpositional duplication) (Freeling, 2009).在众多的植物基因家族中, 对RLKs基因家族的进化历史研究比较深入, 特别是其中的LRR-RLKs (Tang et al., 2010; Fischer et al., 2016).植物基因组中存在大量的LRR-RLKs基因, 已发现在双子叶植物拟南芥、油菜(Brassica rapa)、番茄(Solanum lycopersicum)和杨树(Populus trichocarpa)基因组中分别有235、303、234和379个LRR- RLKs编码基因(Shiu and Bleecker, 2001a; Zan et al., 2013; Rameneni et al., 2015; Wei et al., 2015); 在单子叶植物水稻(Oryza sativa)中有309个, 小麦(Triticum aestivum)中多达531个(Sun and Wang, 2011; Shumayla et al., 2016).在多种植物中开展的生物信息学分析表明, 串联重复和片段或全基因组重复(segmental or whole-genome duplication, S/ WGD)是LRR-RLKs类基因发生扩张的主要机制(Shiu and Bleecker, 2001b, 2003; Sun and Wang, 2011; Zan et al., 2013).在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

Expansion of the receptor-like kinase/Pelle gene family and receptor-like proteins in Arabidopsis
3
2003

... RLK是植物中普遍存在的、数量最多的一类蛋白激酶(郑超等, 2016), 在拟南芥(Arabidopsis thaliana)中约占所有蛋白激酶的60% (Shiu and Bleecker, 2003).典型的植物RLKs具有胞外区、跨膜区和胞内激酶区(Shiu and Bleecker, 2001a).根据胞外结构域特征和胞内激酶结构域序列的系统发生关系, 可以将拟南芥AtRLK分为45个亚家族(Shiu and Bleecker, 2001b).富含亮氨酸重复序列(leucine-rich repeats, LRR)型是其中最大的一类, 包含15个亚家族(LRR I-XV).其中LRR VIII分为LRR VIII-1LRR VIII-2.富含亮氨酸重复类受体蛋白激酶(LRR-RLKs)胞内激酶结构域相对保守, 胞外受体结构域含有富含亮氨酸的保守基序LXXLXLXX (L代表亮氨酸残基, X代表任意氨基酸残基) (Song et al., 2008).LRR-RLKs在调控植物的生长发育、激素信号转导以及响应逆境胁迫等方面发挥重要作用.例如, 拟南芥CLV (LRR XI亚家族)信号途径能够调控茎顶端分生组织干细胞数量, 维持细胞分裂与分化之间的动态平衡(Clark et al., 1997; Ogawa et al., 2008); 拟南芥BAK1 (LRR II亚家族)与BRI1 (LRR X亚家族)形成的二聚体在油菜素内酯的信号转导过程中发挥关键作用(Colcombet et al., 2005; Albrecht et al., 2005); FLS2 (LRR XII亚家族)能够通过胞外的LRR结构域识别病原菌鞭毛蛋白, 介导植物的免疫反应(Gómez-Gómez and Boller, 2000).此外, 拟南芥CRPK1 (LRR VIII-2亚家族)通过磷酸化14-3-3蛋白, 精确调控植物低温胁迫响应(Liu et al., 2017). ...

... 基因重复(gene duplication)及随后的基因功能多样性分化是基因组和遗传系统分化的重要动力, 在生物进化过程中发挥极其重要的作用(Moore and Purugganan, 2003).基因重复可以通过多种方式进行, 包括片段重复(segmental duplication)、全基因组重复(whole-genome duplication)、串联重复(tandem duplication)和转座重复(transpositional duplication) (Freeling, 2009).在众多的植物基因家族中, 对RLKs基因家族的进化历史研究比较深入, 特别是其中的LRR-RLKs (Tang et al., 2010; Fischer et al., 2016).植物基因组中存在大量的LRR-RLKs基因, 已发现在双子叶植物拟南芥、油菜(Brassica rapa)、番茄(Solanum lycopersicum)和杨树(Populus trichocarpa)基因组中分别有235、303、234和379个LRR- RLKs编码基因(Shiu and Bleecker, 2001a; Zan et al., 2013; Rameneni et al., 2015; Wei et al., 2015); 在单子叶植物水稻(Oryza sativa)中有309个, 小麦(Triticum aestivum)中多达531个(Sun and Wang, 2011; Shumayla et al., 2016).在多种植物中开展的生物信息学分析表明, 串联重复和片段或全基因组重复(segmental or whole-genome duplication, S/ WGD)是LRR-RLKs类基因发生扩张的主要机制(Shiu and Bleecker, 2001b, 2003; Sun and Wang, 2011; Zan et al., 2013).在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

... , 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

Plant receptor-like kinase gene family: diversity, function, and signaling
4
2001

... RLK是植物中普遍存在的、数量最多的一类蛋白激酶(郑超等, 2016), 在拟南芥(Arabidopsis thaliana)中约占所有蛋白激酶的60% (Shiu and Bleecker, 2003).典型的植物RLKs具有胞外区、跨膜区和胞内激酶区(Shiu and Bleecker, 2001a).根据胞外结构域特征和胞内激酶结构域序列的系统发生关系, 可以将拟南芥AtRLK分为45个亚家族(Shiu and Bleecker, 2001b).富含亮氨酸重复序列(leucine-rich repeats, LRR)型是其中最大的一类, 包含15个亚家族(LRR I-XV).其中LRR VIII分为LRR VIII-1LRR VIII-2.富含亮氨酸重复类受体蛋白激酶(LRR-RLKs)胞内激酶结构域相对保守, 胞外受体结构域含有富含亮氨酸的保守基序LXXLXLXX (L代表亮氨酸残基, X代表任意氨基酸残基) (Song et al., 2008).LRR-RLKs在调控植物的生长发育、激素信号转导以及响应逆境胁迫等方面发挥重要作用.例如, 拟南芥CLV (LRR XI亚家族)信号途径能够调控茎顶端分生组织干细胞数量, 维持细胞分裂与分化之间的动态平衡(Clark et al., 1997; Ogawa et al., 2008); 拟南芥BAK1 (LRR II亚家族)与BRI1 (LRR X亚家族)形成的二聚体在油菜素内酯的信号转导过程中发挥关键作用(Colcombet et al., 2005; Albrecht et al., 2005); FLS2 (LRR XII亚家族)能够通过胞外的LRR结构域识别病原菌鞭毛蛋白, 介导植物的免疫反应(Gómez-Gómez and Boller, 2000).此外, 拟南芥CRPK1 (LRR VIII-2亚家族)通过磷酸化14-3-3蛋白, 精确调控植物低温胁迫响应(Liu et al., 2017). ...

... 基因重复(gene duplication)及随后的基因功能多样性分化是基因组和遗传系统分化的重要动力, 在生物进化过程中发挥极其重要的作用(Moore and Purugganan, 2003).基因重复可以通过多种方式进行, 包括片段重复(segmental duplication)、全基因组重复(whole-genome duplication)、串联重复(tandem duplication)和转座重复(transpositional duplication) (Freeling, 2009).在众多的植物基因家族中, 对RLKs基因家族的进化历史研究比较深入, 特别是其中的LRR-RLKs (Tang et al., 2010; Fischer et al., 2016).植物基因组中存在大量的LRR-RLKs基因, 已发现在双子叶植物拟南芥、油菜(Brassica rapa)、番茄(Solanum lycopersicum)和杨树(Populus trichocarpa)基因组中分别有235、303、234和379个LRR- RLKs编码基因(Shiu and Bleecker, 2001a; Zan et al., 2013; Rameneni et al., 2015; Wei et al., 2015); 在单子叶植物水稻(Oryza sativa)中有309个, 小麦(Triticum aestivum)中多达531个(Sun and Wang, 2011; Shumayla et al., 2016).在多种植物中开展的生物信息学分析表明, 串联重复和片段或全基因组重复(segmental or whole-genome duplication, S/ WGD)是LRR-RLKs类基因发生扩张的主要机制(Shiu and Bleecker, 2001b, 2003; Sun and Wang, 2011; Zan et al., 2013).在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

... 利用拟南芥AtLRR VIII-2亚家族14个成员的蛋白序列(Shiu and Bleecker, 2001b), 分别与毛果杨、番木瓜和葡萄的蛋白序列进行BlastP比对, 查找不同植物中LRR VIII-2亚家族的候选基因, 设置E-value≤e-20 (Shiu and Bleecker, 2001b), Identity≥40% (Tian and Skolnick, 2003).利用在线工具SMART (Letunic and Bork, 2018)、Pfam (Finn et al., 2014)和NCBI CD-search (Marchler-Bauer et al., 2011), 在比对出的候选基因中筛选出具有AtLRR VIII-2蛋白结构域的成员, 选择默认参数.同时, 应用Hmmbuild在线工具(Finn et al., 2011)构建AtLRR VIII-2亚家族的隐马尔科夫模型, 基于该模型对候选基因进行筛选.取上述2种筛选方法中共同保留下来的候选基因, 进一步利用PAUP (Phylogenetic Analysis Using Parsimony) 软件(Cummings, 2004), 基于邻接法, 最小进化、最大简约性标准(Shiu and Bleecker, 2001b), 与拟南芥所有235个LRR-RLKs成员(Shiu and Bleecker, 2001a)构建系统发育树.以葡萄球菌属(Staphylococcus)的氨基糖苷激酶APH3 (Shiu and Bleecker, 2001b)为外类群, 将其中与AtLRR VIII-2聚类在同一分支的基因鉴定为该物种的LRR VIII-2亚家族成员. ...

... 在拟南芥AtLRR VIII-2中有2个基因(A2A13)不具备胞外LRR结构域, 因此本研究鉴定的LRR VIII-2亚家族中一部分成员只有胞内的激酶结构域, 这些基因聚集成2个相对独立的分支Clade II-1和Clade II-3 (图1).这些成员的构象与类受体胞内激酶(receptor-like cytoplasmic kinases, RLCKs)非常相近.在拟南芥235个LRR-RLKs基因中, 4.7%的成员无胞外结构域, 其可能是现存LRR-RLKs中激酶结构域的祖先形式, 在长期进化过程中通过结构域融合被募集到LRR-RLKs构象中(Shiu and Bleecker, 2001a).本研究推断的12个LRR VIII-2古基因中, 7个具有完整的胞外LRR结构域、跨膜区及胞内激酶活性结构域, 这与Fischer等(2016)通过协调树构建法(tree reconciliation approach)鉴定的LRR VIII-2亚家族古基因数目(8个)非常接近.此外, 12个古基因中, 仅有3个在4种植物的现代基因组中能找到被保留下来的拷贝(图2, 第1-3行); 其余9个古基因仅在某一种植物中保留, 而在其它植物中丢失.例如, 葡萄的V5、杨树的P8和拟南芥的A7, 这些在某一特定物种保留下来的基因起源于不同的祖先基因, 可能在该物种中行使必不可少的功能. ...

b). Receptor-like kinases from Arabidopsis form a monophyletic gene family related to animal receptor kinases
8
2001

... RLK是植物中普遍存在的、数量最多的一类蛋白激酶(郑超等, 2016), 在拟南芥(Arabidopsis thaliana)中约占所有蛋白激酶的60% (Shiu and Bleecker, 2003).典型的植物RLKs具有胞外区、跨膜区和胞内激酶区(Shiu and Bleecker, 2001a).根据胞外结构域特征和胞内激酶结构域序列的系统发生关系, 可以将拟南芥AtRLK分为45个亚家族(Shiu and Bleecker, 2001b).富含亮氨酸重复序列(leucine-rich repeats, LRR)型是其中最大的一类, 包含15个亚家族(LRR I-XV).其中LRR VIII分为LRR VIII-1LRR VIII-2.富含亮氨酸重复类受体蛋白激酶(LRR-RLKs)胞内激酶结构域相对保守, 胞外受体结构域含有富含亮氨酸的保守基序LXXLXLXX (L代表亮氨酸残基, X代表任意氨基酸残基) (Song et al., 2008).LRR-RLKs在调控植物的生长发育、激素信号转导以及响应逆境胁迫等方面发挥重要作用.例如, 拟南芥CLV (LRR XI亚家族)信号途径能够调控茎顶端分生组织干细胞数量, 维持细胞分裂与分化之间的动态平衡(Clark et al., 1997; Ogawa et al., 2008); 拟南芥BAK1 (LRR II亚家族)与BRI1 (LRR X亚家族)形成的二聚体在油菜素内酯的信号转导过程中发挥关键作用(Colcombet et al., 2005; Albrecht et al., 2005); FLS2 (LRR XII亚家族)能够通过胞外的LRR结构域识别病原菌鞭毛蛋白, 介导植物的免疫反应(Gómez-Gómez and Boller, 2000).此外, 拟南芥CRPK1 (LRR VIII-2亚家族)通过磷酸化14-3-3蛋白, 精确调控植物低温胁迫响应(Liu et al., 2017). ...

... 基因重复(gene duplication)及随后的基因功能多样性分化是基因组和遗传系统分化的重要动力, 在生物进化过程中发挥极其重要的作用(Moore and Purugganan, 2003).基因重复可以通过多种方式进行, 包括片段重复(segmental duplication)、全基因组重复(whole-genome duplication)、串联重复(tandem duplication)和转座重复(transpositional duplication) (Freeling, 2009).在众多的植物基因家族中, 对RLKs基因家族的进化历史研究比较深入, 特别是其中的LRR-RLKs (Tang et al., 2010; Fischer et al., 2016).植物基因组中存在大量的LRR-RLKs基因, 已发现在双子叶植物拟南芥、油菜(Brassica rapa)、番茄(Solanum lycopersicum)和杨树(Populus trichocarpa)基因组中分别有235、303、234和379个LRR- RLKs编码基因(Shiu and Bleecker, 2001a; Zan et al., 2013; Rameneni et al., 2015; Wei et al., 2015); 在单子叶植物水稻(Oryza sativa)中有309个, 小麦(Triticum aestivum)中多达531个(Sun and Wang, 2011; Shumayla et al., 2016).在多种植物中开展的生物信息学分析表明, 串联重复和片段或全基因组重复(segmental or whole-genome duplication, S/ WGD)是LRR-RLKs类基因发生扩张的主要机制(Shiu and Bleecker, 2001b, 2003; Sun and Wang, 2011; Zan et al., 2013).在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

... 是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

... 成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

... 利用拟南芥AtLRR VIII-2亚家族14个成员的蛋白序列(Shiu and Bleecker, 2001b), 分别与毛果杨、番木瓜和葡萄的蛋白序列进行BlastP比对, 查找不同植物中LRR VIII-2亚家族的候选基因, 设置E-value≤e-20 (Shiu and Bleecker, 2001b), Identity≥40% (Tian and Skolnick, 2003).利用在线工具SMART (Letunic and Bork, 2018)、Pfam (Finn et al., 2014)和NCBI CD-search (Marchler-Bauer et al., 2011), 在比对出的候选基因中筛选出具有AtLRR VIII-2蛋白结构域的成员, 选择默认参数.同时, 应用Hmmbuild在线工具(Finn et al., 2011)构建AtLRR VIII-2亚家族的隐马尔科夫模型, 基于该模型对候选基因进行筛选.取上述2种筛选方法中共同保留下来的候选基因, 进一步利用PAUP (Phylogenetic Analysis Using Parsimony) 软件(Cummings, 2004), 基于邻接法, 最小进化、最大简约性标准(Shiu and Bleecker, 2001b), 与拟南芥所有235个LRR-RLKs成员(Shiu and Bleecker, 2001a)构建系统发育树.以葡萄球菌属(Staphylococcus)的氨基糖苷激酶APH3 (Shiu and Bleecker, 2001b)为外类群, 将其中与AtLRR VIII-2聚类在同一分支的基因鉴定为该物种的LRR VIII-2亚家族成员. ...

... 亚家族的候选基因, 设置E-value≤e-20 (Shiu and Bleecker, 2001b), Identity≥40% (Tian and Skolnick, 2003).利用在线工具SMART (Letunic and Bork, 2018)、Pfam (Finn et al., 2014)和NCBI CD-search (Marchler-Bauer et al., 2011), 在比对出的候选基因中筛选出具有AtLRR VIII-2蛋白结构域的成员, 选择默认参数.同时, 应用Hmmbuild在线工具(Finn et al., 2011)构建AtLRR VIII-2亚家族的隐马尔科夫模型, 基于该模型对候选基因进行筛选.取上述2种筛选方法中共同保留下来的候选基因, 进一步利用PAUP (Phylogenetic Analysis Using Parsimony) 软件(Cummings, 2004), 基于邻接法, 最小进化、最大简约性标准(Shiu and Bleecker, 2001b), 与拟南芥所有235个LRR-RLKs成员(Shiu and Bleecker, 2001a)构建系统发育树.以葡萄球菌属(Staphylococcus)的氨基糖苷激酶APH3 (Shiu and Bleecker, 2001b)为外类群, 将其中与AtLRR VIII-2聚类在同一分支的基因鉴定为该物种的LRR VIII-2亚家族成员. ...

... ), 基于邻接法, 最小进化、最大简约性标准(Shiu and Bleecker, 2001b), 与拟南芥所有235个LRR-RLKs成员(Shiu and Bleecker, 2001a)构建系统发育树.以葡萄球菌属(Staphylococcus)的氨基糖苷激酶APH3 (Shiu and Bleecker, 2001b)为外类群, 将其中与AtLRR VIII-2聚类在同一分支的基因鉴定为该物种的LRR VIII-2亚家族成员. ...

... (Shiu and Bleecker, 2001b)为外类群, 将其中与AtLRR VIII-2聚类在同一分支的基因鉴定为该物种的LRR VIII-2亚家族成员. ...

Genomic dissection and expression profiling revealed functional divergence in Triticum aestivum leucine rich repeat receptor like kinases (TaLRRKs)
1
2016

... 基因重复(gene duplication)及随后的基因功能多样性分化是基因组和遗传系统分化的重要动力, 在生物进化过程中发挥极其重要的作用(Moore and Purugganan, 2003).基因重复可以通过多种方式进行, 包括片段重复(segmental duplication)、全基因组重复(whole-genome duplication)、串联重复(tandem duplication)和转座重复(transpositional duplication) (Freeling, 2009).在众多的植物基因家族中, 对RLKs基因家族的进化历史研究比较深入, 特别是其中的LRR-RLKs (Tang et al., 2010; Fischer et al., 2016).植物基因组中存在大量的LRR-RLKs基因, 已发现在双子叶植物拟南芥、油菜(Brassica rapa)、番茄(Solanum lycopersicum)和杨树(Populus trichocarpa)基因组中分别有235、303、234和379个LRR- RLKs编码基因(Shiu and Bleecker, 2001a; Zan et al., 2013; Rameneni et al., 2015; Wei et al., 2015); 在单子叶植物水稻(Oryza sativa)中有309个, 小麦(Triticum aestivum)中多达531个(Sun and Wang, 2011; Shumayla et al., 2016).在多种植物中开展的生物信息学分析表明, 串联重复和片段或全基因组重复(segmental or whole-genome duplication, S/ WGD)是LRR-RLKs类基因发生扩张的主要机制(Shiu and Bleecker, 2001b, 2003; Sun and Wang, 2011; Zan et al., 2013).在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

Molecular characterization and expression analysis of OsBISERK1, a gene encoding a leucine-rich repeat receptor-like kinase, during disease resistance responses in rice
1
2008

... RLK是植物中普遍存在的、数量最多的一类蛋白激酶(郑超等, 2016), 在拟南芥(Arabidopsis thaliana)中约占所有蛋白激酶的60% (Shiu and Bleecker, 2003).典型的植物RLKs具有胞外区、跨膜区和胞内激酶区(Shiu and Bleecker, 2001a).根据胞外结构域特征和胞内激酶结构域序列的系统发生关系, 可以将拟南芥AtRLK分为45个亚家族(Shiu and Bleecker, 2001b).富含亮氨酸重复序列(leucine-rich repeats, LRR)型是其中最大的一类, 包含15个亚家族(LRR I-XV).其中LRR VIII分为LRR VIII-1LRR VIII-2.富含亮氨酸重复类受体蛋白激酶(LRR-RLKs)胞内激酶结构域相对保守, 胞外受体结构域含有富含亮氨酸的保守基序LXXLXLXX (L代表亮氨酸残基, X代表任意氨基酸残基) (Song et al., 2008).LRR-RLKs在调控植物的生长发育、激素信号转导以及响应逆境胁迫等方面发挥重要作用.例如, 拟南芥CLV (LRR XI亚家族)信号途径能够调控茎顶端分生组织干细胞数量, 维持细胞分裂与分化之间的动态平衡(Clark et al., 1997; Ogawa et al., 2008); 拟南芥BAK1 (LRR II亚家族)与BRI1 (LRR X亚家族)形成的二聚体在油菜素内酯的信号转导过程中发挥关键作用(Colcombet et al., 2005; Albrecht et al., 2005); FLS2 (LRR XII亚家族)能够通过胞外的LRR结构域识别病原菌鞭毛蛋白, 介导植物的免疫反应(Gómez-Gómez and Boller, 2000).此外, 拟南芥CRPK1 (LRR VIII-2亚家族)通过磷酸化14-3-3蛋白, 精确调控植物低温胁迫响应(Liu et al., 2017). ...

Orthology, paralogy and proposed classification for paralog subtypes
1
2002

... 物种内旁系同源和物种间直系同源基因的识别不仅有助于比较和进化基因组学研究, 对同源基因的功能预测和注释也有重要意义.常用的同源基因鉴定方法有基于序列相似性、系统发生关系、基因组共线性分析等, 但每种方法都有其自身的局限性.例如, 根据同一物种内基因序列相似性可以鉴定旁系同源基因, 但在长期的进化过程中, 同源基因序列的相似性可能被严重侵蚀, 从而导致鉴定结果有误.本研究中, 通过基因组共线性分析表明A7-A14源于α重复事件, P2-P14源于p重复事件, 具有旁系同源关系, 但在根据序列相似性鉴定旁系同源基因的过程中未发现它们是旁系同源基因.因此, 在同源基因的鉴定过程中需要结合使用多种方法.通常认为, 直系同源基因具有相似的结构和生物学功能(Feng et al., 2007); 而由基因重复产生的旁系同源基因常伴随基因功能的分化(Sonnhammer and Koonin, 2002; Gabaldón et al., 2009).基因重复后的2个拷贝在表达上的分化是功能分化的重要一步(Li et al., 2005).本研究中, 杨树P8P27与已有功能报道的A2直系同源, P8P27对低温胁迫的响应情况也与A2相似.此外, P7P26旁系同源, 但这2个基因在响应低温胁迫时的表达情况差异明显, 推测这2个基因出现了功能分化. ...

Plant protein kinase families and signal transduction
1
1995

... 蛋白激酶参与的可逆磷酸化调控在植物体响应外界环境和内部细胞间的各种信号刺激过程中发挥重要作用(闫锋等, 2009; 张兆沛等, 2009; Lehti-Shiu and Shiu, 2012; 王鹤飞等, 2015).植物蛋白激酶种类繁多, 根据激酶催化域氨基酸序列的相似性可分为5组(Stone and Walker, 1995).(1) AGC组, 包括环核苷酸依赖的蛋白激酶家族(PKA和PKG)、蛋白激酶C家族(PKC)和核糖体S6激酶家族; (2) CaMK组, 包括Ca2+/钙调素依赖的蛋白激酶家族(CDPK)和SNF1/ AMPK家族; (3) CMGC组, 包括细胞周期蛋白依赖的蛋白激酶(CDK)、促分裂原活化蛋白激酶(MAPK)、糖原合成酶激酶-3 (GSK-3)和酪蛋白激酶II (CKII)家族; (4) 酪氨酸蛋白激酶(PTK)组; (5) 其它组, 包括类受体蛋白激酶(receptor-like protein kinase, RLK)等不能归于上述4组的蛋白激酶. ...

Genome-wide identification, characterization and phylogenetic analysis of the rice LRR-kinases
2
2011

... 基因重复(gene duplication)及随后的基因功能多样性分化是基因组和遗传系统分化的重要动力, 在生物进化过程中发挥极其重要的作用(Moore and Purugganan, 2003).基因重复可以通过多种方式进行, 包括片段重复(segmental duplication)、全基因组重复(whole-genome duplication)、串联重复(tandem duplication)和转座重复(transpositional duplication) (Freeling, 2009).在众多的植物基因家族中, 对RLKs基因家族的进化历史研究比较深入, 特别是其中的LRR-RLKs (Tang et al., 2010; Fischer et al., 2016).植物基因组中存在大量的LRR-RLKs基因, 已发现在双子叶植物拟南芥、油菜(Brassica rapa)、番茄(Solanum lycopersicum)和杨树(Populus trichocarpa)基因组中分别有235、303、234和379个LRR- RLKs编码基因(Shiu and Bleecker, 2001a; Zan et al., 2013; Rameneni et al., 2015; Wei et al., 2015); 在单子叶植物水稻(Oryza sativa)中有309个, 小麦(Triticum aestivum)中多达531个(Sun and Wang, 2011; Shumayla et al., 2016).在多种植物中开展的生物信息学分析表明, 串联重复和片段或全基因组重复(segmental or whole-genome duplication, S/ WGD)是LRR-RLKs类基因发生扩张的主要机制(Shiu and Bleecker, 2001b, 2003; Sun and Wang, 2011; Zan et al., 2013).在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

... ; Sun and Wang, 2011; Zan et al., 2013).在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

Synteny and collinearity in plant genomes
1
2008

... 基因组共线性分析揭示了拟南芥、杨树、葡萄(Vitis vinifera)和番木瓜(Carica papaya)起源于共同的古六倍体祖先.在长期的进化过程中, 拟南芥基因组经历了3次全基因组重复(α-二倍化、β-二倍化和γ-三倍化), 杨树基因组存在2次全基因组重复(γ-三倍化和p-二倍化), 在葡萄和番木瓜中仅存在1次全基因组重复事件(γ-三倍化) (The Arabidopsis Genome Initiative, 2000; Tang et al., 2008a, 2008b; Guo et al., 2014; Dai et al., 2014).由于全基因组重复事件祖先基因发生倍增, 导致基因剂量增加, 并可能经历不同的进化命运: (1) 新功能化(neofunctionalization), 倍增后的2个拷贝都保留下来, 其中1个拷贝保留了祖先基因的功能, 而另外1个拷贝获得了新功能; (2) 假基因化(non-functionalization), 1个冗余拷贝由于随机突变成为无功能的假基因或者发生DNA序列丢失; (3) 亚功能化(subfunctionalization), 2个拷贝都由于突变导致功能部分受损, 必须互补合作才能完成原来祖先基因的功能(孙红正和葛颂, 2010); (4) 剂量选择(dosage selection), 对有利剂量效应的选择使2个拷贝均保留下来并保持原有的功能(Conant and Wolfe, 2008).追溯祖先基因在现代植物基因组中的扩张和保留情况有助于深入理解倍增基因在生物体进化过程中的作用和意义.本研究选用基因组共线性关系明确的4种模式植物拟南芥、杨树、番木瓜和葡萄, 以LRR VIII-2亚家族为例, 通过在不同植物中鉴定该亚家族基因成员, 分析其在不同植物中发生基因扩张、差异保留及表达分化情况, 以期为深入揭示LRR VIII-2亚家族基因的功能及从系统发育角度阐明其它基因家族的进化历史提供参考. ...

Unraveling ancient hexaploidy through multiply-aligned angiosperm gene maps
4
2008

... 基因组共线性分析揭示了拟南芥、杨树、葡萄(Vitis vinifera)和番木瓜(Carica papaya)起源于共同的古六倍体祖先.在长期的进化过程中, 拟南芥基因组经历了3次全基因组重复(α-二倍化、β-二倍化和γ-三倍化), 杨树基因组存在2次全基因组重复(γ-三倍化和p-二倍化), 在葡萄和番木瓜中仅存在1次全基因组重复事件(γ-三倍化) (The Arabidopsis Genome Initiative, 2000; Tang et al., 2008a, 2008b; Guo et al., 2014; Dai et al., 2014).由于全基因组重复事件祖先基因发生倍增, 导致基因剂量增加, 并可能经历不同的进化命运: (1) 新功能化(neofunctionalization), 倍增后的2个拷贝都保留下来, 其中1个拷贝保留了祖先基因的功能, 而另外1个拷贝获得了新功能; (2) 假基因化(non-functionalization), 1个冗余拷贝由于随机突变成为无功能的假基因或者发生DNA序列丢失; (3) 亚功能化(subfunctionalization), 2个拷贝都由于突变导致功能部分受损, 必须互补合作才能完成原来祖先基因的功能(孙红正和葛颂, 2010); (4) 剂量选择(dosage selection), 对有利剂量效应的选择使2个拷贝均保留下来并保持原有的功能(Conant and Wolfe, 2008).追溯祖先基因在现代植物基因组中的扩张和保留情况有助于深入理解倍增基因在生物体进化过程中的作用和意义.本研究选用基因组共线性关系明确的4种模式植物拟南芥、杨树、番木瓜和葡萄, 以LRR VIII-2亚家族为例, 通过在不同植物中鉴定该亚家族基因成员, 分析其在不同植物中发生基因扩张、差异保留及表达分化情况, 以期为深入揭示LRR VIII-2亚家族基因的功能及从系统发育角度阐明其它基因家族的进化历史提供参考. ...

... 基于4种模式植物的基因组共线性数据, 我们筛选出42对包含33个LRR VIII-2亚家族基因的Block pair (表4).计算每对Block pair的Ks中值, 结果显示, 杨树基因组内16对Block pair的Ks中值分布在2个区间: 0.259 2-0.355 1和1.278 45-1.491 2; 拟南芥基因组内唯一的1对Block pair的Ks中值为0.789 6; 葡萄基因组中检测到2对Block pair的Ks中值分别为1.131 35和1.112 55 (表4).比较基因组学研究表明, 几乎所有被子植物基因组都经历过片段重复或全基因组重复事件(S/WGD), 可以利用Ks中值评估共线性染色体区段的历史重复事件(Blanc et al., 2003).根据Tang等(2008b)的报道, 拟南芥基因组中与α重复事件相关的Ks中值为0.86; 毛果杨基因组中与γ和p重复事件相关的Ks中值分别为1.54和0.27; 番木瓜和葡萄基因组中与γ重复事件相关的Ks中值分别为1.76和1.22.参考以上Ks中值与全基因组重复事件的关系, 我们对筛选出的19对种内Block pair经历的重复事件进行了评估.结果表明, 杨树中与p和γ重复事件相关的Block pair分别有9对和7对; 拟南芥的1对Block pair与α重复事件相关; 葡萄中的2对Block pair均与γ重复事件相关(表4).由于拟南芥、杨树、葡萄和番木瓜由共同的古六倍体祖先进化而来(Tang et al., 2008b), 共享γ重复事件, 因此将种间Block pair的关系归于γ重复事件. ...

... ).由于拟南芥、杨树、葡萄和番木瓜由共同的古六倍体祖先进化而来(Tang et al., 2008b), 共享γ重复事件, 因此将种间Block pair的关系归于γ重复事件. ...

... 基因组学研究表明, 现代蔷薇类植物起源于共同的古六倍体祖先(Tang et al., 2008b), 在随后的进化过程中, 不同谱系的植物可能经历过1轮或多轮全基因组重复事件.基因发生重复后的保留偏好性及其功能分化一直是生物学领域的热点问题.基于4种模式植物中LRR VIII-2古基因的差异保留和扩张全景图(图2), 我们推测出12个LRR VIII-2古基因, 这些古基因在番木瓜中发生丢失, 而在其它3种植物中发生不同程度的基因扩张, 在杨树中的扩张程度最高.拟南芥虽然经历过更多的全基因组重复事件, 但其基因扩张比例却低于杨树, 原因可能在于拟南芥基因组的碱基替换速率较其它3种植物高(Guo et al., 2014).Fischer等(2016)鉴定了31种显花植物基因组中同时具备LRRs和激酶结构域的LRR-RLKs基因的数量, 并估算出被子植物祖先物种中LRR-RLKs古基因有150个.通过比较这些植物现代基因组中LRR-RLKs与古基因的数量, Fischer等(2016)发现番木瓜和百脉根(Lotus japonicus)是仅有的2种LRR-RLKs基因数目比古基因数目少的植物; 拟南芥和葡萄基因组中LRR-RLKs基因扩张比例分别为1.48和1.29, 处于中等水平; 而杨树是该基因家族扩张程度较高的植物, PtLRR-RLKs基因扩张比例超过2倍.上述研究结果与本研究针对LRR VIII-2亚家族的分析结果一致. ...

Disease resistance signature of the leucine-rich repeat receptor-like kinase genes in four plant species
1
2010

... 基因重复(gene duplication)及随后的基因功能多样性分化是基因组和遗传系统分化的重要动力, 在生物进化过程中发挥极其重要的作用(Moore and Purugganan, 2003).基因重复可以通过多种方式进行, 包括片段重复(segmental duplication)、全基因组重复(whole-genome duplication)、串联重复(tandem duplication)和转座重复(transpositional duplication) (Freeling, 2009).在众多的植物基因家族中, 对RLKs基因家族的进化历史研究比较深入, 特别是其中的LRR-RLKs (Tang et al., 2010; Fischer et al., 2016).植物基因组中存在大量的LRR-RLKs基因, 已发现在双子叶植物拟南芥、油菜(Brassica rapa)、番茄(Solanum lycopersicum)和杨树(Populus trichocarpa)基因组中分别有235、303、234和379个LRR- RLKs编码基因(Shiu and Bleecker, 2001a; Zan et al., 2013; Rameneni et al., 2015; Wei et al., 2015); 在单子叶植物水稻(Oryza sativa)中有309个, 小麦(Triticum aestivum)中多达531个(Sun and Wang, 2011; Shumayla et al., 2016).在多种植物中开展的生物信息学分析表明, 串联重复和片段或全基因组重复(segmental or whole-genome duplication, S/ WGD)是LRR-RLKs类基因发生扩张的主要机制(Shiu and Bleecker, 2001b, 2003; Sun and Wang, 2011; Zan et al., 2013).在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

Analysis of the genome sequence of the flowering plant Arabidopsis thaliana
1
2000

... 基因组共线性分析揭示了拟南芥、杨树、葡萄(Vitis vinifera)和番木瓜(Carica papaya)起源于共同的古六倍体祖先.在长期的进化过程中, 拟南芥基因组经历了3次全基因组重复(α-二倍化、β-二倍化和γ-三倍化), 杨树基因组存在2次全基因组重复(γ-三倍化和p-二倍化), 在葡萄和番木瓜中仅存在1次全基因组重复事件(γ-三倍化) (The Arabidopsis Genome Initiative, 2000; Tang et al., 2008a, 2008b; Guo et al., 2014; Dai et al., 2014).由于全基因组重复事件祖先基因发生倍增, 导致基因剂量增加, 并可能经历不同的进化命运: (1) 新功能化(neofunctionalization), 倍增后的2个拷贝都保留下来, 其中1个拷贝保留了祖先基因的功能, 而另外1个拷贝获得了新功能; (2) 假基因化(non-functionalization), 1个冗余拷贝由于随机突变成为无功能的假基因或者发生DNA序列丢失; (3) 亚功能化(subfunctionalization), 2个拷贝都由于突变导致功能部分受损, 必须互补合作才能完成原来祖先基因的功能(孙红正和葛颂, 2010); (4) 剂量选择(dosage selection), 对有利剂量效应的选择使2个拷贝均保留下来并保持原有的功能(Conant and Wolfe, 2008).追溯祖先基因在现代植物基因组中的扩张和保留情况有助于深入理解倍增基因在生物体进化过程中的作用和意义.本研究选用基因组共线性关系明确的4种模式植物拟南芥、杨树、番木瓜和葡萄, 以LRR VIII-2亚家族为例, 通过在不同植物中鉴定该亚家族基因成员, 分析其在不同植物中发生基因扩张、差异保留及表达分化情况, 以期为深入揭示LRR VIII-2亚家族基因的功能及从系统发育角度阐明其它基因家族的进化历史提供参考. ...

How well is enzyme function conserved as a function of pairwise sequence identity?
1
2003

... 利用拟南芥AtLRR VIII-2亚家族14个成员的蛋白序列(Shiu and Bleecker, 2001b), 分别与毛果杨、番木瓜和葡萄的蛋白序列进行BlastP比对, 查找不同植物中LRR VIII-2亚家族的候选基因, 设置E-value≤e-20 (Shiu and Bleecker, 2001b), Identity≥40% (Tian and Skolnick, 2003).利用在线工具SMART (Letunic and Bork, 2018)、Pfam (Finn et al., 2014)和NCBI CD-search (Marchler-Bauer et al., 2011), 在比对出的候选基因中筛选出具有AtLRR VIII-2蛋白结构域的成员, 选择默认参数.同时, 应用Hmmbuild在线工具(Finn et al., 2011)构建AtLRR VIII-2亚家族的隐马尔科夫模型, 基于该模型对候选基因进行筛选.取上述2种筛选方法中共同保留下来的候选基因, 进一步利用PAUP (Phylogenetic Analysis Using Parsimony) 软件(Cummings, 2004), 基于邻接法, 最小进化、最大简约性标准(Shiu and Bleecker, 2001b), 与拟南芥所有235个LRR-RLKs成员(Shiu and Bleecker, 2001a)构建系统发育树.以葡萄球菌属(Staphylococcus)的氨基糖苷激酶APH3 (Shiu and Bleecker, 2001b)为外类群, 将其中与AtLRR VIII-2聚类在同一分支的基因鉴定为该物种的LRR VIII-2亚家族成员. ...

Identification and expression analysis of the LRR-RLK gene family in tomato(Solanum lycopersicum) Heinz 1706
1
2015

... 基因重复(gene duplication)及随后的基因功能多样性分化是基因组和遗传系统分化的重要动力, 在生物进化过程中发挥极其重要的作用(Moore and Purugganan, 2003).基因重复可以通过多种方式进行, 包括片段重复(segmental duplication)、全基因组重复(whole-genome duplication)、串联重复(tandem duplication)和转座重复(transpositional duplication) (Freeling, 2009).在众多的植物基因家族中, 对RLKs基因家族的进化历史研究比较深入, 特别是其中的LRR-RLKs (Tang et al., 2010; Fischer et al., 2016).植物基因组中存在大量的LRR-RLKs基因, 已发现在双子叶植物拟南芥、油菜(Brassica rapa)、番茄(Solanum lycopersicum)和杨树(Populus trichocarpa)基因组中分别有235、303、234和379个LRR- RLKs编码基因(Shiu and Bleecker, 2001a; Zan et al., 2013; Rameneni et al., 2015; Wei et al., 2015); 在单子叶植物水稻(Oryza sativa)中有309个, 小麦(Triticum aestivum)中多达531个(Sun and Wang, 2011; Shumayla et al., 2016).在多种植物中开展的生物信息学分析表明, 串联重复和片段或全基因组重复(segmental or whole-genome duplication, S/ WGD)是LRR-RLKs类基因发生扩张的主要机制(Shiu and Bleecker, 2001b, 2003; Sun and Wang, 2011; Zan et al., 2013).在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

Recent duplications dominate NBS-encoding gene expansion in two woody species
1
2008

... 在基因组进化过程中, 基因可以通过串联重复、片段重复或全基因组重复等方式发生扩张(Freeling, 2009).串联重复基因同时满足2个条件: (1) 位于同一染色体上、基因间隔区≤100 kb (Guo et al., 2014); (2) 基因序列相似性超过阈值(相似区域覆盖较长序列的70%以上, 且Identity>70%) (Yang et al., 2008).为鉴定LRR VIII-2亚家族中通过片段/全基因组重复(S/WGD)方式扩张产生的基因, 首先从PGDD (plant genome duplication database)数据库(Lee et al., 2012)下载4种植物种内及种间基因组共线性数据, 从中筛选出含有LRR VIII-2亚家族基因的成对共线性区段(Block pair), 计算Block pair上所有共线性基因对(包括LRR VIII-2及其侧翼共线性同源基因)的Ks中值, 并根据Ks中值估算该染色体区段(Block)所经历的S/WGD事件, 即位于该区段的LRR VIII-2亚家族基因的扩张方式(Guo et al., 2014).对于既不属于串联重复也不属于S/WGD方式产生的旁系同源基因, 则认为通过其它重复方式产生(Hwang et al., 2011). ...

A rat RNA-Seq transcriptomic BodyMap across 11 organs and 4 developmental stages
1
2014

... 利用NCBI基因表达数据库(gene expression omnibus, GEO)获得拟南芥在低温胁迫条件下的数字表达谱(GSE130729) (Jia et al., 2016), 从中提取LRR VIII-2亚家族成员的表达信息.利用TBtools (Chen et al., 2002)绘制热图, 并对每个基因的表达数据进行正态标准化(Yu et al., 2014), 即Z-score标准化(均值为0, 标准差为1). ...

Genome-wide identification, characterization and expression analysis of Populus leucine-rich repeat receptor-like protein kinase genes
2
2013

... 基因重复(gene duplication)及随后的基因功能多样性分化是基因组和遗传系统分化的重要动力, 在生物进化过程中发挥极其重要的作用(Moore and Purugganan, 2003).基因重复可以通过多种方式进行, 包括片段重复(segmental duplication)、全基因组重复(whole-genome duplication)、串联重复(tandem duplication)和转座重复(transpositional duplication) (Freeling, 2009).在众多的植物基因家族中, 对RLKs基因家族的进化历史研究比较深入, 特别是其中的LRR-RLKs (Tang et al., 2010; Fischer et al., 2016).植物基因组中存在大量的LRR-RLKs基因, 已发现在双子叶植物拟南芥、油菜(Brassica rapa)、番茄(Solanum lycopersicum)和杨树(Populus trichocarpa)基因组中分别有235、303、234和379个LRR- RLKs编码基因(Shiu and Bleecker, 2001a; Zan et al., 2013; Rameneni et al., 2015; Wei et al., 2015); 在单子叶植物水稻(Oryza sativa)中有309个, 小麦(Triticum aestivum)中多达531个(Sun and Wang, 2011; Shumayla et al., 2016).在多种植物中开展的生物信息学分析表明, 串联重复和片段或全基因组重复(segmental or whole-genome duplication, S/ WGD)是LRR-RLKs类基因发生扩张的主要机制(Shiu and Bleecker, 2001b, 2003; Sun and Wang, 2011; Zan et al., 2013).在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...

... ; Zan et al., 2013).在拟南芥15个LRR-RLKs亚家族中, LRR VIII-2是通过串联重复造成基因重复比例最高的(Shiu and Bleecker, 2001b, 2003).此外, LRR VIII-2成员中既有典型的具备胞外LRR结构域+跨膜区+胞内激酶催化域的类型, 也包括只有胞内激酶域的类型, 后者可能是LRR-RLKs激酶结构域的祖先型, 在进化过程中通过基因融合将激酶催化域与胞外结构域融合形成现在的LRR-RLKs构象(Shiu and Bleecker, 2001b). ...




备案号: 京ICP备16067583号-21
版权所有 © 2021 《植物学报》编辑部
地址:北京香山南辛村20号 邮编:100093
电话:010-62836135 010-62836131 E-mail:cbb@ibcas.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发

相关话题/基因 植物 结构 序列 鉴定