Progress in circular RNAs of plants
Jia Luo, Xingli Wang, Zhichao Sun, Di Wu, Wei Zhang, Zhengjia Wang
编委: 赵方庆
Jia Luo, Xingli Wang, Zhichao Sun, Di Wu, Wei Zhang, Zhengjia Wang.
非编码RNA (non-coding RNA)是一类直接发挥催化和调控功能的转录本,包含miRNA (microRNA)、lncRNA (long non-coding RNA)和circRNA (circular RNA)等,占真核细胞总RNA的95%以上[1],在生物体许多生理生化过程中发挥了重要作用[1,2,3]。miRNA是一类长度约为21 nt的非编码RNA,主要通过引导效应蛋白AGO (Argonaute)抑止编码mRNA的表达[4]。研究表明,circRNA能够特异性结合miRNA,使其失去调控mRNA的功能[5]。在哺乳动物中,一个miRNA通常含有1~2个特异性结合位点,当miRNA表达量占主导地位时,circRNA具有的miRNA海绵功能不再有效[6, 7]。
不同于线性RNA,circRNA具有高度保守性以及不易被降解的特性[8],在生物体内行使miRNA海绵、调控可变剪切、长距离传递信号等功能[9]。根据组成来源,circRNA分为外显子circRNA、基因间circRNA和内含子circRNA。circRNA主要形成方式有4种:(1)反向可变剪切(back-splicing)环化[10,11,12];(2)内含子驱动反向互补序列形成环化[13, 14];(3)来自单个基因内不同内含子序列配对环化[13];(4)受到RNA结合蛋白调控的外显子环化[10, 15]。circRNA作为内源性非编码RNA 在真核生物的生长发育过程中发挥着重要作用[12, 16~20],引起人们广泛的关注。
植物circRNA的研究还处于起步阶段,转录组测序以及生物信息学分析证实circRNA在植物中同样具有高保守性,但动植物间circRNA发生机制及功能的差异性尚不明确。随着研究的不断深入,已陆续证明植物circRNA能通过内源性竞争、干扰可变剪切、结合蛋白等方式,在植物生长发育、生物与非生物胁迫等生物过程中发挥了重要作用[18, 19, 21]。本文综述了近年来植物circRNA形成机制、鉴定方法、数据库、表达模式等研究进展,概括了植物circRNA结构特征和调控潜能,为其在植物发育过程中的功能研究提供参考。
1 植物circRNA鉴定
20世纪70年代,Sanger等[22]在植物病毒中发现了闭合的circRNA分子,并在真核细胞中验证了circRNA的存在,当时circRNA被认为是剪切错误的产物[23,24,25]。随着高通量测序和基因组分析技术的发展,Salzman等[17]首次指出circRNA由mRNA前体可变剪切而来,是一类3°与5°共价闭合且广泛大量存在于真核生物体内的RNA,参与转录后调控过程[16, 26]。Jack等[26]在人类成纤维细胞中检测出25 000多个可区分的RNA,其中外显子circRNA约占总量的14.4%。Memczak等[16]通过重新计算多个动物数据库中RNA测序数据,共鉴定出 1950个人类(Homo sapiens) circRNA、1903个小鼠(Mus musculus) circRNA和724个线虫(Caenorhabditis elegans) circRNA。Guo等[27]通过优化算法对去poly(A)的RNA测序数据进行分析,新注释了7112个人类circRNA和635个小鼠circRNA,并关联得到一个具有miRNA海绵功能的circ-ZNF91。Wang等[28]通过鉴定真菌、原生生物和模式植物的circRNA,证实circRNA是一个古老且保守、具有调控功能的细胞转录产物。
自2014年拟南芥(Arabidopsis thaliana)根部首次发现circRNA后[28],7个物种的circRNA被陆续鉴定(表1)。Ye等[21]重新计算已公开的转录组数据,补充报道了水稻(Oryza sativa)和拟南芥中有12037和6012个circRNA。2015年,Lu等[19]在水稻中鉴定出2354个circRNA,其中外显子circRNA为1356个,包含微型反向重复转座元件(miniature inverted repeat transposable elements, MITEs)的circRNA为 92个[21]。Liu等[29]对不同生长阶段的拟南芥叶片进行转录组测序,验证发现circRNA除保守的序列信息外,还具有时空表达特异性。circRNA在番茄(Solanum lycopersicum)冷害逆境响应、小麦(Triticum aestivum)干旱逆境响应、猕猴桃(Pseudomonas syringae)对溃疡病菌响应以及植物类病毒感染荔枝(Litchi chinensis)的过程中均起到重要的调控作用[30,31,32,33]。同时,叶绿体和线粒体基因组的可变剪切也可以得到circRNA[21, 34, 35],说明circRNA参与包括光合作用和呼吸作用在内的多个重要生命过程的调控。
Table 1
表1 7种植物circRNA鉴定信息
Table 1
物种 | 测序组织 | 数据来源 | circRNA数量(外显子circRNA数量) |
拟南芥(Arabidopsis thaliana) | 叶片[21] | 数据库编号PRJNA218215 | 6012 (5152) |
叶片[29] | 数据库编号GSE43616 | 168 (158) | |
水稻(Oryza sativa) | 水稻根部[21] | 数据库编号PRJNA215013 | 12037 (6074) |
幼穗和成熟叶片[36] | 栽培稻自测 | 2354 (1356) | |
根部[37] | 水培稻自测 | 3011 (1846) | |
小麦(Triticum aestivum) | 幼苗叶片[30] | 干旱逆境处理自测 | 88 (6) |
大麦(Hordeum vulgare) | 叶片和未成熟的种子[34] | 铁锌溶液喷施叶面处理自测 | 62 (5) |
番茄(Solanum lycopersicum) | 果皮[32] | 冷胁迫处理自测 | 854 (615) |
猕猴桃(Pseudomonas syringae) | 幼叶[33] | 病菌胁迫处理自测 | 3582 (2293) |
大豆(Glycine max) | 根茎叶[38] | 温室种植自测 | 5372 (2494) |
目前,公开发表的circRNA预测软件有10余种(表2),其中包含植物特异的circRNA预测软件PcircRNA_finder[39]。基于不同算法,可将软件分为两种:一是针对内含子驱动模式下的反向可变剪切接头序列(back-spliced junction)设计的预测软件,如find_circ[40]、CIRCexplorer[13]、CIRI[41, 42]和apSplice[43]等;二是通过基因组注释信息推测得到反向可变剪切接头序列,然后与注释的外显子序列进行匹配,预测得到新circRNA的软件,如KNIFE[44, 45]、NCLscan[46]等。根据预测软件的准确度、敏感度等方面来评估性能[47, 48],在对相同样本数据进行分析时,CIRCexplorer和KNIFE的准确度和敏感度都在较高水平;find_circ具有高准确度,而MapSplice具有较高的检测敏感度;PcircRNA_finder在植物circRNA的鉴定中更具优势[39]。虽然一些程序支持无参组装测序结果并进行独立注释信息,但是完善的基因组注释能够进一步提高剪切接头检测的灵敏度、扩大剪切信号的检测范围以及降低错误率。不同的软件在计算成本上也有不同的要求,因此 综合两种或多种不同软件预测的结果将有效提高circRNA鉴定的效率。
Table 2
表2 7种circRNA预测方法
Table 2
软件名称 | 编写语言 | 比对方法 | 比对程序 | 敏感度 | 准确度 | 计算速度 | 备注 |
CIRCexplorer | Python | 有参 | TopHat/STAR | 高 | 高 | 慢 | 基因注释需求 |
CIRI | Perl | 无参 | BWA-MEM | 高 | 低 | 慢 | 高RAM需求 |
find_circ | Python | 无参 | Bowtie2 | 低 | 低 | 快 | 低RAM需求 |
circRNA_finder | Perl | 无参 | STAR | 低 | 低 | 快 | 双端测序验证 |
Mapsplice | Python | 有参 | Bowtie1 | 高 | 高 | 慢 | 基因注释要求 |
KNIFE | Python& Perl | 有参 | Bowtie 1& 2 | 高 | 高 | 慢 | 外显子注释要求 |
PcircRNA_finder | Perl | 有参 | Tophat-Fusion | 高 | 高 | 慢 | 植物特异 |
Table 3
表3 常见circRNA数据库
Table 3
数据库 | circRNA数量 | 样本来源 | 数据来源 | 网址 | 信息说明 | 文献 |
circBase | 199 161 | 动物组织样本 | 文献及其他数据库 | http://circbase.org/ | 包含所有的circRNA转录本注释信息,预测其剪接形式,并且提供剪切位点间序列的比对信息。提供Blast比对工具及fasta格式数据下载功能 | [49] |
Circ2Traits | 1951 | 人类疾病组织样本 | 文献及其他数据库 | http://gyanxet-beta.com/circdb/ | 包含计算circRNA与疾病相关的miRNA互作的可能性,构建miRNA与蛋白质、长链非编码RNA和circRNA之间的互作网络及富集分析,circRNA与疾病相关SNP互作位点分析 | [50] |
CircNet | 282 948 | 动物组织样本 | 数据库 | http://circnet.mbc.nctu.edu.tw/ | 包含新鉴定的circRNA、整合miRNA靶基因网络,circRNA可变剪切体的表达谱、基因组注释以及序列信息 | [51] |
CSCD | 1 121 871 | 肿瘤组织样本 | 228个肿瘤组织细胞系RNA测序数据 | http://gb.whu.edu.cn/CSCD | 包含每一个circRNA的miRNA应答元件位点、RNA蛋白结合位点、开放阅读框(ORF)以及每一个circRNA的线性转录本的剪接事件的预测信息 | [52] |
circRNADb | 32 914 | 人类组织样本 | 重新整合多个数据库 | http://reprod.njmu.edu.cn/circrnadb | 包含人类外显子circRNA外显子剪接事件、基因组序列、内部核糖体进入位点(IRES)、开放阅读框信息及证据支撑的参考文献 | [53] |
PlantcircBase | 77 595 | 水稻、拟南芥、玉米、番茄和 大麦 | 生物信息学预测或实验验证 | http://ibi.zju.edu.cn/plantcircbase/ | 包含circRNA的miRNA海绵功能信息,circRNA-miRNA-mRNA互作网络图,基于基因组位置对circRNA结构的可视化以及提供circRNA的序列查询工具 | [54] |
PlantCircNet | 139 276 | 拟南芥、水稻及其他8种植物 | 数据库 | http://bis.zju.edu.cn/plantcircnet/index.php | 包含互作网络图的可视化工具,过表达miRNA靶基因的GO富集工具,以及circRNA基因组注释、序列、剪切体的信息 | [55] |
AtCircDB | 84 685 | 拟南芥 | 622个拟南芥RNA测序数据 | http://genome.sdau.edu.cn/circRNA | 包含拟南芥全面的组织特异性circRNA数据,提供检索、可视化以及下载拟南芥circRNA数据 | [56] |
2 植物circRNA特征
2.1 植物circRNA序列组成和结构
研究发现,circRNA的生物合成通常受到顺式作用元件和反式作用因子的调控,环化外显子的侧翼内含子序列ALU重复片段和反向互补序列能够大大提高其环化的效率[13, 26, 57]。但是,与动物相比,植物中大多数外显子circRNA侧翼序列并不包含大量的重复序列和反向互补序列[19, 21, 35]。这表明在植物中“内含子驱动环化”模式并不是形成circRNA的主要机制。此外,超过33%的植物circRNA在上下游序列中包含两个及多个不同的接头序列,可能弥补了序列缺失从而提高其环化效率[35]。植物circRNA具有大量亚型,许多亚型来源于同一个基因的可变剪切,且偏好于多个外显子形成的环化[19, 21]。目前,已在水稻中鉴定得到约2806个circRNA全长序列,其中只有206个circRNA的侧翼包含经典的GT/AG剪切信号[21],这表明植物中的circRNA可能并不是依赖经典的circRNA剪切信号序列驱动环化。
另外,当外显子相邻内含子序列较长时,一 般不具备线性剪切能力[10, 26]。例如,水稻和拟南 芥的circRNA都比线性亚型具有更长的侧翼内含 子[19, 21, 40],这可能是由于更长的内含子序列可以捕捉到更多短的反向互补序列从而提升环化效率,而侧翼序列中包含较长的内含子序列,可能通过提高相邻外显子之间的空间距离,阻止线性剪切的发生。
2.2 植物circRNA来源和保守性
通常来说,植物circRNA的表达丰度较低,通过细胞类型特异性以及组织特异性表达来发挥其调控功能[19, 21, 32, 35, 58]。除了核基因组序列能够产生植物circRNA,叶绿体和线粒体基因组序列也能够产生植物circRNA[21, 34, 35],说明circRNA也可能参与调控光合作用和呼吸作用过程。同时,circRNA通过与miRNA互作、结合蛋白和干扰剪切过程等方式来调节基因的表达,从而有效地提升了植物转录调控过程的多样性和复杂性[59]。植物circRNA的组成可以分别来源于外显子、内含子或由其两者共同组成[60],且植物外显子和内含子circRNA的功能表达与组织特异性紧密联系[51]。通过不同的剪切模式,同一个基因座可以转录出circRNA或者线性mRNA,circRNA的表达与其亲本基因表达存在显著相关性。例如猕猴桃中AC_ciRNA_04842正调控Achn372061的表达[33]。此外,在水稻中过表达Os08circ16564可以较大程度抑制其亲本基因的表达,显示circRNA能够负调控其来源基因[19],但调控机制还需深入研究。Ye等[21]在拟南芥和水稻中发现700多个直系同源基因,其中300多个circRNA均来自于基因组相同位点,说明在不同的植物中circRNA高度保守。但是,在这些保守的circRNA侧翼内含子中并没有发现相似的序列或者共享相同的基序,说明在植物中circRNA的生物合成可能还存在其他机制[21]。
3 植物circRNA功能
3.1 具有miRNA海绵特征
由于circRNA缺少poly(A)尾巴和5′端,不受核糖核酸酶(RNase)的降解,在脱帽和降解过程中一般会与miRNA结合[61],参与转录后调控[21, 62]。Hansen等[62]认为植物中的circRNA作为miRNA海绵在植物生长发育过程中具有调控功能,成为circRNA早期功能研究的重点。circRNA在发挥海绵功能时,需要多个miRNA结合位点或在细胞质中高水平表达[6, 7]。通过紫外 交联免疫沉淀结合高通量测序技术(crosslinking- immunprecipitation and high-throughput sequencing,HITS-CLIP),研究人员发现人类中circCDR1as能够结合miR-7和miRNA效应蛋白AGO2,并且具有70多个保守的miR-7结合位点[21, 62];circSry包含16个miR-138的结合位点,能够调控靶mRNA来减弱circSry的过表达[63]。与动物不同,植物中只有少数的circRNA拥有miRNA结合位点(拟南芥5%,水稻6.6%)[16, 19, 21, 35]。Lu等[19]发现水稻中过表达的Os08circ16564可能与OsmiR172互作,降低其亲本基因的表达水平,但不影响OsmiR172本身的表达,这说明该circRNA分子在体内并没有作为miR172海绵。另外,circRNA的二级结构可能包含潜在的miRNA结合位点,从而降低预测的准确度。
3.2 circRNA表达模式
植物体内circRNA广泛存在,在生长发育过程中具有重要作用。如circRNA通过激素信号转导、卟啉和叶绿素代谢等途径参与叶片衰老、花发育、果实成熟的调控[29, 38, 58, 64]。同时,circRNA在应对不同的环境胁迫时会出现差异表达现象。如在水稻磷饥饿处理时,27个外显子circRNA差异表达[25];小麦在干旱胁迫情况下,发现了62个差异表达的circRNA[30];在番茄响应冷胁迫过程中,检测到163个circRNA差异表达[32];同时,大麦(Hordeum vulgare)用微量元素铁锌处理以及拟南芥在不同的光强度下,也发现了不同程度差异表达的circRNA[21, 34]。在病原体侵入以及植物类病毒感染的生物胁迫过程中,circRNA同样通过特异性表达实现不同的生物响应[31, 33],表明circRNA是植物体应对环境压力过程中重要的功能调控者。由于circRNA的闭环结构没有5°端和3°端,不容易被RNA外切酶降解[63],在应对生物与非生物胁迫时circRNA具有较长的响应周期,可能在植物长距离传递信号中发挥一定功能。已有研究表明,植物类病毒能够利用circRNA基序直接在细胞与细胞间进行长距离运输[65,66,67],这些分子能够结合不同的功能蛋白,通过木质部和韧皮部来传递细胞与细胞间信息的信号。但是,植物内源性circRNA相关机制与功能研究尚未见报道。
3.3 circRNA与蛋白互作
除了具有miRNA海绵功能外,circRNA通过识别、储存、运输不同蛋白,并将其携带到特定的亚细胞位置,通过调控靶mRNA或核糖体生成的方式发挥其功能[68, 69]。如ciR-7/CDR1as能够通过AGO2蛋白实现竞争性结合miR-7[62];circ-PABPN1竞争性结合HuR,抑制后者与PABPN1的mRNA结合,降低PABPN1翻译效率[70];circANRIL与PES1富含赖氨酸结构域的碳端相结合,竞争抑制PES1与核糖体结合,调控核糖体生成过程[71]。同时,circRNA能够通过蛋白互作,参与包括细胞衰老、细胞周期、泛素化等多种生命过程。如circ-FOXO3通过与不同的因子互作参与衰老过程,促进MDM2介导p53蛋白泛素化降解过程[72, 73]。FOXO3蛋白可微弱地结合circ-FOXO3,抑制FOXO3与MDM2的结合,促进FOXO3的富集[74]。circ-Amotl1通过诱导c-Myc进入细胞核内从而促进肿瘤的发生,能够与Myb、NF1、Akt、E2F1、E2F4、EGF等多种蛋白相互作 用[75, 76]。但是,由于circRNA与线性RNA在结构上存在明显差异,通过传统的RNA结合蛋白实验验证难以实现[77]。目前circRNA与蛋白互作分析的验证方法主要基于免疫沉淀分析,包括蛋白质体外结合实验(RNA pull-down)、RNA结合蛋白免疫沉淀(RNA binding protein immunoprecipitation)等技术,荧光原位杂交技术和RNase保护分析的方法能够更为准确获得互作circRNA的序列。合理利用功能数据库(表4)预测分析结果,并结合实验验证,能够填补植物中circRNA与蛋白互作研究的空缺。Table 4
表4 circRNA功能预测的在线工具
Table 4
数据库 | 类别 | 网址 | 说明 | 文献 |
Circinteractome | 核糖核蛋白复合物预测分析 | http://circinteractome.nia.nih.gov | 提供人类circRNA上的RNA结合蛋白和miRNA结合位点信息,检测引物设计工具,设计用于circRNA沉默的siRNA,以及鉴定circRNA上潜在的内部核糖体切入位点 | [78] |
circlncRNAnet | lncRNAs-circRNAs互作与共表达预测分析 | http://app.cgu.edu.tw/ circlnc/ | 提供灵活的框架及多个分析模块,可接受和处理用户定义的NGS表达数据,得到表达谱、共表达网络和通路以及分子相互作用信息 | [79] |
deepBase | 非编码RNA与蛋白的互作预测分析 | http://biocenter.sysu. edu.cn/deepBase/ | 提供19个物种不同的非编码RNA进化、表达和功能分化信息,预测蛋白质-lncRNA-circRNA互作网路 | [80] |
SomamiR 2.0 | miRNA-lncRNA-circRNA互作预测分析 | http://compbio.uthsc.edu/SomamiR | 提供体细胞突变对miRNA和lncRNA及circRNA互作的影响的分析,集成数据库miR2GO工具,及定位miRNA靶位点分析 | [81] |
CIRCpedia | 可变剪切位点预测 | http://www.picb.ac.cn/rnomics/circpedia/ | 提供人、小鼠、果蝇及蠕虫样本不同细胞系中circRNAs中可变剪切注释信息,提供可变反向剪切circRNA的鉴定工具 | [82] |
3.4 circRNA翻译
circRNA并非是一类真正的非编码RNA,其中一部分具有可编码性[83, 84]。在真核生物中,经典的mRNA翻译依赖于40s核糖体亚基与5′端帽子结合发生翻译过程[85]。由于circRNA分子的闭合结构无法与核糖体亚基结合[63],因此circRNA可能依赖于其他翻译蛋白的途径。如Mounir等[86]在水稻中发现了一种具有内部核糖体结合位点(IRES)的circRNA结构类病毒,当IRES元件插入到起始密码子AUG的上游时,能够启动翻译过程[87];Yang等[88]在人类细胞中证实circRNA能够通过N6-甲基腺苷(m6A)途径翻译蛋白;Zhou等[89]发现eIF4G2参与m6A修饰调控的circRNA翻译过程,证明m6A修饰对circRNA的翻译具有直接影响。m6A是真核生物体内RNA腺嘌呤碱基非常重要的甲基化修饰,参与RNA剪接、翻译等多个过程,在体内主要通过YTH结构域家族蛋白识别来调节RNA二级结构的稳定性以及调控RNA与蛋白的互作[90]。目前,对拟南芥中m6A修饰已有了初步认识,其修饰位点通常位于mRNA的起始和终止密码子附近[91, 92],但是尚未见其他植物circRNA中m6A修饰的相关研究报道。4 结语与展望
近年来,circRNA的生物合成、分子调控等功能陆续被报道,多个蛋白分别参与调控RNA的剪接作用。例如,FUS蛋白介导circRNA的形成[93];作为CRISPR家族Cas-9的同源蛋白Csy4,共表达后促进环化效率[94];Fei等[95]使用CRISPR技术筛选前列腺癌相关基因,聚类分析得到HNRNPL拼接因 子,并通过RIP-seq实验验证了该因子参与调控RNA可变剪切和circRNA形成过程。这些研究不仅说明circRNA在各个生命周期过程中具有极大的调控潜能,同时又受到其他分子的相互制约,提示circRNA的发生以及调控机制的复杂性,值得进一步研究。目前,仍存在着大量未知领域,如circRNA如何实现miRNA海绵作用,如何更有效地使用生物信息学工具预测circRNA,circRNA在特殊组织和病变中如何表达调控等。高通量测序与生物信息学分析显示circRNA广泛表达于不同的植物中,且表达具有时空组织特异性。对circRNA特异性表达进行深入分析,不仅能够丰富已有植物生长发育关键途径的调控网络,而且能够作为植物病害提前发现的重要线索。同时,植物circRNA表达与来源基因的相关性分析也为科研人员提供了新的研究思路。合理利用综合数据库及生物信息学工具,将进一步推进circRNA的功能研究,通过开发植物特异circRNA分析软件及植 物综合数据库能够提高预测分析的准确度。综上 所述,circRNA的研究虽然已取得了一定的研究进展,但是对于植物circRNA的认识仍是一个漫长的过程。
Kin selection theory predicts that, where kin discrimination is possible, animals should typically act more favorably toward closer genetic relatives and direct aggression toward less closely related individuals. Contrary to this prediction, we present data from an 18-y study of wild banded mongooses, Mungos mungo, showing that females that are more closely related to dominant individuals are specifically targeted for forcible eviction from the group, often suffering severe injury, and sometimes death, as a result. This pattern cannot be explained by inbreeding avoidance or as a response to more intense local competition among kin. Instead, we use game theory to show that such negative kin discrimination can be explained by selection for unrelated targets to invest more effort in resisting eviction. Consistent with our model, negative kin discrimination is restricted to eviction attempts of older females capable of resistance; dominants exhibit no kin discrimination when attempting to evict younger females, nor do they discriminate between more closely or less closely related young when carrying out infanticidal attacks on vulnerable infants who cannot defend themselves. We suggest that in contexts where recipients of selfish acts are capable of resistance, the usual prediction of positive kin discrimination can be reversed. Kin selection theory, as an explanation for social behavior, can benefit from much greater exploration of sequential social interactions.