真核生物中的反向剪接可以将外显子序列反向首尾连接形成环形RNA。基于发现定位于反向剪接位点的高通量测序读序,杨力研究组在2014年建立了高效的环形RNA计算分析新流程(CIRCexplorer, version 1),并通过合作系统揭示了环形RNA在体内的广泛存在、揭示了互补序列介导的环形RNA产生基础及其调控的普遍性规律(Zhang et al., Cell 2014)。开发的环形RNA计算分析流程CIRCexplorer被认为是在当时已有的环形RNA计算分析流程中预测效率和准确性最适的工具包(Hansen et al., Nucleic Acids Res 2016)。2016年,杨力研究组报道了升级版的CIRCexplorer2开源工具包,通过比较对应环形RNA和线性RNA的表达,全面阐述了环形RNA可变反向剪接(alternative back-splicing)和可变剪接(alternative splicing)的复杂性和多样性,并建立了环形RNA数据库网站http://www.picb.ac.cn/rnomics/circpedia(Zhang et al., Genome Res 2016;Dong et al., Genomics Proteomics Bioinformatics 2018)。但是,除了反向剪接位点以外,环形RNA与其对应的线形RNA在一级序列上完全重复,因此从转录组测序数据中系统发现环形RNA和线形RNA的策略不同。包括CIRCexplorer (version 1 and 2)在内,现有方法对环形RNA的全转录组检测和定量主要依赖对跨反向剪接位点读序的分析获得FPM(fragments per million mapped fragments);而对线形RNA的定量分析则依赖覆盖外显子和跨外显子的读序以获得FPKM(fragments per kilobase of transcript per million mapped fragments)。FPM和FPKM定量标准的不一致导致它们无法直接用来比较环形RNA及其对应线形RNA的表达。
在这项最新的研究中,杨力研究组开发了3.0版本的CIRCexplorer分析新流程用于环形RNA与线形RNA直接定量比较(https://github.com/YangLab/CLEAR),根据可被用于环形RNA与线形RNA直接定量比较的这一特性,这个新流程也被命名为CLEAR(circular and linear RNA expression analysis from ribosomal-RNA depleted RNA-seq)。在该最新的CLEAR流程中,研究人员定义并使用新的定量参数FPB(fragments per billion mapped bases)计算环形RNA与线性RNA的表达水平,主要通过计算跨反向剪接位点的读序获得环形RNA的表达(FPBcirc),同时计算跨正常剪接位点的读序获得线形RNA的表达(FPBlinear)。进一步,通过直接比较环形RNA及其对应线形RNA的FPB值获得CIRCscore(FPBcirc vs FPBlinear),用来表征环形RNA相对于线形RNA的表达水平。相对于原有的FPM,新建立的FPB不受读序长度与测序策略的影响,因此可以对来源于不同读序长度、测序策略和测序深度的样本进行比较;同时,新建立的CIRCscore能进一步去除线形RNA的表达背景对环形RNA进行相对定量,因此基于FPB和CIRCscore的定量分析将有更广的适应性和更高的鲁棒性。利用CIRCexplorer3-CLEAR,研究人员可筛选获得相对于线形RNA高表达的环形RNA,并开展后续环形RNA功能及作用机制等研究。
杨力研究组长期从事核酸水平的组学及相关前沿新技术研究。在环形RNA研究领域,近期通过合作系统揭示了反向剪接环形RNA在生成加工、代谢降解、二级结构和生理功能等水平的调控及机制(Zhang et al., Cell 2014; Zhang et al., Cell Rep 2016; Zhang et al., Genome Res 2016; Dong et al., RNA Biol 2017; Li et al., Mol Cell 2017; Liu et al., Cell 2019)。该项研究成果在杨力研究员指导下完成,受到了中国科学院、国家自然科学基金委和Howard Hughes Medical Institute International Program的基金的支持。杨力研究组2014级硕博连读研究生马旭凯为第一作者,研究获得了生化细胞所陈玲玲研究员及其研究组、康涅狄格大学Gordon G. Carmichael教授的大力支持。(科技处)
论文网址:https://doi.org/10.1016/j.gpb.2019.11.004
图1: CIRCexplorer3-CLEAR分析新流程用于环形RNA与线形RNA直接定量比较