近日,北京大学生命科学学院生物信息中心(CBI)、北京大学生物医学前沿创新中心(BIOPIC)与北京未来基因诊断高精尖创新中心(ICG)高歌研究员课题组,基于异构多组学数据,建立了人类RNA转录本编码能力(coding ability)跨细胞定量模型。相关论文已于近日以题为“Quantitative model suggests both intrinsic and contextual features contribute to the transcript coding ability determination in cells”在线发表于Briefings in Bioinformatics杂志。
基因的转录在生物学中心法则中起到了承上启下的作用,细胞通过转录-翻译过程多水平调控以应对环境压力和疾病。特别的,近年来研究显示,在传统编码蛋白的mRNA以外,部分RNA转录本(transcript)可以以非编码RNA形式发挥其生物学功能。综合运用生物信息学与计算基因组学手段,对转录本编码能力进行量化建模分析,不仅有助于深入理解转录-翻译这一基本的分子生物学信息传递过程,也可为精准解码细胞调控图谱提供重要的数据与方法学基础。
研究团队收集了发表于公共数据库来自22个不同细胞类型的人类Ribo-seq/RNA-seq配对数据并进行系统挖掘分析,对数据中101,170条转录本的翻译状态进行了严格判定。其中,46%的转录本为编码,43%为非编码。值得注意的是,他们发现11%的转录本,在不同细胞中呈现不同的翻译状态,即在部分细胞中编码,而在另一部分细胞中非编码。研究团队将其命名为“环境依赖编码转录本”(context-dependent coding transcripts,CDCTs)。
在此基础上,作者应用数据驱动的特征选择算法,综合运用序列内生(intrinsic,cis-)和细胞环境(contextual,trans-)特征,建立了人类RNA转录本编码能力跨细胞定量模型RiboCalc,实现了对人类转录本在多种细胞环境下的编码能力(即Ribo-seq表达量Ribo-TPM)的高精度预测(r=0.81)。进一步模型分析显示,转录本的序列和所在细胞环境都对编码能力的决定起到了重要作用。值得注意的是,自2014年以来即有若干工作报道一些传统被注释的非编码RNA可以在特定条件下结合核糖体甚至产生肽段(如图1),RiboCalc模型分析显示,这些RNA转录本与不结合核糖体的RNA转录本相比编码能力分数显著高,进一步提示转录本的编码能力不应被简化为单纯的编码/非编码二分分类,而是一个依赖于环境的连续定量指标。
图一:RiboCalc工作流程与分析结果:A. RiboCalc模型构建流程 B. RiboCalc测试结果比较 C. RiboCalc各类特征的重要性
作为首个针对高等哺乳动物开发的转录本编码能力定量预测模型,RiboCalc在人类中实现了跨组织、细胞类型的转录本编码能力量化建模与预测。目前,相关算法与教程已发布于https://github.com/gao-lab/RiboCalc/供相关领域海内外研究人员使用,相关问题可邮件联系ribocalc@mail.cbi.pku.edu.cn。
北京大学生命科学学院博士后亢雨笺为该论文的第一作者,高歌为通讯作者,北京大学李静一、柯岚、降帅、杨德昌和侯玫在模型测试和数据分析上提供了大力支持。本研究工作得到了北京未来基因诊断高精尖中心ICG、蛋白质与植物基因研究国家重点实验室与国家重点研发计划“精准医学专项”的大力支持,计算分析工作于北京大学高性能计算校级公共平台和北京大学太平洋高性能计算平台完成。
参考文献:
1.Ruiz-Orera J, Messeguer X, Subirana JA et al. Long non-coding RNAs as a source of new peptides, Elife 2014;3:e03523.
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
生命科学学院高歌课题组提出人类RNA转录本编码能力定量预测模型
本站小编 Free考研考试/2021-12-20
相关话题/细胞 北京大学 环境 数据 人类
北京大学第一医院金红芳教授团队发现血管细胞间通讯的新机制
RedoxBiol:金红芳团队发现血管细胞间通讯的新机制近日,北京大学第一医院儿科金红芳团队在国际生物学领域顶刊RedoxBiology(IF:11.79)上发表了题为"Compensatoryroleofendogenoussulfurdioxideinnitricoxidedeficiency- ...北京大学通知公告 本站小编 Free考研考试 2021-12-20林杰课题组揭示基因表达随细胞体积增大呈现非线性变化的机制
为了保证正常的生理活动,细胞需要保持蛋白质和其他功能分子浓度保持在一个较为恒定的水平。对于大部分蛋白质和mRNA,在细胞的生长过程中,它们的数量与细胞体积呈线性关系,因此它们的浓度基本保持恒定。然而,总存在一些基因产物表现出非恒定的浓度,也就是说它们的数量与细胞体积呈现超线性(superlinear ...北京大学通知公告 本站小编 Free考研考试 2021-12-20生命科学学院魏文胜课题组与合作者首次揭示基因组“无用”序列稳定染色质三维结构及细胞稳态机制
人类基因组中的非编码序列在多种生物学过程中发挥着至关重要的作用,如非编码RNA、启动子、增强子和转座子等。作为在基因组中占比约98%的非编码区域,仍有大量是功能未知的,这些曾被认为是基因组中“垃圾”的区域,已被逐渐证实存在重要功能。基因组的三维结构会影响基因的转录调控或其他细胞生命活动,然而,除了研 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20白凡课题组揭示细菌细胞通过液-液相分离形成无膜细胞器提升耐药性
液-液相分离(Liquid-liquidphaseseparation,LLPS)是细胞内很多重要生命过程的关键驱动机制。在真核细胞中,LLPS能让各种相关的生物分子富集,帮助细胞形成各种无膜结构,如P颗粒(P-granules)、核仁(nucleoli)、异染色质(heterochromatin) ...北京大学通知公告 本站小编 Free考研考试 2021-12-20汪旸团队和任仙文团队合作发现皮肤T细胞淋巴瘤大细胞转化的分子机制以及新型治疗靶点
2021年9月28日,北京大学第一医院皮肤科汪旸教授团队与北京大学生物医学前沿创新中心任仙文研究员合作在Blood在线发表了题为“PEG10amplificationat7q21.3potentiateslarge-celltransformationincutaneousT-celllymphom ...北京大学通知公告 本站小编 Free考研考试 2021-12-20汤富酬和李铁军课题组合作开发基于分子网络特征整合单细胞数据的新方法
随着单细胞测序技术的快速发展,多个全球性的、大规模的细胞图谱项目相继启动,例如人类细胞图谱计划等。然而,把来自于不同组织、不同发育阶段或者只有很少重叠细胞类型的单细胞转录组数据集进行准确有效的整合仍然具有非常大的挑战性。因为当前整合单细胞数据的方法需要校正批次效应从而达到整合分析的目的,而上述所涉及 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20生命科学学院胡家志研究组阐述V(D)J重排中RAG细胞周期性调控的分子机理
脊椎动物的B淋巴细胞和T淋巴细胞在发育过程中会通过V(D)J重排产生多样化的细胞表面受体来识别外来抗原,参与机体的适应性免疫过程。这些在基因组上串联分布的V、D、J片段两端带有重组信号序列(Recombinationsignalsequences,RSSs),可以被淋巴细胞中特异表达的重排酶RAG复 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20生命学院李磊课题组发布植物microRNA数据库新版本
2021年9月23日,北京大学生命科学学院李磊研究员课题组与合作者在NucleicAcidsResearch在线发表了题为“PmiREN2.0:fromdataannotationtofunctionalexplorationofplantmicroRNAs”的研究论文。该论文介绍了植物microR ...北京大学通知公告 本站小编 Free考研考试 2021-12-20BIOPIC白凡课题组与合作者揭示EB病毒阳性胃癌肿瘤细胞与EB病毒共进化特征
胃癌全球范围内致死率排名第三,患者通常只有不到40%的五年生存率。其中约10%的胃癌与EB病毒(EBV)相关。相比于EBV阴性胃癌,EBV阳性胃癌(EBVassociatedgastriccarcinomas,EBVaGCs)具有独特的分子特征,包括PIK3CA高频突变、CDKN2A表达缺失、高甲基 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20城市与环境学院朱丹研究团队发文揭示狩猎采集人口密度如何受生态环境约束
作为一个物种,人类如何养活自身并繁衍至今?从狩猎采集这个最简单的生计方式切入,或许可以洞察百万年来人类与自然环境之间最底层的关系。狩猎采集是人类历史上存在时间最久的生业模式。虽然在约一万年前农业起源之后,世界上多数地区,尤其是亚洲和欧洲的狩猎采集社会逐渐被农业社会取代,但很多狩猎采集族群持续到了近现 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20