近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的人类长非编码RNA(long non-coding RNA, lncRNA)知识库LncRNAWiki 2.0正式上线。该研究系统介绍了LncRNAWiki更新版主要内容,并以“LncRNAWiki 2.0: a knowledgebase of human long non-coding RNAs with enhanced curation model and database system”为题在国际学术期刊Nucleic Acids Research 在线发表。
LncRNA通过复杂多样的分子机制发挥重要功能,在多个生物学过程发挥重要作用,与人类疾病的发生发展密切相关。LncRNAWiki是一个基于MediaWiki框架开发的人类lncRNA群体审编知识库,最初注释了86个文献报道的lncRNA。此后,研究团队每年持续增加新的功能性lncRNA并丰富lncRNA注释。截至2020年,LncRNAWiki已包含2,056个功能性lncRNA的注释信息,为了解lncRNA的功能和研究进展提供了重要的资源平台。
为方便数据结构化管理及统计查询,LncRNAWiki 2.0大幅提升了系统框架,并建立了标准化审编模型。具体来说,2.0版主要基于MySQL/Java构建,结构化展示功能性lncRNA的10类注释信息,实时统计多种关键内容的研究进展,支持注册用户根据审编模型在线提交/编辑/更新lncRNA相关知识,并基于审编知识和生信分析结果预测lncRNA功能。在群体审编方面,提供了包含分子特征、临床关联、靶基因、调控因子、实验样本、生物学功能、CRISPR实验、文献等10类内容的系统性审编模型,支持结构化审编注释。为确保审编质量,增加了专业审核环节,且任何用户均可报告lncRNA页面上的注释错误。
目前,LncRNAWiki 2.0共包含2,512个lncRNA的106,242条知识关联信息,这些关联知识主要来自于对16个专业数据库信息的标准化整合审编。基于全面丰富的注释,在统计页面为研究人员提供实时的lncRNA功能图谱,例如根据现有注释可知70%以上的lncRNA研究集中在疾病方面,在肝癌、白血病、结直肠癌中的研究较多;MALAT1、HOTAIR、H19等被报道较多,具有丰富的功能注释信息;lncRNA的定位研究主要集中在外泌体、细胞核中;帕比司他、顺铂和多西紫杉醇三种药物与lncRNA的关联研究较多。所有相关知识在Browse页面均可一键免费下载。
LncRNAWiki 2.0数据库具备友好的网页界面,方便数据管理,包括数据提交、编辑、审核、错误报告,以及浏览、搜索、下载和统计,提供了多种在线工具,用于lncRNA ID转换、序列比对和功能预测,助力发掘新的lncRNA功能,有望成为lncRNA功能注释和研究的重要资源平台。
北京基因组所(国家生物信息中心)特别研究助理刘琳,博士研究生李昭和硕士研究生刘畅为本文共同第一作者,马利娜副研究员与章张研究员为共同通讯作者。该研究得到了中科院战略性先导科技专项、国家重点研发计划、中科院青促会等项目资助。
LncRNAWiki 2.0知识审编流程与主要内容
文章链接
附件下载:
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
北京基因组所(国家生物信息中心)发布更新版人类长非编码RNA知识库LncRNAWiki 2.0
本站小编 Free考研考试/2022-01-03
相关话题/信息 知识 统计 人类 系统
北京基因组所(国家生物信息中心)发布癌症单细胞表达图谱数据库CancerSCEM
近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的癌症单细胞表达图谱数据库(CancerSCEM)正式上线。该研究成果以“CancerSCEM: a database of single-cell expression map across various human ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03人类首次探测到双中子星并合事件产生的引力波-太阳系探测
人类首次探测到双中子星并合事件产生的引力波-太阳系探测王海名中国科学院科技战略咨询研究院出版日期:2018-01-15发布日期:2018-01-16PDF全文下载地址:http://www.cjss.ac.cn/CN/article/downloadArticleFile.do?attachType ...中科院国家空间科学中心 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)成果入选国家“十三五”科技创新成就
为存好、管好、用好我国生命组学大数据,解决国内重要数据资源流失和生命组学数据孤岛等问题,提高数据共享率和利用率,北京基因组所面向国家重大需求,勇担“国家责”,于2015年10月布局构建中国生命组学大数据体系,建设至今,尤其经过“十三五”期间的长足发展,初步形成具备多组学数据平台、可实现我国生物数据安 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)发布脑疾病知识库BrainBase
近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的脑疾病知识库BrainBase正式上线。该研究成果以“BrainBase: a curated knowledgebase for brain diseases”为题在国际学术期刊Nucleic Acids Resea ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)揭示成体巨核细胞谱系的空间和功能多样性
近日,中国科学院北京基因组研究所(国家生物信息中心)王前飞研究组,首次绘制了小鼠巨核细胞的单细胞转录组图谱,揭示了体内巨核细胞在分子、空间分布及功能上的异质性。在此基础上提出了一种新的巨核细胞分类系统,而免疫巨核群体可能是一个新型造血分支。研究成果以Single-Cell Analysis of P ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)构建多物种转录图谱综合数据库
随着高通量测序技术的不断发展,转录组测序(RNA-seq)已成为系统研究基因转录及转录后水平调控状态的常规方法,并在多个物种中得到广泛应用。海量转录组数据以前所未有的速度产生,以数据驱动为导向的大规模数据整合、挖掘与解析面临巨大挑战。为更充分展现转录组数据蕴含的丰富信息,服务生物医学基础研究领域需求 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03国家生物信息中心组学原始数据归档库数据汇交量突破10PB
9月28日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)组学原始数据归档库(Genome Sequence Archive,简称GSA)的用户汇交数据量突破10 PB(1 PB=1024 TB)。 为存好、管好、用好我国生命组学大数据,解决国内重要数据 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)合作构建再生生物学多组学数据库
随着细胞重编程、基因编辑、合成生物学、高通量测序等技术的快速发展,再生生物学进入前所未有的蓬勃发展时期,助力解决组织替代、功能修复、衰老干预、疾病治疗等一系列生命医学领域的重要科学难题。面对科学数据的爆炸式增长,亟需建立以再生生物学为核心的开放数据库,以存储世界范围内的组学研究数据为基础,推动再生相 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组研究所(国家生物信息中心)原始数据管理体系(GSA Family)研发取得新进展
8月14日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)在国际学术期刊Genomics,Proteomics & Bioinformatics在线发表题为“The Genome Sequence Archive Family: Toward Explos ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03中国发布《2017-2045年航天运输系统发展路线图》
中国发布《2017-2045年航天运输系统发展路线图》范唯唯中国科学院科技战略咨询研究院出版日期:2018-01-15发布日期:2018-01-16PDF全文下载地址:http://www.cjss.ac.cn/CN/article/downloadArticleFile.do?attachType ...中科院国家空间科学中心 本站小编 Free考研考试 2022-01-03