8月14日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)在国际学术期刊Genomics,Proteomics & Bioinformatics在线发表题为“The Genome Sequence Archive Family: Toward Explosive Data Growth and Diverse Data Types”的文章,GSA数据库体系接受全世界科研工作者的数据提交,汇交和管理各种类型的数据,并对所有公开可用数据提供免费开放访问,支撑生命科学研究。
组学原始数据归档库(GSA)是生命组学原始测序数据管理的公益性数据库,旨在推动全球生命组学数据的共享与应用。近年来,随着组学数据的爆炸性增长和数据类型的多样化,以及人类遗传资源数据管理的特殊需求,CNCB-NGDC对GSA数据库进行了更新和扩展,形成了GSA数据库体系,包括GSA,GSA-Human和OMIX。
GSA数据库与2017发布的版本相比,在数据模型、系统功能和数据提交方式等方面进行了更新和功能提升;GSA-Human是存储人类遗传资源数据的数据库,可实现人类遗传资源数据的受控访问,保障人类遗传资源数据的安全性;OMIX数据库存储非原始测序数据,如环境组、表型组、代谢组等,它作为上述两种数据资源库的重要补充,有效地解决了用户提交除原始测序数据外的其它类型数据的需求。
截至2021年8月14日,GSA和GSA-Human已收集的数据量达到9.5 PB,OMIX上线不久数据量已达到1.6 TB。GSA数据库体系已为全球111个国家/地区的用户提供数据服务,平均每天的数据下载量达到4 TB,已成为Elsevier、Wiley、 Taylor & Francis 、Cell及 Springer Nature出版集团指定的核酸数据归档库,获得领域内所有国内外主流期刊的认可。
北京基因组所(国家生物信息中心)国家基因组科学数据中心的陈婷婷、陈旭、张思思、朱军伟工程师为该文共同第一作者,王彦青高级工程师、章张研究员、赵文明正高级工程师为该文共同通讯作者。
本研究得到了国家重点研发计划、中科院战略先导专项、中国科学院信息化专项等项目的支持,GSA归档数据使用的计算机硬件设施得到国家财政部修缮购置专项的长期支持。
GSA Family数据模型
论文链接
附件下载:
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
北京基因组研究所(国家生物信息中心)原始数据管理体系(GSA Family)研发取得新进展
本站小编 Free考研考试/2022-01-03
相关话题/数据 数据库 资源 遗传 人类
GSA数据库获得国际出版社Springer Nature认可
8月4日,国际著名出版社Springer Nature在其官网中将北京基因组所(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)开发并运行的组学数据归档库,即GSA和GSA-Human,列为其推荐使用的数据存储和共享系统,Springer Nature旗下的3000多个期刊都将认可GS ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)国家基因组科学数据中心的多个数据库被Cell期刊推荐使用
近日,国际著名学术期刊Cell在其数据递交指南中将北京基因组所(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)的多个数据库列为其生命组学数据存储的推荐数据库,包括组学原始数据归档库(Genome Sequence Archive,GSA)、人类遗传资源组学原始数据归档库(Genome ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组研究所(国家生物信息中心)基因组数据库取得进展
北京基因组所(国家生物信息中心)针对我国基因组数据“存管用”的实际需求,几年来,共建立了55个数据库,涉及衰老、疾病、调控和生物多样性等多个前沿领域,初步形成了我国生物数据安全汇交管理和多组学数据平台的国家中心数据资源体系。基因组序列和注释是基因组相关研究的重要资源,中国作为世界上生物多样性最丰富的 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组研究所(国家生物信息中心)建立人类长非编码RNA表达数据库
近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的人类长非编码RNA(long non-coding RNA, lncRNA)表达数据库LncExpDB正式上线。该研究成果以“LncExpDB: an expression database of human long ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)数据资源建设取得阶段性进展
11月11日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)在国际学术期刊《核酸研究》(Nucleic Acids Research)在线发表题为“Database Resources of the National Genomics Data Cente ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组研究所(国家生物信息中心)发布基因组序列变异数据库2.0版
基因组序列变异是基因组DNA上发生的可遗传变异,是物种群体遗传进化、表型差异人类疾病研究、动植物分子育种等最为宝贵的遗传数据资源。近年来,随着测序技术的发展,越来越多物种的基因组被精细解析,来自不同物种不同群体的全基因组序列变异数据呈爆发式增长。 为实现不同生物遗传资源变异组学科学数据的开放共享与 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03基于MODIS数据的卫星辐射特性研究
基于MODIS数据的卫星辐射特性研究PDF全文下载地址:/static/publish/AE/49/A8/54320E4AA8BF3BC5E07D47C0F7/1009-cbo_1.pdf ...中科院工程热物理研究所 本站小编 Free考研考试 2022-01-03基于遗传算法的SOBER-SJ10池沸腾传热研究
基于遗传算法的SOBER-SJ10池沸腾传热研究PDF全文下载地址:/static/publish/AD/B0/6F/F2E1144839BABFF06F575D08D3/1784-lpg_1.pdf ...中科院工程热物理研究所 本站小编 Free考研考试 2022-01-03基于主导因素法的燃气轮机机理数据混合建模
基于主导因素法的燃气轮机机理数据混合建模PDF全文下载地址:/static/publish/F3/DD/A1/39C95E44A89885E4B6F17AA54C/2787-zyz.pdf ...中科院工程热物理研究所 本站小编 Free考研考试 2022-01-03基于遗传算法的板翅式换热器优化策略
基于遗传算法的板翅式换热器优化策略PDF全文下载地址:/static/publish/BD/F3/56/5715CF4AECBADDCF65C7AC6745/2919-zsi_1.pdf ...中科院工程热物理研究所 本站小编 Free考研考试 2022-01-03