2018年、2019年连续两年,组学数据库权威杂志《核酸研究》对前一年的全球基因组数据库建设进行总结,鲜见地在美英两个老牌的数据库以外,提到了中国的GSA(组学原始数据归档库)。
“美国国立生物技术信息中心(National Center for Biotechnology Information,简称NCBI)和英国欧洲生物信息学中心(European Bioinformatics Institute,简称EBI)30多年前已经开始建立,我们的GSA是2015年底才上线运营的。”国家基因组科学数据中心主任鲍一明介绍,中心的组学数据库之所以能够得到权威杂志的认可“点名”,一方面是由于数据量增长快,另一方面是数据的可用性、标准化方面的工作均与国际接轨。
据了解,针对我国基因组学数据“存管用”的实际需求,解决数据孤岛等重大问题,科技部、财政部共同支持组建国家基因组科学数据中心,依托中国科学院北京基因组研究所,联合中国科学院上海营养与健康研究所和中国科学院生物物理研究所共同建设。中心的科学数据专业化团队,对外提供基因组学数据统一存储、整合挖掘、共享应用的一站式数据服务。
顺应大健康需求,构筑自主数据基础
“之前,中国已成为基因组数据产出大国,但未能形成国家级公共数据资源。”鲍一明介绍,面向国家大数据战略发展需求,国家基因组科学数据中心围绕人、动物、植物、微生物基因组数据,重点开展了数据资源及数据库体系建设,并开展了数据服务、系统运维、技术研发、数据挖掘等系列工作。目前,国家基因组科学数据中心已拥有自主知识产权的基因组数据汇交、管理与共享系统,保障数据安全性,支撑并服务于国家重点研发计划、国家自然科学基金、中科院先导专项等300余个科研项目的数据存储、管理和共享。
在生命科学研究领域,研究者获得的基因组学数据,均需上传到专业数据库,方可在杂志上发表。如今,我国已拥有获得认可的组学数据库,这将大大提高中国高水平论文被接收过程的便捷性。“中国的****不需要再将数据‘飘洋过海’传输到海外,可以获得更加专业化的中国式服务。我们的平台已被多家国际顶级杂志认可,中国****将数据提交到GSA系统,其发表的论文已经被多个国际知名期刊所收录,这包括CNS(《细胞》《自然》《科学》简称)、美国科学院院刊等。”鲍一明说,这为“用好科技资源、支撑创新发展”提供了基础。
截至2019年8月,国家基因组科学数据中心已为国内外150多个单位提供免费数据存储服务,累计用户递交项目信息超过1200个,用户提交的测序数据量超过1.2PB,收集并存储的数据总量超过4PB,数据上传下载量日均达到1TB。
与国际接轨,不做信息孤岛
生物信息的数据要海量整合后才会有价值,割裂的数据库只完成了“存”却难以走向“使用”。例如对人类组学数据的整合和挖掘将更全面地获得人类健康问题的解决方案,避免“盲人摸象”。
这正是国家基因组科学数据中心成立的初衷和建设的方向。在科学数据共享方面,科技部长期致力于打破条块分割,对相关部门和行业长期持续积累的数据资源,以及对国家科技计划项目的数据进行整理、汇交和建库,同时提高与国际科学数据组织的信息交换能力。
2019年,我国国家基因组科学数据中心组学数据库被国际著名出版商Elsevier收录为指定基因数据归档库,其权威性得到国内外100余家学术杂志的认可。国家基因组科学数据中心已经成为有国际影响力的基因组科学数据中心。
目前,国家科技基础条件平台中心正在组织国家科学数据中心编制五年建设运行实施方案。未来,国家基因组科学数据中心将继续围绕基因组科学研究前沿及数据的存管用需求,逐步完善中心组织管理架构与运行机制,强化队伍建设,培养复合型数据人才;建立数据共享、质量控制、安全管理等标准与规范,利用云计算、人工智能、机器学习等先进技术,提升数据储存、管理、挖掘与共享能力;发展数据加密、解密、分级管理、受控访问等数据安全关键技术,建立人类遗传资源数据管理体系,确保国家重要生物资源数据本地化存储、管理与共享利用。
鲍一明表示,希望经过5年努力,建成汇聚海量科学数据、服务万家机构、引领大数据技术创新的国际一流基因组科学数据中心,切实解决我国基因组数据存管用难、数据流失严重、核心基因组科学信息资源先“出口”再“进口”的问题,不断提升我国在基因组学大数据领域的国际话语权。
(原载于《科技日报》 2019-11-19 04版)
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
【科技日报】国家基因组科学数据中心:整合中国组学资源,在国际舞台奏出“共享乐章”
本站小编 Free考研/2020-06-02
相关话题/数据 科学
国家基因组科学数据中心发布数据资源整合挖掘体系
近日,国家基因组科学数据中心在国际学术期刊《核酸研究》(Nucleic Acids Research)在线发表题为“Database Resources of the National Genomics Data Center in 2020”的文章,以整体形式介绍基因组数据资源整合与挖掘体系建设方 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所国家基因组科学数据中心开发表观组关联分析数据库
近日,由中国科学院北京基因组研究所国家基因组科学数据中心(以下简称国家中心)开发的人类表观组关联分析数据库EWAS Data Hub正式上线。该项研究成果以“EWAS Data Hub: a resource of DNA methylation array data and metadata”为题 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所举办第四届国际生命与健康大数据论坛
10月13日至16日,第四届国际生命与健康大数据论坛(The 4th Big Data Forum for Life and Health Sciences)在中国科学院北京基因组研究所成功召开。本次论坛依托中国科学院“国际健康大数据共享计划”,由北京基因组所国家基因组科学数据中心和中国遗传学会联合 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02国家基因组科学数据中心建设运行实施方案通过专家论证
8月30日,中国科学院办公厅在国家基因组科学数据中心(以下简称中心)依托单位中国科学院北京基因组研究所召开专家论证会,论证2020-2025年中心建设运行实施方案。国家科技基础条件平台中心徐波、中科院办公厅副主任王树志、中科院办公厅网信处郑晓欢等出席论证会。专家组由国内生命科学领域的9位知名专家组成 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02“国家基因组科学数据中心”落户北京基因组所
6月5日,科技部、财政部联合发布了《关于国家科技资源共享服务平台优化调整名单的通知》,公布了不同学科领域的20个国家科学数据中心。其中,“国家基因组科学数据中心”(以下简称国家中心)依托中国科学院北京基因组研究所建设,共建单位包括中国科学院上海生命科学研究院和中国科学院生物物理研究所。 国家中心是 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所举办中泰灵长类生物多样性与健康大数据研讨会
4月22日至23日,中泰灵长类生物多样性与健康大数据研讨会在中国科学院北京基因组研究所召开。来自泰国朱拉隆功大学国家灵长类研究中心、泰国科技发展署、泰国农业大学的8名泰方代表和来自中科院动物所、微生物所、神经科学所、中国疾病预防控制中心、四川大学、广西医科大学、安徽大学等单位的10多名专家****参 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02中科院基因组科学与信息重点实验室召开2018年度学术年会
1月18日,中国科学院基因组科学与信息重点实验室召开2018年度学术委员会年会暨学术研讨会。实验室学术委员会成员、院前沿科学与教育局娄治平研究员、基因组研究所党委副书记赵坚,实验室全体研究组长、科研人员及研究生等100余人参加了会议。会议由重点实验室主任胡松年研究员主持。 赵坚致开幕辞,对参加学术 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所生命与健康大数据中心召开2018年度工作会议
12月27日至28日,中国科学院北京基因组研究所生命与健康大数据中心(简称大数据中心)召开2018年度工作会议,总结大数据中心2018年主要工作进展,研究明确2019年工作思路和重点任务。 本次会议特邀中科院上海生命科学研究院赵国屏院士、中科院生物物理所陈润生院士、北京大学罗静初教授、基因组所于军 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所开发完成植物RNA编辑体数据库PED
近日,中国科学院北京基因组研究所生命与健康大数据中心开发了国际上首个植物RNA编辑体数据库—PED(Plant Editosome Database)。该库基于人工审编整合多种植物RNA编辑因子和大量RNA编辑事件等信息。研究成果以“Plant editosome database: a curat ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02北京基因组所生命与健康大数据中心开发系列特色科学数据库
近日,中国科学院北京基因组研究所生命与健康大数据中心(BIG Data Center,BIGD)有七篇数据库文章在国际学术期刊核酸研究Nucleic Acids Research(NAR)杂志在线发表,并将于该刊2019年1月出版的数据库专刊中集中刊发。包括表观组关联分析知识库EWAS Atlas、 ...中科院北京基因组研究所 本站小编 Free考研 2020-06-02