近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的癌症单细胞表达图谱数据库(CancerSCEM)正式上线。该研究成果以“CancerSCEM: a database of single-cell expression map across various human cancers”为题在国际学术期刊Nucleic Acid Research 在线发表。
单细胞分辨率的全转录组测序技术(scRNA-seq)具有研究细胞异质性的显著优势,已成为研究肿瘤微环境、癌症发病机制、转移与侵袭以及各类癌症治疗与诊断不可或缺的手段。截至2021年11月,PubMed已有超过1300个癌症相关的单细胞转录组学研究,极大提升了我们对人类癌症发生发展的理解,推动了癌症临床诊断与治疗的进程。大规模癌症scRNA-seq数据在过去十年中呈现爆炸式增长,迫切需要对这些数据进行规范化整合与处理,对各类癌症的肿瘤微环境进行深入挖掘与比较分析。为应对这一需求,国家基因组科学数据中心研究团队开发了CancerSCEM数据库。
CancerSCEM 1.0版本整合分析了208个癌症scRNA-seq数据集,涵盖肺腺癌(LUAD)、结肠直肠癌(CRC)、恶性胶质瘤(GBM)等在内的20种人类癌症类型。通过标准化分析流程处理,获得了精确的细胞类型注释信息。在此基础上,团队还开展了一系列附加分析,包括不同细胞类型间基因差异表达分析(可为新型标志物筛选提供参考)、细胞表面受体-配体基因对表达谱、样本内细胞互作网络构建等,可为用户提供更加丰富的肿瘤微环境相关信息,并开展了基于TCGA表达数据与临床信息的生存分析。
数据库为用户提供浏览、多重检索、在线分析及下载等服务功能,用户可采用首页的快速检索、词云及精确检索等途径查询感兴趣的癌症单细胞数据集或样本。如点击词云里的基因名“HLA-A”或通过搜索框输入,均可触发数据库查询功能,并实时获得目标基因的详细信息及其在单细胞层面与细胞群体(组织)层面的表达分布信息。为方便临床相关用户的使用,团队共审编获得36个常用免疫检查点分子(如PDCD1、CTLA4、LAG3、HMGB1等)并提供专门的搜索列表,以帮助各类癌症的临床免疫治疗研究寻找更优的治疗靶点。
数据库还配备了一个交互式综合在线分析平台,共集成2个分析模块与7个分析功能。通过基因分析模块,用户可开展四个方面的实时分析及可视化展示:1)样本内目标基因的整体表达概况;2)样本内基因在不同细胞类型间的表达比较;3)基因表达相关性计算及筛选;4)208样本中单细胞或bulk层面的基因表达比较。通过样本分析模块,用户可进行1)样本间细胞组成比较;2)样本内细胞互作网络构建以及3)基于TCGA的生存分析。该分析平台将为用户开展个性化的癌症scRNA-seq数据挖掘提供友好的增值服务。
中国科学院北京基因组研究所(国家生物信息中心)助理研究员曾瀞瑶、特别研究助理张亚东及硕士研究生尚云飞为本工作共同第一作者,肖景发研究员为通讯作者。本工作得到中科院战略性先导科技专项、国家自然科学基金、国家重点研发计划等项目资助。
CancerSCEM数据库在线分析平台的7个分析功能展示
文章链接
附件下载:
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
北京基因组所(国家生物信息中心)发布癌症单细胞表达图谱数据库CancerSCEM
本站小编 Free考研考试/2022-01-03
相关话题/细胞 基因 数据库 数据 临床
北京基因组所(国家生物信息中心)成果入选国家“十三五”科技创新成就
为存好、管好、用好我国生命组学大数据,解决国内重要数据资源流失和生命组学数据孤岛等问题,提高数据共享率和利用率,北京基因组所面向国家重大需求,勇担“国家责”,于2015年10月布局构建中国生命组学大数据体系,建设至今,尤其经过“十三五”期间的长足发展,初步形成具备多组学数据平台、可实现我国生物数据安 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)发布脑疾病知识库BrainBase
近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的脑疾病知识库BrainBase正式上线。该研究成果以“BrainBase: a curated knowledgebase for brain diseases”为题在国际学术期刊Nucleic Acids Resea ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)揭示成体巨核细胞谱系的空间和功能多样性
近日,中国科学院北京基因组研究所(国家生物信息中心)王前飞研究组,首次绘制了小鼠巨核细胞的单细胞转录组图谱,揭示了体内巨核细胞在分子、空间分布及功能上的异质性。在此基础上提出了一种新的巨核细胞分类系统,而免疫巨核群体可能是一个新型造血分支。研究成果以Single-Cell Analysis of P ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)构建多物种转录图谱综合数据库
随着高通量测序技术的不断发展,转录组测序(RNA-seq)已成为系统研究基因转录及转录后水平调控状态的常规方法,并在多个物种中得到广泛应用。海量转录组数据以前所未有的速度产生,以数据驱动为导向的大规模数据整合、挖掘与解析面临巨大挑战。为更充分展现转录组数据蕴含的丰富信息,服务生物医学基础研究领域需求 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03中国开放碳卫星数据-空间生命科学
中国开放碳卫星数据-空间生命科学范唯唯中国科学院科技战略咨询研究院出版日期:2018-01-15发布日期:2018-01-16PDF全文下载地址:http://www.cjss.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=245 ...中科院国家空间科学中心 本站小编 Free考研考试 2022-01-03国家生物信息中心组学原始数据归档库数据汇交量突破10PB
9月28日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)组学原始数据归档库(Genome Sequence Archive,简称GSA)的用户汇交数据量突破10 PB(1 PB=1024 TB)。 为存好、管好、用好我国生命组学大数据,解决国内重要数据 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)合作构建再生生物学多组学数据库
随着细胞重编程、基因编辑、合成生物学、高通量测序等技术的快速发展,再生生物学进入前所未有的蓬勃发展时期,助力解决组织替代、功能修复、衰老干预、疾病治疗等一系列生命医学领域的重要科学难题。面对科学数据的爆炸式增长,亟需建立以再生生物学为核心的开放数据库,以存储世界范围内的组学研究数据为基础,推动再生相 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03GSA数据库获得国际出版社Springer Nature认可
8月4日,国际著名出版社Springer Nature在其官网中将北京基因组所(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)开发并运行的组学数据归档库,即GSA和GSA-Human,列为其推荐使用的数据存储和共享系统,Springer Nature旗下的3000多个期刊都将认可GS ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组研究所(国家生物信息中心)原始数据管理体系(GSA Family)研发取得新进展
8月14日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)在国际学术期刊Genomics,Proteomics & Bioinformatics在线发表题为“The Genome Sequence Archive Family: Toward Explos ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)开发在单细胞中识别染色质类TAD结构的算法
基因组DNA和组蛋白以特定的形式高度折叠在细胞核中,这一高级结构即三维基因组学,对细胞核内的诸多生命活动至关重要。基于染色质构象捕获(3C),尤其是高通量技术(Hi-C,ChIA-PET)的发展极大推动了三维基因组的研究,发现了包括染色质拓扑相关结构域(TAD),染色质环等一系列层次化的结构特征。近 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03