核小体排布和染色质开放性是重要的表观遗传学信号,与基因表达调控,胚胎发育,组织分化等众多生理过程间存在紧密联系。目前,ATAC-seq因其对样品要求低,处理简单,可获得多维度染色质状态信息等优势成为表观遗传学的明星技术之一。然而在稀有样本或者单细胞样本中,ATAC-seq数据仍然相对稀疏。现有生物信息学技术在稀疏的ATAC-seq数据中普遍灵敏度不足。因此,研发能适用于低测序深度ATAC-seq文库的高灵敏度核小体排布和染色质开放性检测算法是一个尚未解决的领域内难题。
近日,中国科学院北京基因组研究所(国家生物信息中心)张治华研究组以“DeNOPA: decoding nucleosome positions sensitively with sparse ATAC-seq data”为题在国际生物信息学领域核心期刊Briefings in Bioinformatics上报告了一种基于低测序深度ATAC-seq文库的核小体排布和染色质开放性检测技——deNOPA。不同于现有算法根据测序片段长度,将ATAC-seq文库拆分为分别用于染色质开放性评估和核小体排布检测的子文库的思路,该研究发现,来自不同长度测序片段的Tn5酶切位点,在基因组上分布相似。于是,利用这一相似性,研究人员开发了deNOPA。
该方法创新性的将核小体检测任务的核心问题,由寻找核小体中心转换为寻找核小体连接区域,从而使所有测序片段均在核小体检测任务中得到应用。通过对一系列来自不同物种、不同测序深度ATAC-seq文库,包括单细胞ATAC-seq文库的性能测试。该算法的核小体检测灵敏度相比现有算法大幅度提升,而代价仅是核小体定位准确性的可接受损失。基于该算法给出的核小体位置进行的单细胞分群研究也获得了比现有策略更高的分群精度。
最后,该研究通过对热刺激状态和正常状态K562细胞核小体排布和染色质状态的测定和对比,描述了哺乳动物细胞热刺激反应中染色质状态和核小体排布的变化。不同于酵母,K562细胞热刺激反应中转录起始位点附近核小体缺失区域的位置维持稳定,核小体占位率变化与所在元件活性是否受热刺激影响有关,而与受影响的方向无关。
deNOPA算法的处理流程
论文链接
附件下载:
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
北京基因组所(国家生物信息中心)开发基于低测序深度ATAC-seq数据的核小体排布和染色质开放性检测技术
本站小编 Free考研考试/2022-01-03
相关话题/技术 生物 数据 遗传学 细胞
北京基因组研究所(国家生物信息中心)合作揭示麦类特异转座子重塑小麦环境适应调控网络
转座子(Transposable Elements, TE)是基因组中可移动的DNA元件,20世纪40年代由Barbara McClintock首次报道。小麦族物种的转座子呈现爆发性增长,基因组高达3-16Gb,85%以上由TE组成,而与之亲缘关系密切的二穗短柄草基因组只有272Mb。可以说小麦的基 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)发布癌症单细胞表达图谱数据库CancerSCEM
近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的癌症单细胞表达图谱数据库(CancerSCEM)正式上线。该研究成果以“CancerSCEM: a database of single-cell expression map across various human ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)发布更新版人类长非编码RNA知识库LncRNAWiki 2.0
近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的人类长非编码RNA(long non-coding RNA, lncRNA)知识库LncRNAWiki 2.0正式上线。该研究系统介绍了LncRNAWiki更新版主要内容,并以“LncRNAWiki 2.0: a kn ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)成果入选国家“十三五”科技创新成就
为存好、管好、用好我国生命组学大数据,解决国内重要数据资源流失和生命组学数据孤岛等问题,提高数据共享率和利用率,北京基因组所面向国家重大需求,勇担“国家责”,于2015年10月布局构建中国生命组学大数据体系,建设至今,尤其经过“十三五”期间的长足发展,初步形成具备多组学数据平台、可实现我国生物数据安 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)发布脑疾病知识库BrainBase
近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的脑疾病知识库BrainBase正式上线。该研究成果以“BrainBase: a curated knowledgebase for brain diseases”为题在国际学术期刊Nucleic Acids Resea ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)揭示成体巨核细胞谱系的空间和功能多样性
近日,中国科学院北京基因组研究所(国家生物信息中心)王前飞研究组,首次绘制了小鼠巨核细胞的单细胞转录组图谱,揭示了体内巨核细胞在分子、空间分布及功能上的异质性。在此基础上提出了一种新的巨核细胞分类系统,而免疫巨核群体可能是一个新型造血分支。研究成果以Single-Cell Analysis of P ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)构建多物种转录图谱综合数据库
随着高通量测序技术的不断发展,转录组测序(RNA-seq)已成为系统研究基因转录及转录后水平调控状态的常规方法,并在多个物种中得到广泛应用。海量转录组数据以前所未有的速度产生,以数据驱动为导向的大规模数据整合、挖掘与解析面临巨大挑战。为更充分展现转录组数据蕴含的丰富信息,服务生物医学基础研究领域需求 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03中国开放碳卫星数据-空间生命科学
中国开放碳卫星数据-空间生命科学范唯唯中国科学院科技战略咨询研究院出版日期:2018-01-15发布日期:2018-01-16PDF全文下载地址:http://www.cjss.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=245 ...中科院国家空间科学中心 本站小编 Free考研考试 2022-01-03国家生物信息中心组学原始数据归档库数据汇交量突破10PB
9月28日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)组学原始数据归档库(Genome Sequence Archive,简称GSA)的用户汇交数据量突破10 PB(1 PB=1024 TB)。 为存好、管好、用好我国生命组学大数据,解决国内重要数据 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03北京基因组所(国家生物信息中心)合作构建再生生物学多组学数据库
随着细胞重编程、基因编辑、合成生物学、高通量测序等技术的快速发展,再生生物学进入前所未有的蓬勃发展时期,助力解决组织替代、功能修复、衰老干预、疾病治疗等一系列生命医学领域的重要科学难题。面对科学数据的爆炸式增长,亟需建立以再生生物学为核心的开放数据库,以存储世界范围内的组学研究数据为基础,推动再生相 ...中科院北京基因组研究所 本站小编 Free考研考试 2022-01-03