DNA甲基化是发生在DNA上的共价修饰,作为一种重要的表观遗传类型,DNA甲基化受多种疾病及风险因子的影响,与疾病的发生和发展有潜在的因果关系,并有望作为疾病诊断的一种新型生物分子标记物。但是,由于实验成本和条件的限制,大量的DNA甲基检测一般只在混合了多种细胞类型的复杂组织中进行,得到的是多个不同细胞类型DNA甲基化变化的平均值,难以用来统计不同细胞类型中DNA甲基化的功效及其生物学解释。因此,领域内迫切需要开发一种高效的计算生物学研究方法,能够在单细胞层面解析复杂组织中的差异DNA甲基化组。
近期,中国科学院上海营养与健康研究所Andrew Teschendorff研究员指导的研究团队开发了一种名为“EPISCORE”的新型算法,用以从单细胞RNA-Seq中分析获得给定组织类型中的各种细胞类型,并从中发现蕴含与疾病发生相关DNA甲基化变化的特定细胞类型。EPISCORE算法利用了组织特异性单细胞RNA-Seq图谱数据(比如Human Cell Atlas Consortium)的强大功能和高分辨率特性,基于细胞类型特异性标记物的DNA甲基化差异特性,有效地将组织特异性mRNA表达图谱转化为单细胞分辨率的组织特异性DNA甲基化图谱。利用EPISCORE算法对肺癌数据开展研究,成功揭示了肺癌内皮细胞中的DNA甲基化表观遗传改变,提示表皮细胞向间充质细胞的转化过程是癌细胞入侵和转移的基础。
由于大多数公开的DNA甲基化数据源自于混合了多种细胞类型的复杂组织样本,因此无法发挥其作为疾病诊断分子标志物的潜力。EPISCORE的开发则使得科研人员能够重新分析这些公开发表的表观遗传数据集,在精确获得复杂组织样本中不同细胞类型比例的基础上,进一步在单细胞水平鉴定细胞特异性的DNA甲基化变化,对阐明表观遗传变化在疾病发生和发展中的因果作用具有重要意义。此外,EPISCORE算法低成本的特点使它成为单细胞甲基化组学分析的有效替代方法。而且,区别于单细胞甲基化组学分析,EPISCORE算法可应用于任意组织类型的EWAS(表观基因组关联分析)研究。
中国科学院上海营养与健康研究所Andrew Teschendorff研究员为该论文的通讯作者,Andrew Teschendorff研究员和博士研究生朱天余为该研究的共同第一作者。该研究得到了中国科学院和国家自然科学基金委项目资助,项目批准号分别为31571359,31771464和31970632。(科技处)
图. EPISCORE算法流程图
原文链接:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02126-9