第一联系人:
Online:2018-04-20
作者简介 About authors
艾云灿教授。
PDF (460KB)元数据多维度评价相关文章导出EndNote|Ris|Bibtex收藏本文
本文引用格式
孟繁梅, 艾汉南, 艾云灿. 人类基因组中心粒测序、组装及评价的关键技术. 遗传[J], 2018, 40(4): 339-340 doi:
人类基因组是测序和组装的质量标杆,但是迄今未能完成(以Ns占位)组装泛中心粒(中心粒及其邻近异染色质区域,centromeric & pericentromeric heterochromatin regions)。泛中心粒由大尺度重复序列构成。长期难以组装大尺度重复序列,是基因组学及生物信息学领域的关键技术挑战之一。
图1
新窗口打开|下载原图ZIP|生成PPT图1基于可视化展示提取人类Y染色体泛中心粒大尺度重复序列
A:X坐标值随着基因组长度变化而出现的大直线;B:在X和Y二维平面上出现的大直线。GRCh38p1.chrY和GRCh37p13.chrY分别是最新版及前一版的人类染色体Y基因组序列。reass.GRCh38p1.chrY是定位删除大直线所对应的序列之后的版本。
Fig. 1Visualization-guided extraction of large-scale centromeric and pericentromeric repeats of the human chromosome Y
图2
新窗口打开|下载原图ZIP|生成PPT图2追踪溯源分析人类Y染色体泛中心粒模拟大尺度重复序列
A:单体(红色)及同源物(黑色)序列的系统发育树;B:复体(红色)及同源物(黑色)序列的系统发育树;C:将B虚线圈中心放大。m为序列个数。
Fig. 2Tracking-back analysis of the modeled large-scale centromeric and pericentromeric repeats of the human chromosome Y
最近,本实验室又比较了人类Y染色体中心粒的真实序列(~301 kb, MF741337.1)与模型序列(~227 kb, GJ212193.1),结果显示两者之间存在明显差异,大量单体的局部序列的方向相反(图3,未发表)。图3仅展示了比对整齐的核心部分(~227 kb)。上述的研究工作受到天河二号超级计算机及国家超级计算专项项目(No. U1501501-201603534)资助。
图3
新窗口打开|下载原图ZIP|生成PPT图3比较人类Y染色体中心粒的真实序列与模型 序列
Fig. 3Comparison between the native and modeled centromere sequences of the human chromosome Y
综上所述,从图论模拟法建立模型序列,到利用无偏见数据挖掘分析法追踪溯源和反向评价大尺度重复序列的组成及其来源和质量,再到纳米孔测序法跨越长读数测定完整的真实序列,标志着中心粒大尺度重复序列的测序和组装在技术层面上取得了关键性突破。这必将有力推动完成更多的大型哺乳动物基因组(通常缺乏物理和遗传图谱)泛中心粒区域的测序、组装及下游分析。