中科院北京基因组所陈华研究组与昆明动物所合作,首次开发了能够同时分析多个物种的群体基因组数据的方法HDMKPRF。该方法以Hartl、Bustamante等的泊松随机场模型和McDonald-Kreitman检验为框架,通过多个物种的联合等位基因频谱理论构建群体遗传学模型,有效整合了微进化过程与宏观进化。与现有分析方法比较,该方法采用贝叶斯方法,很大程度提高了对自然选择基因的检测功效;通过多个物种的群体基因组比较分析,能够有效把自然选择发生时间定位在多物种进化树的具体某个阶段(分支)上。该方法还提供了对各个物种的群体大小、物种分化时间以及自然选择强度等参数的后验概率分布。
利用该方法,研究人员对现代人、黑猩猩、大猩猩和猩猩四个灵长类物种基因组数据做了分析,在各个物种中鉴定了受到自然选择而快速进化的基因。发现在人的特异性进化中,有84个与表达调控相关的基因受到正选择,广泛分布在锌指蛋白基因家族、小RNA调节通路、TP调控、组蛋白修饰基因等不同类型中,印证了进化学家Allan Wilson和Mary-Claire King在1975年提出的观点,即基因调控是人与黑猩猩在99%基因组序列相似基础上表型高度差异的主要因素之一;发现与免疫、代谢等相关的通路受到了正选择。此外,有大量的现代人与其他大猿分歧的基因富集在精神分裂症、神经系统疾病相关的通路上,部分快速进化基因集中在精子生成、生殖相关通路上。该分析提供了灵长类四类大猿基因进化在时间轴和基因组上的自然选择图谱,为后续的进一步功能解析研究提供了基础。
该研究于3月6日在线发表在进化生物学期刊《分子生物学与进化》上。研究得到了国家自然科学基金委重大研究计划“微进化过程的多基因作用机制”、中科院院先导专项“动物复杂性状的进化解析与调控”等项目支持。
![](http://www.big.cas.cn/xwzx/kyjz/201903/W020190325615033682518.png)
HDMKPRF方法的模型和和参数示意图
![](http://www.big.cas.cn/xwzx/kyjz/201903/W020190325615033743157.png)
应用电脑仿真对HDMKPRF在检测功效、对分歧时间、选择强度等参数推断上进行性能检验
论文链接