3月30日,国际学术期刊G3-Genes Genomes Genetics在线发表了中国科学院上海生命科学研究院计算生物学研究所李海鹏研究组的最新研究论文“New software for the fast estimation of population recombination rates (FastEPRR) in the genomic era”。该工作开发了一个快速、准确估计遗传重组率的算法及相关软件包FastEPRR,其遗传重组率估值与目前国际上最为常用的LDhat一样精确,但是比LDhat快了超过30万倍。
遗传重组是在减数分裂过程中发生的一个极为重要的生物学现象,为生命进化提供了丰富的素材。遗传重组率对于连锁不平衡研究,以及全基因组关联分析准确定位致病突变研究等都是极为关键的,因此遗传重组长期以来是生命科学领域的一个研究热点(目前在PubMed上查询到的与遗传重组相关的文献多达27万余篇)。目前一般采用对配子、或者父本-子本进行测序,对遗传重组事件进行直接计数,或者通过群体遗传学的方法建立全基因组的遗传重组图谱。然而由于多数生物的遗传重组率水平极低,所以前者的应用受到了很大局限。而基于群体遗传学理论估计遗传重组率的现有方法极为耗时(Griffiths and Marjoram 1996; Fearnhead and Donnelly 2001),即使在不断优化后也依然如此(Hudson 2001; McVean, et al. 2002)。随着新一代测序技术的不断迅猛发展,数据产生的速度已经远远超出了数据分析的能力,且样本量越来越大,因此提出新的高效算法迫在眉睫!
针对此问题,李海鹏研究组前期已提出了一个新的、基于回归分析的理论方法(Lin et al, 2013, Genetics)。以此为基础,该研究对这一理论方法进行了多方面扩展并实现在FastEPRR软件包中。针对单个DNA片段,当样本量为100个个体时,FastEPRR所需计算时间比牛津大学开发的、目前国际上使用最为普遍的LDhat快30万倍以上(少于2分钟 vs 499天),并且精确度达到了与后者完全一样的水平。在普通个人电脑上(单核)使用FastEPRR在3天之内即可顺利完成千人基因组数据的分析,如果使用多核CPU或者计算机集群,其计算时间会显著降低。而随着样本量的增加,LDhat所需计算时间却接近指数级增加。因此,FastEPRR很可能是目前唯一一个可以顺利处理万人基因组级、甚至十万人基因组级数据的分析工具,可以快捷准确地建立遗传重组图谱。可以预期这一创新性的新方法和软件分析平台将极大地促进相关领域的研究工作。
该研究主要由李海鹏研究组的博士研究生高峰完成,得到了中国科学院、国家自然科学基金委、科技部的经费支持。(计算生物学所)
FastEPRR与LDhat遗传重组率(ρ)估值精确度的比较(上方)
FastEPRR对三个人类群体(YRI, CEU 和CHB) 7号染色体遗传重组率的估值及其遗传重组热点(下方)
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
计算生物学所科研人员开发用于准确快速估算遗传重组率的新算法2016-05-04_上海生命科学研究院
上海生命科学研究院 免费考研网/2018-05-05
相关话题/遗传 计算 生物学 数据 软件
植生生态所科研人员优质蛋白玉米胚乳修饰因子遗传解析研究取得新进展2016-04-19_上海生命科学研究院
4月19日,美国科学院院报PNAS杂志在线发表了中国科学院上海生命科学研究院植物生理生态研究所巫永睿研究组题为“Geneduplicationconfersenhancedexpressionof27-kDaγ-zeinforendospermmodificationinqualityprotein ...上海营养与健康研究所 上海生命科学研究院 免费考研网 2018-05-05生化与细胞所科研人员揭示遗传相关突变对TDP-43蛋白的积聚和包涵体形成的影响2016-04-07_上海生命科学研究院
3月31日,国际学术期刊《ScientificReports》在线发表了中国科学院上海生命科学研究院生物化学与细胞生物学研究所胡红雨研究组的研究论文“TwomutationsG335DandQ343RwithintheamyloidogeniccoreregionofTDP-43influencei ...上海营养与健康研究所 上海生命科学研究院 免费考研网 2018-05-05计算生物学所科研人员揭示哺乳动物基因组中存在环形RNA来源的假基因2016-03-30_上海生命科学研究院
3月29日,学术期刊CellResearch在线发表了中国科学院上海生命科学研究院计算生物学研究所杨力研究组关于环形RNA研究的最新进展。研究组利用建立的新型计算分析流程(CIRCpseudo),首次揭示哺乳动物基因组中蕴含环形RNA来源的假基因,其中小鼠circSATB1来源的假基因序列可以与CT ...上海营养与健康研究所 上海生命科学研究院 免费考研网 2018-05-05生化与细胞所和计算生物学所科研人员合作揭示Polycomb复合物促进转录的新功能2016-03-25_上海生命科学研究院
3月22日,国际学术期刊《细胞研究》(CellResearch)在线发表了中国科学院上海生命科学研究院生物化学与细胞生物学研究所赵允研究组以及中国科学院-马普学会计算生物学伙伴研究所魏刚研究组合作的最新研究成果:“Apositiveroleforpolycombintranscriptionalre ...上海营养与健康研究所 上海生命科学研究院 免费考研网 2018-05-05生化与细胞所和计算生物学所科研人员合作建立小鼠早期胚胎空间转录组图谱2016-03-22_上海生命科学研究院
3月22日,国际知名学术期刊《细胞》子刊《发育细胞》在线发表了中国科学院上海生命科学研究院生物化学与细胞生物学研究所景乃禾研究组与中国科学院-马普学会计算生物学伙伴研究所韩敬东研究组合作的最新研究成果“SpatialTranscriptomefortheMolecularAnnotationofLi ...上海营养与健康研究所 上海生命科学研究院 免费考研网 2018-05-05Cell Metabolism发表计算生物学所科研人员关于节食导致线虫寿命延长的机制研究新成果2016-03-14_上海生命科学研究院
3月8日,国际学术期刊CellMetabolism发表了中国科学院-马普学会计算生物学伙伴研究所韩敬东研究组的论文“ASystemsApproachtoReverseEngineerLifespanExtensionbyDietaryRestriction”。该研究揭示了节食导致线虫寿命延长的分子机 ...上海营养与健康研究所 上海生命科学研究院 免费考研网 2018-05-05植生生态所科研人员发现产溶剂梭菌遗传改造新策略2016-03-09_上海生命科学研究院
2月23日,国际学术期刊MetabolicEngineering在线发表了中国科学院上海生命科学研究院植物生理生态研究所姜卫红研究组题为“Improvingtheperformanceofsolventogenicclostridiabyreinforcingthebiotinsyntheticpa ...上海营养与健康研究所 上海生命科学研究院 免费考研网 2018-05-05计算生物学所科研人员发现正常乳腺组织中癌细胞发育的重要线索2016-03-02_上海生命科学研究院
1月29日,NatureCommunications(《自然—通讯》)发表了中国科学院-马普学会计算生物学伙伴研究所AndrewTeschendorff研究组和英国伦敦大学学院妇科癌症研究中心MartinWidschwendter研究组的合作论文“DNAmethylationoutliersinno ...上海营养与健康研究所 上海生命科学研究院 免费考研网 2018-05-05生化与细胞所科研人员及其合作者发现线粒体苯丙氨酰-tRNA合成酶基因的错义突变引起常染色体隐性遗传痉挛瘫痪2016-03-02_上海生命科学研究院
2015年11月10日,国际学术期刊HumanMutation在线发表了中国科学院上海生命科学研究院生物化学与细胞生物学研究所王恩多研究组与第四军医大学基础医学部DNA分型中心吴元明教授的最新合作研究成果,揭示了编码线粒体苯丙氨酰-tRNA合成酶(mtPheRS)的FARS2基因可能是神经退行性疾病 ...上海营养与健康研究所 上海生命科学研究院 免费考研网 2018-05-05植生生态所科研人员揭示NAC1参与根从头再生的遗传调控途径2016-02-19_上海生命科学研究院
2月5日,《PlantPhysiology》杂志在线发表了中国科学院上海生命科学研究院植物生理生态研究所徐麟研究组题为“Auxin-independentNACpathwayactsinresponsetoexplant-specificwoundingandpromotesroottipemerg ...上海营养与健康研究所 上海生命科学研究院 免费考研网 2018-05-05