1(大连理工大学软件学院 辽宁大连 116620); 2(辽宁省泛在网络与服务软件重点实验室(大连理工大学) 辽宁大连 116620) (wangjie1003@163.com)
出版日期:
2018-07-01基金资助:
国家自然科学基金项目(61572094);中央高校基本科研业务费专项资金(DUT14QY07)CUDA-TP: A GPU-Based Parallel Algorithm for Top-Down Intact Protein Identification
Duan Qiong1, Tian Bo1, Chen Zheng1, Wang Jie1,2, He Zengyou1,21(School of Software, Dalian University of Technology, Dalian, Liaoning 116620); 2(Key Laboratory for Ubiquitous Network and Service Software of Liaoning Province (Dalian University of Technology), Dalian, Liaoning 116620)
Online:
2018-07-01摘要/Abstract
摘要: 蛋白质及蛋白质翻译后修饰(post-translational modifications, PTMs)的鉴定是蛋白质组学研究的基础,对整个领域的进一步发展有着十分重要的意义.近年来,质谱设备的快速发展使得获取“自顶向下”(top-down,TD)的高精度完整蛋白质质谱数据成为可能.目前基于TD质谱数据的完整蛋白质鉴定算法虽然在匹配精度、PTM位点的推断上取得了一些成效,但它们运行时间还有很大的不足和提升空间.利用图形处理器(graphics processing unit, GPU)可以将大规模的重复计算并行化,提高串行程序的执行速度.CUDA-TP算法基于通用并行计算架构(compute unified device architecture, CUDA)来计算蛋白质与TD质谱数据的匹配分数.首先,对每一个质谱数据,CUDA-TP利用优化的MS-Filter算法在蛋白质数据库中过滤出其对应的少数候选蛋白质集合,然后通过AVL(adelson-velskii and landis)树加速质谱匹配过程.GPU中的多线程技术被用来并行化谱图网格及最终数组中所有元素的前驱结点的求解.同时,该算法还使用target-decoy策略来控制蛋白质与质谱图匹配结果的错误发现率(false discovery rate, FDR).实验结果表明:CUDA-TP算法能够有效地加速完整蛋白质的鉴定,速度分别比MS-TopDown和MS-Align+快10倍与2倍.到目前为止,这是唯一能够利用CUDA架构来加速完整蛋白质鉴定的研究工作.CUDA-TP源代码公布在https://github.com/dqiong/CUDA-TP.
参考文献
相关文章 8
[1] | 张军, 谢竟成, 沈凡凡, 谭海, 汪吕蒙, 何炎祥. 通用图形处理器缓存子系统性能优化方法综述[J]. 计算机研究与发展, 2020, 57(6): 1191-1207. |
[2] | 李哲,李占山,李颖. 基于GPU的约束网络模型和并行弧相容算法[J]. 计算机研究与发展, 2017, 54(3): 514-528. |
[3] | 张军,何炎祥,沈凡凡,江南,李清安. 基于2阶段同步的GPGPU线程块压缩调度方法[J]. 计算机研究与发展, 2016, 53(6): 1173-1185. |
[4] | 郑祯,翟季冬,李焱,陈文光. 基于CUPTI接口的典型GPU程序负载特征分析[J]. 计算机研究与发展, 2016, 53(6): 1249-1262. |
[5] | 陈尧, 赵永华,赵慰,赵莲. GPU加速不完全Cholesky分解预条件共轭梯度法[J]. 计算机研究与发展, 2015, 52(4): 843-850. |
[6] | 李 焱, 张云泉,. 异构平台上性能自适应FFT框架[J]. 计算机研究与发展, 2014, 51(3): 637-649. |
[7] | 唐 亮 骆祖莹 赵国兴 杨 旭. 利于GPU计算具有线性并行度的P/G网SOR求解算法[J]. , 2013, 50(7): 1491-1500. |
[8] | 蔡 勇 李光耀 王 琥. GPU通用计算平台上中心差分格式显式有限元并行计算[J]. , 2013, 50(2): 412-419. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3732