1(国防科技大学计算机学院 长沙 410073); 2(国防科技大学并行与分布处理重点实验室 长沙 410073) (1520241161@qq.com)
出版日期:
2018-02-01基金资助:
国家自然科学基金国际合作与交流项目(61561146395);国家自然科学基金项目(11502296);国家“八六三”高技术研究发展计划基金项目(2012AA01A301)Heterogeneous Parallel Optimization of an Engine Combustion Simulation Application with the OpenMP 4.0 Standard
Yang Meifang1, Che Yonggang1,2, Gao Xiang11(College of Computer, National University of Defense Technology, Changsha 410073); 2(Science and Technology on Parallel and Distributed Processing Laboratory, National University of Defense Technology, Changsha 410073)
Online:
2018-02-01摘要/Abstract
摘要: LESAP是一个超燃冲压发动机燃烧数值模拟软件,可模拟发动机燃烧室内的燃烧化学反应与超声速流动,具有实际工程应用价值,其计算量巨大.面向通用CPU与Intel集成众核协处理器(many integrated core, MIC)构成的新型异构众核平台,使用新的OpenMP 4.0编程标准,实现了LESAP软件面向异构并行平台的移植,并采用SIMD向量化、数据传输优化、基于网格块划分的负载均衡等技术进行了性能优化.性能测试结果表明异构版本比纯CPU版本性能更佳.在天河二号超级计算机的1个结点(含2个12核的Intel Xeon E5-2692 CPU加3块Intel Xeon Phi 31S1P协处理器)上,对一个实际超燃发动机燃烧数值模拟问题,网格规模为532万单元时,每时间步的平均执行时间从原来纯CPU版的64.72s减少到21.06s,性能加速比达到约3.07.
参考文献
相关文章 15
[1] | 朱泓睿, 元国军, 姚成吉, 谭光明, 王展, 户忠哲, 张晓扬, 安学军. 分布式深度学习训练网络综述[J]. 计算机研究与发展, 2021, 58(1): 98-115. |
[2] | 张军, 谢竟成, 沈凡凡, 谭海, 汪吕蒙, 何炎祥. 通用图形处理器缓存子系统性能优化方法综述[J]. 计算机研究与发展, 2020, 57(6): 1191-1207. |
[3] | 王艳, 李念爽, 王希龄, 钟凤艳. 编码技术改进大规模分布式机器学习性能综述[J]. 计算机研究与发展, 2020, 57(3): 542-561. |
[4] | 沈洁, 龙标, 姜浩, 黄春. 飞腾处理器上向量三角函数的设计实现与优化[J]. 计算机研究与发展, 2020, 57(12): 2610-2620. |
[5] | 孙昌爱,王真,潘琳. 面向WS-BPEL程序的变异测试优化技术[J]. 计算机研究与发展, 2019, 56(4): 895-905. |
[6] | 李甜甜,于戈,郭朝鹏,宋杰. 基于MapReduce的多元连接优化方法[J]. 计算机研究与发展, 2016, 53(2): 467-478. |
[7] | 刘松,伍卫国,赵博,蒋庆. 面向局部性和并行优化的循环分块技术[J]. 计算机研究与发展, 2015, 52(5): 1160-1176. |
[8] | 王勇献, 张理论, 车永刚, 徐传福, 刘巍, 程兴华. 高阶精度CFD应用在天河2系统上的异构并行模拟与性能优化[J]. 计算机研究与发展, 2015, 52(4): 833-842. |
[9] | 罗红兵 张晓霞 王 伟 武林平. 科学计算应用程序单核指令级优化研究[J]. 计算机研究与发展, 2014, 51(6): 1263-1269. |
[10] | 顾 荣 严金双 杨晓亮 袁春风 黄宜华. Hadoop MapReduce短作业执行性能优化[J]. 计算机研究与发展, 2014, 51(6): 1270-1280. |
[11] | 李 焱, 张云泉,. 异构平台上性能自适应FFT框架[J]. 计算机研究与发展, 2014, 51(3): 637-649. |
[12] | 孙相征, 张云泉, 王 婷, 李 焱, 袁 良,. 对角线稀疏矩阵的SpMV自适应性能优化[J]. , 2013, 50(3): 648-656. |
[13] | 张惠臻, 王 超, 李 曦, 周学海,. 可重构指令集处理器的代码优化生成算法研究[J]. , 2012, 49(9): 2018-2026. |
[14] | 袁 娥, 张云泉, 刘芳芳, 孙相征,. SpMV的自动性能优化实现技术及其应用研究[J]. , 2009, 46(7): 1117-1126. |
[15] | 李 磊, 牛春雷, 陈宁江, 魏 峻,. 一种高效的Web服务性能优化策略[J]. , 2007, 44(7): 1191-1198. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3639