(国家超级计算广州中心(中山大学) 广州 510006) (jingkun.chen@nscc-gz.cn)
出版日期:
2019-04-01基金资助:
国家自然科学基金项目(61520106005,61761136014);国家重点研发计划项目(2017YFB1010000)An Overlap Store Optimization for Large-Scale Parallel Earth Science Application
Chen Jingkun Du Yunfei(National Supercomputer Center in Guangzhou (Sun Yat-sen University), Guangzhou 510006)
Online:
2019-04-01摘要/Abstract
摘要: 存储是地球科学类软件的重要组成部分,周期性输出中间态和检查点会带来大量的访存操作,不恰当的访存设计会严重影响软件在大规模计算时的性能表现.针对地球科学类软件的存储问题,从软件层面提出一个重叠存储优化方法,通过设置额外的I/O进程隐藏输出过程.该重叠存储优化主要有3个优势:1)将输出和计算操作重叠在一起,实现了输出的重叠化和隐藏化;2)抑制了收集通信的开销,突破了收集操作的通信带宽瓶颈和内存限制;3)能容易地使用各种高级并行输出库函数.利用重叠存储优化了天河二号上的WRF,ROMS_AGRIF,GRAPES,并完成了性能测试.结果表明:经过存储优化后,程序的峰值性能都获得了显著的提升.还讨论了在固定总进程数下,计算进程和I/O进程数的最佳比例是多少.优化后的程序与原版相比,模式专家只需要在配置文件额外设置2个新变量即可使用,十分易于学习.
参考文献
相关文章 4
[1] | 程大宁, 张汉平, 夏粉, 李士刚, 袁良, 张云泉. AccSMBO:一种基于超参梯度和元学习的SMBO加速算法[J]. 计算机研究与发展, 2020, 57(12): 2596-2609. |
[2] | 王真,江建慧,陈乃金,卢光明,张颖. BTI作用下三因素对集成电路软差错率的影响[J]. 计算机研究与发展, 2018, 55(5): 1108-1116. |
[3] | 何盼,谭春,袁月,吴开贵. 冗余及监控混合策略的优化配置算法研究[J]. 计算机研究与发展, 2016, 53(3): 682-696. |
[4] | 张必英, 陈红松, 崔刚, 傅忠传. 温度约束多核处理器最大稳态吞吐量分析[J]. 计算机研究与发展, 2015, 52(9): 2083-2093. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3908