1(计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京 100190) 2(中国科学院大学 北京 100049) (caohang@ict.ac.cn)
出版日期:
2020-12-01基金资助:
国家重点研发计划项目(2016YFB0200803);中国科学院战略性先导科技专项(C类)(XDC01040100); 国家自然科学基金项目(61972376,62072431,61432018);北京市自然科学基金项目(L182053)A Parallel Star Stencil Algorithm Based on Tessellating
Cao Hang1,2, Yuan Liang1, Huang Shan1,2, Zhang Yunquan1, Xu Yongjun1, Lu Pengqi1,2, Zhang Guangting11(State Key Laboratory of Computer Architecture (Institute of Computing Technology, Chinese Academy of Sciences), Beijing 100190);2(University of Chinese Academy of Sciences, Beijing 100049)
Online:
2020-12-01Supported by:
This work was supported by the National Key Research and Development Program of China (2016YFB0200803), the Strategic Priority Research Program of Chinese Academy of Sciences (C) (XDC01040100), the National Natural Science Foundation of China (61972376, 62072431, 61432018), and the Beijing Natural Science Foundation (L182053).摘要/Abstract
摘要: Stencil计算(模板计算)是科学工程应用中一类常见的嵌套循环算法.分块方法是提高数据局部性和并行性的高效优化技术之一,目前已有大量针对分块方法的探索,但现有工作往往对不同Stencil形状都采用同一处理方法.首先在空间层面引出“自然块”的概念来区分星型Stencil和盒型Stencil的特征,然后提出一个新的针对星型Stencil的2层密铺方案,此方案中自然块和它的后继块可以密铺数据空间区域,这些分块沿着时间维度扩展,能够密铺整个迭代空间.此外,针对星型Stencil设计了一个新颖的“2次更新”优化技术,改善了核内数据重用模式.理论分析表明:此方案相比现有方法有更低的缓存复杂度,实验结果证实了此方案的有效性.
参考文献
相关文章 15
[1] | 刘峰, 杨杰, 李志斌, 齐佳音. 一种基于区块链的泛用型数据隐私保护的安全多方计算协议[J]. 计算机研究与发展, 2021, 58(2): 281-290. |
[2] | 芦效峰, 廖钰盈, Pietro Lio, Pan Hui. 一种面向边缘计算的高效异步联邦学习机制[J]. 计算机研究与发展, 2020, 57(12): 2571-2582. |
[3] | 刘世芳, 赵永华, 于天禹, 黄荣锋. 并行对称矩阵三对角化算法在GPU集群上的有效实现[J]. 计算机研究与发展, 2020, 57(12): 2635-2647. |
[4] | 李德权, 许月, 薛生. 基于动态约束自适应方法抵御高维鞍点攻击[J]. 计算机研究与发展, 2020, 57(9): 2001-2008. |
[5] | 夏冬雪, 杨燕, 王浩, 阳树洪. 基于邻域多核学习的后融合多视图聚类算法[J]. 计算机研究与发展, 2020, 57(8): 1627-1638. |
[6] | 郑忆美, 贾彩燕, 常振海, 李轩涯. 一种度修正的属性网络随机块模型[J]. 计算机研究与发展, 2020, 57(8): 1650-1662. |
[7] | 张承龙, 曹华伟, 王国波, 郝沁汾, 张洋, 叶笑春, 范东睿. 面向高通量计算机的图算法优化技术[J]. 计算机研究与发展, 2020, 57(6): 1152-1163. |
[8] | 郭羽含, 张宇, 沈学利, 于俊宇. 即时车辆共乘问题的多策略解空间图搜索算法[J]. 计算机研究与发展, 2020, 57(6): 1269-1283. |
[9] | 徐志伟, 王一帆, 赵永威, 李春典. 算礼:探索计算系统的可分析抽象[J]. 计算机研究与发展, 2020, 57(5): 897-905. |
[10] | 罗浩, 闫光辉, 张萌, 包峻波, 李俊成, 刘婷, 杨波, 魏军. 融合多元信息的多关系社交网络节点重要性研究[J]. 计算机研究与发展, 2020, 57(5): 954-970. |
[11] | 王国卿, 庄雷, 和孟佯, 宋玉, 马岭. 实时模型检测精确加速窗口的计算原理及算法[J]. 计算机研究与发展, 2020, 57(1): 214-226. |
[12] | 李子臣, 谢婷, 张卷美, 徐荣华. 基于RLWE的后量子认证密钥交换协议[J]. 计算机研究与发展, 2019, 56(12): 2694-2701. |
[13] | 魏晓超,徐琳,郑志华,王皓. 适用于智能环境的高效安全云辅助模式匹配协议[J]. 计算机研究与发展, 2019, 56(11): 2365-2374. |
[14] | 谢秦,张清华,王国胤. 基于相似度量的自适应三支垃圾邮件过滤器[J]. 计算机研究与发展, 2019, 56(11): 2410-2423. |
[15] | 宋珂慧,张莹,张江伟,袁晓洁. 基于生成式对抗网络的结构化数据表生成模型[J]. 计算机研究与发展, 2019, 56(9): 1832-1842. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4315