(数学工程与先进计算国家重点实验室 江苏无锡 214125) (jia.xun@meac-skl.cn)
出版日期:
2019-02-01基金资助:
国家自然科学基金项目(91430214,61732018)A Coprocessor for Double-Precision Floating-Point Matrix Multiplication
Jia Xun, Wu Guiming, Xie Xianghui, Wu Dong(State Key Laboratory of Mathematical Engineering and Advanced Computing, Wuxi, Jiangsu 214125)
Online:
2019-02-01摘要/Abstract
摘要: 矩阵乘运算在多个应用领域特别是数值计算领域被广泛使用,但双精度浮点矩阵乘在CPU,GPGPU,FPGA等现有计算平台上的性能和效率受限,其往往成为大规模数值计算应用的性能瓶颈.针对该问题,以线性阵列计算结构为基础,研究了双精度浮点矩阵乘的定制加速.首先,对线性阵列计算结构进行了双缓冲优化并设计了针对双缓冲的存储访问调度,以提高结构的计算效率.其次,提出了矩阵乘协处理器和加速计算系统的结构,构建了协处理器的性能模型并对其结构设计空间进行了探索.最后,验证了协处理器的功能正确性并在某主流工艺下评估了其硬件开销.实验结果表明,设计的双精度浮点矩阵乘协处理器可以达到3 TFLOPS的计算性能和99%的计算效率.与NVIDIA K40 GPGPU相比,协处理器执行双精度浮点矩阵乘的性能是K40的1.95倍,而面积开销仅为K40的21.05%.探索了定制加速结构设计在高性能计算中的应用,对现有计算系统的性能提升具有一定的参考价值.
参考文献
相关文章 15
[1] | 杨帆, 张鹏, 王展, 元国军, 安学军. 基于在网计算加速的拜占庭容错算法[J]. 计算机研究与发展, 2021, 58(1): 164-177. |
[2] | 郭进阳, 邵传明, 王靖, 李超, 朱浩瑾, 过敏意. FPGA图计算的编程与开发环境:综述和探索[J]. 计算机研究与发展, 2020, 57(6): 1164-1178. |
[3] | 孙胜, 李叙晶, 刘敏, 杨博, 过晓冰. 面向异构IoT设备协作的DNN推断加速研究[J]. 计算机研究与发展, 2020, 57(4): 709-722. |
[4] | 谭坚, 罗巧玲, 王丽一, 胡夏晖, 范昊, 徐占. 基于SMT求解器的微处理器指令验证数据约束生成技术[J]. 计算机研究与发展, 2020, 57(12): 2694-2702. |
[5] | 陈玉标, 李建中, 李英姝. SBS: 基于固态盘内部并行性的R-树高效查询算法[J]. 计算机研究与发展, 2020, 57(11): 2404-2418. |
[6] | 王国卿, 庄雷, 和孟佯, 宋玉, 马岭. 实时模型检测精确加速窗口的计算原理及算法[J]. 计算机研究与发展, 2020, 57(1): 214-226. |
[7] | 左鹏飞,华宇,谢新锋,胡杏,谢源,冯丹. 面向深度学习加速器的安全加密方法[J]. 计算机研究与发展, 2019, 56(6): 1161-1169. |
[8] | 方荣强,王晶,姚治成,刘畅,张伟功. 多层神经网络算法的计算特征建模方法[J]. 计算机研究与发展, 2019, 56(6): 1170-1181. |
[9] | 向陶然,叶笑春,李文明,冯煜晶,谭旭,张浩,范东睿. 基于细粒度数据流架构的稀疏神经网络全连接层加速[J]. 计算机研究与发展, 2019, 56(6): 1192-1204. |
[10] | 陈桂林,马胜,郭阳. 硬件加速神经网络综述[J]. 计算机研究与发展, 2019, 56(2): 240-253. |
[11] | 韩栋,周聖元,支天,陈云霁,陈天石. 智能芯片的评述和展望[J]. 计算机研究与发展, 2019, 56(1): 7-22. |
[12] | 纪荣嵘,林绍辉,晁飞,吴永坚,黄飞跃. 深度神经网络压缩与加速综述[J]. 计算机研究与发展, 2018, 55(9): 1871-1888. |
[13] | 陈玉标,李建中,李英姝,李发明,高宏. 基于闪存固态硬盘内部并行机制的R-树优化方法[J]. 计算机研究与发展, 2018, 55(9): 2066-2082. |
[14] | 朱海龙,云晓春,韩志帅. 基于传播加速度的微博流行度预测方法[J]. 计算机研究与发展, 2018, 55(6): 1282-1293. |
[15] | 胡飞,尤志强,刘鹏,邝继顺. 基于忆阻器交叉阵列的卷积神经网络电路设计[J]. 计算机研究与发展, 2018, 55(5): 1097-1107. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3874