(国防科技大学计算机学院 长沙 410073) (liusheng83@nudt.edu.cn)
出版日期:
2021-06-01基金资助:
国家重点研发计划项目(2018YFB0204301课题1)A Self-Designed Heterogeneous Accelerator for Exascale High Performance Computing
Liu Sheng, Lu Kai, Guo Yang, Liu Zhong, Chen Haiyan, Lei Yuanwu, Sun Haiyan, Yang Qianming, Chen Xiaowen, Chen Shenggang, Liu Biwei, Lu Jianzhuang(College of Computer Science and Technology, National University of Defense Technology, Changsha 410073)
Online:
2021-06-01Supported by:
This work was supported by the National Key Research and Development Program of China (2018YFB0204301 sub-project I).摘要/Abstract
摘要: 高性能计算(high performance computing, HPC)是推动科学技术发展的基础性领域之一,当前,作为超级计算机系统“下一个明珠”的E级高性能计算时代已经来临.面向E级高性能计算的加速器领域成为了全球高端芯片的竞技场.国际上,AMD、英伟达和英特尔公司已经占据这一领域多年.作为国内最早开始自主处理器设计的优势单位之一,国防科技大学一直以来都是高性能加速器领域强有力的竞争者.主要对国防科技大学自主设计的面向E级高性能计算的加速器芯片进行介绍,该芯片采用了CPU+GPDSP的异构融合架构,具备高性能、高效能和高可编程性的特点,有望成为新一代E级超算系统的核心计算芯片.
参考文献
相关文章 15
[1] | 王谛, 石嵩, 吴铁彬, 刘亮, 谭弘兵, 郝子宇, 过锋, 李宏亮. 一种高性能超长点数浮点FFT加速器设计[J]. 计算机研究与发展, 2021, 58(6): 1192-1203. |
[2] | 杨帆, 张鹏, 王展, 元国军, 安学军. 基于在网计算加速的拜占庭容错算法[J]. 计算机研究与发展, 2021, 58(1): 164-177. |
[3] | 郭进阳, 邵传明, 王靖, 李超, 朱浩瑾, 过敏意. FPGA图计算的编程与开发环境:综述和探索[J]. 计算机研究与发展, 2020, 57(6): 1164-1178. |
[4] | 左鹏飞,华宇,谢新锋,胡杏,谢源,冯丹. 面向深度学习加速器的安全加密方法[J]. 计算机研究与发展, 2019, 56(6): 1161-1169. |
[5] | 方荣强,王晶,姚治成,刘畅,张伟功. 多层神经网络算法的计算特征建模方法[J]. 计算机研究与发展, 2019, 56(6): 1170-1181. |
[6] | 向陶然,叶笑春,李文明,冯煜晶,谭旭,张浩,范东睿. 基于细粒度数据流架构的稀疏神经网络全连接层加速[J]. 计算机研究与发展, 2019, 56(6): 1192-1204. |
[7] | 张乾龙, 侯锐, 杨思博, 赵博彦, 张立新. 体系结构模拟器在处理器设计过程中的作用[J]. 计算机研究与发展, 2019, 56(12): 2702-2719. |
[8] | 韩栋,周聖元,支天,陈云霁,陈天石. 智能芯片的评述和展望[J]. 计算机研究与发展, 2019, 56(1): 7-22. |
[9] | 卢冶,陈瑶,李涛,蔡瑞初,宫晓利. 面向边缘计算的嵌入式FPGA卷积神经网络构建方法[J]. 计算机研究与发展, 2018, 55(3): 551-562. |
[10] | 吴林阳, 罗蓉, 郭雪婷, 郭崎. CPU和DRAM加速任务划分方法:大数据处理中Hash Joins的加速实例[J]. 计算机研究与发展, 2018, 55(2): 289-304. |
[11] | 苏华友, 温文, 李东升. 面向GPU的单颗粒冷冻电镜软件RELION并行与优化[J]. 计算机研究与发展, 2018, 55(2): 409-417. |
[12] | 易建亮, 陈志广, 肖侬, 卢宇彤. 基于代理的并行文件系统元数据优化与实现[J]. 计算机研究与发展, 2018, 55(2): 438-446. |
[13] | 钱磊,赵锦明,彭达佳,李祥,吴东,谢向辉. 基于可重构微服务器的高能效指纹比对方法[J]. 计算机研究与发展, 2016, 53(7): 1425-1437. |
[14] | 雷元武,陈小文,彭元喜. DSP芯片中的高能效FFT加速器[J]. 计算机研究与发展, 2016, 53(7): 1438-1446. |
[15] | 郑方,沈莉,李宏亮,谢向辉. 面向高性能计算的众核处理器轻量级错误恢复技术研究[J]. 计算机研究与发展, 2015, 52(6): 1316-1328. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4437