(江南计算技术研究所 江苏无锡 214083) (wangdi_csarch@126.com)
出版日期:
2021-06-01基金资助:
核高基”国家科技重大专项基金项目(2018ZX01028-102)A High Performance Accelerator Design for Ultra-Long Point Floating-Point FFT
Wang Di, Shi Song, Wu Tiebin, Liu Liang, Tan Hongbing, Hao Ziyu, Guo Feng, Li Hongliang(Jiangnan Institute of Computing Technology, Wuxi, Jiangsu 214083)
Online:
2021-06-01Supported by:
This work was supported by the National Science and Technology Major Projects of Hegaoji (2018ZX01028-102).摘要/Abstract
摘要: 快速傅里叶变换(fast Fourier transform, FFT)在数字信号处理中占据核心地位.随着高性能超长点数FFT需求的增长,数字信号处理器(digital signal processor, DSP)的计算能力越来越难以满足需求,集成FFT加速器成为重要的发展趋势.为了支持超长点数FFT,将2维分解算法推广到多维,提出一种可集成于DSP的高性能超长点数FFT加速器结构.该结构通过基于素数个存储体的无冲突体编址方法实现了3维转置运算;通过递推算法实现了高效铰链因子生成;使用单精度浮点二项融合点积运算和融合加-减运算,对FFT运算电路进行了精细化设计.实现了对4G点数单精度浮点FFT计算的支持.综合结果表明:FFT加速器运行频率能够达到1GHz以上,性能达到640Gflop/s.在支持的点数和性能方面都较已有研究成果取得大幅提升.
参考文献
相关文章 15
[1] | 刘胜, 卢凯, 郭阳, 刘仲, 陈海燕, 雷元武, 孙海燕, 杨乾明, 陈小文, 陈胜刚, 刘必慰, 鲁建壮. 一种自主设计的面向E级高性能计算的异构融合加速器[J]. 计算机研究与发展, 2021, 58(6): 1234-1237. |
[2] | 杨帆, 张鹏, 王展, 元国军, 安学军. 基于在网计算加速的拜占庭容错算法[J]. 计算机研究与发展, 2021, 58(1): 164-177. |
[3] | 郭进阳, 邵传明, 王靖, 李超, 朱浩瑾, 过敏意. FPGA图计算的编程与开发环境:综述和探索[J]. 计算机研究与发展, 2020, 57(6): 1164-1178. |
[4] | 左鹏飞,华宇,谢新锋,胡杏,谢源,冯丹. 面向深度学习加速器的安全加密方法[J]. 计算机研究与发展, 2019, 56(6): 1161-1169. |
[5] | 方荣强,王晶,姚治成,刘畅,张伟功. 多层神经网络算法的计算特征建模方法[J]. 计算机研究与发展, 2019, 56(6): 1170-1181. |
[6] | 向陶然,叶笑春,李文明,冯煜晶,谭旭,张浩,范东睿. 基于细粒度数据流架构的稀疏神经网络全连接层加速[J]. 计算机研究与发展, 2019, 56(6): 1192-1204. |
[7] | 韩栋,周聖元,支天,陈云霁,陈天石. 智能芯片的评述和展望[J]. 计算机研究与发展, 2019, 56(1): 7-22. |
[8] | 卢冶,陈瑶,李涛,蔡瑞初,宫晓利. 面向边缘计算的嵌入式FPGA卷积神经网络构建方法[J]. 计算机研究与发展, 2018, 55(3): 551-562. |
[9] | 吴林阳, 罗蓉, 郭雪婷, 郭崎. CPU和DRAM加速任务划分方法:大数据处理中Hash Joins的加速实例[J]. 计算机研究与发展, 2018, 55(2): 289-304. |
[10] | 钱磊,赵锦明,彭达佳,李祥,吴东,谢向辉. 基于可重构微服务器的高能效指纹比对方法[J]. 计算机研究与发展, 2016, 53(7): 1425-1437. |
[11] | 雷元武,陈小文,彭元喜. DSP芯片中的高能效FFT加速器[J]. 计算机研究与发展, 2016, 53(7): 1438-1446. |
[12] | 李 焱, 张云泉,. 异构平台上性能自适应FFT框架[J]. 计算机研究与发展, 2014, 51(3): 637-649. |
[13] | 王文迪, 汤 文, 段 勃, 张春明, 张佩珩, 孙凝晖,. 基于Hash索引的高通量基因序列比对并行加速技术研究[J]. , 2013, 50(11): 2463-2471. |
[14] | 方 维 孙广中 吴 超 陈国良. 一种三维快速傅里叶变换并行算法[J]. , 2011, 48(3): 440-446. |
[15] | 陈莉丽 沈 立 王志英 肖 侬 姚益平. 面向特定应用的计算加速器虚拟化[J]. , 2011, 48(11): 2103-2110. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4434