删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

飞腾处理器上向量三角函数的设计实现与优化

本站小编 Free考研考试/2022-01-01

沈洁,龙标,姜浩,黄春
(国防科技大学计算机学院 长沙 410073) (j.shen@nudt.edu.cn)
出版日期: 2020-12-01


基金资助:“核高基”国家科技重大专项基金项目(2018ZX01029-103);国家自然科学基金项目(61902407);湖南省自然科学基金资助项目(2018JJ3616)

Implementation and Optimization of Vector Trigonometric Functions on Phytium Processors

Shen Jie, Long Biao, Jiang Hao, Huang Chun
(College of Computer, National University of Defense Technology, Changsha 410073)
Online: 2020-12-01


Supported by:This work was supported by the National Science and Technology Major Projects of Hegaoji (2018ZX01029-103), the National Natural Science Foundation of China (61902407), and Hunan Provincial Natural Science Foundation of China (2018JJ3616).




摘要/Abstract


摘要: 得益于单指令多数据(single instruction multiple data, SIMD)向量化技术,处理器浮点计算能力获得了成倍的提升,然而当前SIMD向量部件和指令集仅支持加、减、乘、除、逻辑运算等基本操作,对浮点超越函数没有提供直接的支持.作为浮点计算中最耗时的一类函数,如何提高其性能成为底层数学库优化工作的一个重点.面向超越函数中的三角函数,提出一种利用SIMD向量部件设计、实现与优化向量三角函数的方法.该方法结合标量数学库分段计算与向量数学库向量化实现的优势,增加和优化了向量三角函数中的分支处理,既减少了函数实现中的冗余计算,又提高了分支情况下向量部件的利用率.在飞腾处理器上的实验表明:所提优化方法既保证了向量三角函数的精度,同时有效提高了函数性能,与原始向量三角函数相比平均性能加速比为2.04倍.






[1]朱泓睿, 元国军, 姚成吉, 谭光明, 王展, 户忠哲, 张晓扬, 安学军. 分布式深度学习训练网络综述[J]. 计算机研究与发展, 2021, 58(1): 98-115.
[2]张军, 谢竟成, 沈凡凡, 谭海, 汪吕蒙, 何炎祥. 通用图形处理器缓存子系统性能优化方法综述[J]. 计算机研究与发展, 2020, 57(6): 1191-1207.
[3]王艳, 李念爽, 王希龄, 钟凤艳. 编码技术改进大规模分布式机器学习性能综述[J]. 计算机研究与发展, 2020, 57(3): 542-561.
[4]孙昌爱,王真,潘琳. 面向WS-BPEL程序的变异测试优化技术[J]. 计算机研究与发展, 2019, 56(4): 895-905.
[5]杨梅芳, 车永刚, 高翔. 基于OpenMP 4.0的发动机燃烧模拟软件异构并行优化[J]. 计算机研究与发展, 2018, 55(2): 400-408.
[6]李甜甜,于戈,郭朝鹏,宋杰. 基于MapReduce的多元连接优化方法[J]. 计算机研究与发展, 2016, 53(2): 467-478.
[7]刘松,伍卫国,赵博,蒋庆. 面向局部性和并行优化的循环分块技术[J]. 计算机研究与发展, 2015, 52(5): 1160-1176.
[8]王勇献, 张理论, 车永刚, 徐传福, 刘巍, 程兴华. 高阶精度CFD应用在天河2系统上的异构并行模拟与性能优化[J]. 计算机研究与发展, 2015, 52(4): 833-842.
[9]罗红兵 张晓霞 王 伟 武林平. 科学计算应用程序单核指令级优化研究[J]. 计算机研究与发展, 2014, 51(6): 1263-1269.
[10]顾 荣 严金双 杨晓亮 袁春风 黄宜华. Hadoop MapReduce短作业执行性能优化[J]. 计算机研究与发展, 2014, 51(6): 1270-1280.
[11]李 焱, 张云泉,. 异构平台上性能自适应FFT框架[J]. 计算机研究与发展, 2014, 51(3): 637-649.
[12]孙相征, 张云泉, 王 婷, 李 焱, 袁 良,. 对角线稀疏矩阵的SpMV自适应性能优化[J]. , 2013, 50(3): 648-656.
[13]张惠臻, 王 超, 李 曦, 周学海,. 可重构指令集处理器的代码优化生成算法研究[J]. , 2012, 49(9): 2018-2026.
[14]袁 娥, 张云泉, 刘芳芳, 孙相征,. SpMV的自动性能优化实现技术及其应用研究[J]. , 2009, 46(7): 1117-1126.
[15]李 磊, 牛春雷, 陈宁江, 魏 峻,. 一种高效的Web服务性能优化策略[J]. , 2007, 44(7): 1191-1198.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4314
相关话题/优化 计算机 计算 技术 数学

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于SMT求解器的微处理器指令验证数据约束生成技术
    谭坚,罗巧玲,王丽一,胡夏晖,范昊,徐占(江南计算技术研究所江苏无锡214083)(tanjian131@163.com)出版日期:2020-12-01基金资助:国家重点研发计划项目(2017YFB0202703)DataConstraintGenerationTechnologyforMicrop ...
    本站小编 Free考研考试 2022-01-01
  • 基于边缘计算的进化多目标优化图像隐写算法
    丁旭阳1,谢盈1,2,张小松11(电子科技大学计算机科学与工程学院成都611731);2(西南民族大学计算机科学与工程学院成都610041)(dingxuyang@uestc.edu.cn)出版日期:2020-11-01基金资助:国家自然科学基金项目(61902326);西南民族大学中央高校基本科研 ...
    本站小编 Free考研考试 2022-01-01
  • 自动图像标注技术综述
    马艳春,刘永坚,解庆,熊盛武,唐伶俐(武汉理工大学计算机科学与技术学院武汉430070)(mayanchun@whut.edu.cn)出版日期:2020-11-01基金资助:国家自然科学基金项目(61602353);中央高校基本科研业务费专项资金(WUT:2017YB028)ReviewofAuto ...
    本站小编 Free考研考试 2022-01-01
  • 面向键值存储的日志结构合并树优化技术
    吴尚宇,谢婧雯,王毅(深圳大学计算机与软件学院广东深圳518060)(shangyuwu1006@gmail.com)出版日期:2020-11-01基金资助:国家自然科学基金项目(61972259);广东省自然科学基金-****基金项目(2019B151502055);广东省自然科学基金项目(201 ...
    本站小编 Free考研考试 2022-01-01
  • 边缘计算隐私保护研究进展
    周俊,沈华杰,林中允,曹珍富,董晓蕾(上海市高可信计算重点实验室(华东师范大学)上海200062)(jzhou@sei.ecnu.edu.cn)出版日期:2020-10-01基金资助:上海市自然科学基金项目(20ZR1418400);国家自然科学基金项目(61632012,61672239,U163 ...
    本站小编 Free考研考试 2022-01-01
  • 量子计算与量子密码的原理及研究进展综述
    王永利1,徐秋亮21(山东大学数学学院济南250100);2(山东大学软件学院济南250101)(wyl@mail.sdu.edu.cn)出版日期:2020-10-01基金资助:国家自然科学基金项目(61632020)PrincipleandResearchProgressofQuantumComp ...
    本站小编 Free考研考试 2022-01-01
  • 基于模格的密钥封装方案的比较分析与优化
    王洋1,3,沈诗羽2,赵运磊2,王明强1,31(山东大学数学学院济南250100);2(复旦大学计算机科学技术学院上海200433);3(密码技术与信息安全教育部重点实验室(山东大学)济南250100)(wyang1114@email.sdu.edu.cn)出版日期:2020-10-01基金资助:国 ...
    本站小编 Free考研考试 2022-01-01
  • 基于随机映射技术的声纹识别模板保护
    丁勇1,4,5,李佳慧2,4,唐士杰1,3,王会勇2,41(桂林电子科技大学计算机与信息安全学院广西桂林541004);2(桂林电子科技大学数学与计算科学学院广西桂林541004);3(桂林电子科技大学电子工程与自动化学院广西桂林541004);4(广西密码学与信息安全重点实验室(桂林电子科技大学) ...
    本站小编 Free考研考试 2022-01-01
  • 面向集合计算的隐私保护统计协议
    宋祥福1,盖敏2,赵圣楠1,蒋瀚21(山东大学计算机科学与技术学院济南250101);2(山东大学软件学院济南250101)(bintasong@gmail.com)出版日期:2020-10-01基金资助:国家自然科学基金项目(61632020,61572294)Privacy-Preserving ...
    本站小编 Free考研考试 2022-01-01
  • 边缘计算专题前言
    卢宇彤(中山大学国家超级计算广州中心广州510006)出版日期:2020-09-01Online:2020-09-01摘要/Abstract摘要:近年来,随着智能万物互联时代的快速到来和新一代无线通信网络的高速普及,各类新兴智能应用如智慧城市、智能制造、新零售、智能安防等百花齐放.这些新兴数据密集型 ...
    本站小编 Free考研考试 2022-01-01