删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

M5-EDGE分布式取指模型设计

本站小编 哈尔滨工业大学/2019-10-24

M5-EDGE分布式取指模型设计

张超,喻明艳

(哈尔滨工业大学 航天学院, 哈尔滨 150001)



摘要:

为解决M5-edge模拟器的理想化集总式取指令结构对基于EDGE体系结构设计空间探索的限制问题,对原模拟器的取指令前段进行分布式设计,包括总体的功能、具体的取指单元及单元间的互连网络设计,并在取指令块头的方式上设计了固定方式和循环方式两种方案.通过对实现后的结构进行在不同分布单元数量条件下的仿真分析,得到从理想集总式取指结构到实际分布式结构的性能下降关系和不同取指令块头方式的优劣.通过进一步分析,得出通信延迟和缓存缺失率对处理器性能的影响.

关键词:  EDGE体系结构  分布式取指  通信延迟  缓存缺失率

DOI:10.11918/j.issn.0367-6234.201508011

分类号:TP302.7

文献标识码:A

基金项目:



The design and analysis of distributed fetch based on M5-edge

ZHANG Chao,YU Mingyan

(Department of Astronautics, Harbin Institute of Technology, Harbin 150001, China)

Abstract:

A distributed fetch structure of M5-edge is designed for the purpose of expanding the design space of EDGE architecture. The structure includes the overall function, distributed fetch unit and the interconnection network between the units. Two kinds of fetching block head are realized, including fixed fashion and round robin one. The analyses, which are made in different distributed fetch unit counts, provide the leave of reduction of distributed fetch comparing with the ideal lumped fetch model, as well as the difference between the two fashions of fetching block head. Furthermore, the effect of the processor performance by the communication latency and the cache miss rate are shown.

Key words:  EDGE  distributed fetch  communication latency  cache miss rate


张超, 喻明艳. M5-EDGE分布式取指模型设计[J]. 哈尔滨工业大学学报, 2017, 49(5): 16-21. DOI: 10.11918/j.issn.0367-6234.201508011.
ZHANG Chao, YU Mingyan. The design and analysis of distributed fetch based on M5-edge[J]. Journal of Harbin Institute of Technology, 2017, 49(5): 16-21. DOI: 10.11918/j.issn.0367-6234.201508011.
作者简介 张超 (1984—),男,博士研究生;
喻明艳 (1962—),男,教授,博士生导师 通信作者 喻明艳,myyu@hit.edu.cn 文章历史 收稿日期: 2015-08-11



Contents            -->Abstract            Full text            Figures/Tables            PDF


M5-EDGE分布式取指模型设计
张超, 喻明艳    
哈尔滨工业大学 航天学院,哈尔滨 150001

收稿日期: 2015-08-11
作者简介: 张超 (1984—),男,博士研究生;
喻明艳 (1962—),男,教授,博士生导师
通信作者: 喻明艳,myyu@hit.edu.cn


摘要: 为解决M5-edge模拟器的理想化集总式取指令结构对基于EDGE体系结构设计空间探索的限制问题,对原模拟器的取指令前段进行分布式设计,包括总体的功能、具体的取指单元及单元间的互连网络设计,并在取指令块头的方式上设计了固定方式和循环方式两种方案.通过对实现后的结构进行在不同分布单元数量条件下的仿真分析,得到从理想集总式取指结构到实际分布式结构的性能下降关系和不同取指令块头方式的优劣.通过进一步分析,得出通信延迟和缓存缺失率对处理器性能的影响.
关键词: EDGE体系结构    分布式取指    通信延迟    缓存缺失率    
The design and analysis of distributed fetch based on M5-edge
ZHANG Chao, YU Mingyan    
Department of Astronautics, Harbin Institute of Technology, Harbin 150001, China


Abstract: A distributed fetch structure of M5-edge is designed for the purpose of expanding the design space of EDGE architecture. The structure includes the overall function, distributed fetch unit and the interconnection network between the units. Two kinds of fetching block head are realized, including fixed fashion and round robin one. The analyses, which are made in different distributed fetch unit counts, provide the leave of reduction of distributed fetch comparing with the ideal lumped fetch model, as well as the difference between the two fashions of fetching block head. Furthermore, the effect of the processor performance by the communication latency and the cache miss rate are shown.
Key words: EDGE    distributed fetch    communication latency    cache miss rate    
为提高处理器单线程性能而进行的体系结构上的创新,将会带来明显的功耗增加[1],而通过多核技术带来的处理器性能的提高在不远的未来可能无法满足性能每两年翻一番的期望[2-3].新的指令集体系结构作为可能的解决方案在过去的十余年间进行了多种尝试[4-7],国内外多所知名院校及研究机构推出了具有各自特色的用于学术研究的未来处理器模型.作为其中较为成熟的代表,EDGE[8](explicit data graph execution) 体系结构在设计理念、结构创新、工具链完善程度、流片验证,及体系结构的后续发展等方面都具有一定优势.

EDGE体系结构采用显示通信指令集和块原子性的执行方式,通过块内指令的直接通信实现类数据流结构,充分开发指令级并行性,加快程序的执行速度,在满足低功耗、高可扩展性、多种应用的适应性等要求的前提下,实现了出色的性能功耗比.以EDGE指令集为基础已经设计实现了多种先进的处理器结构,主要包括TRIPS[9]、TFlex[10]、T3[11]、E2[12]等.而针对该指令集体系结构,现有的通用处理器仿真平台不具有对其指令集的描述和微结构仿真的支持. M5-edge[13]作为目前唯一基于广泛使用的开源模拟器[14]进行开发的EDGE体系结构仿真平台,相比于奥斯丁TRIPS小组所提供的仿真工具链具有明显的优势.该模拟器完成了很好的仿真精度、速度和可扩展性的平衡,为基于显式通信和EDGE体系结构为基础的新型处理器提供研究支持.

M5-edge通过分析EDGE体系结构特点和其微结构实现的共性,对处理器工作过程进行合理分割,提出四级时序模型,分别为取指令块、映射、执行、递交.该划分准确反映EDGE体系结构特点,使得研究人员可以方便快捷地进行处理器设计空间的探索.但是,M5-edge同时存在着一些不足,其中较突出的问题在于缺乏一些具体的处理器分布式微结构模型的实现,包括分布式的取指令系统和分布式的数据存储系统等.原模拟器中以理想的集总式的结构代替,随着处理器设计理念的发展,这些集总单元限制了研究者的拓展空间,在进行针对这些部件的具体研究中,该模拟器无能为力.

针对该问题,本文对M5-edge模拟器的取指令块部分进行分布式研究,提出一种可以自由配置的分布式取指令单元结构,并对提出的方法和不同参数配置下的性能结果进行分析,为EDGE结构的分布式取指端实现提供一种有效的解决方案,该方法同样可以作为模拟器其他部件分布化的参考.

1 取指模型整体实现对于EDGE体系结构,由于其本身的块原子性设计,使得取指令阶段区别于传统处理器的以指令为单位,而是以本身定义的指令块为单位完成取值工作.该指令块由多个基本块构成,采用谓词化技术 (predicate) 消除基本块间的控制相关,以实现块内数据流执行方式,达到加速处理器执行能力的目的.

M5-edge取指阶段大致由五部分组成,如图 1所示.其中指令缓冲的设计大部分继承原有M5模拟器的O3(out of order) CPU模型,增加了为构成指令块数据结构而必须的数据位和结构等.块预测器通过当前完成的递交块地址结合历史信息对下一个块的地址信息进行预测.虽然以块为单位的特点,一定程度上提高了指令缓冲和块预测器的命中率,但一旦出现投机的失败,所承担的恢复开销也更大,所以同传统的处理器一样,影响取值带宽的主要因素仍然集中在预测器的预测失败和一级指令缓存的未命中.当发生指令缓存未命中的情况时,每个取指令单元应该独立处理属于自己部分的未命中事件.取指单元负责处理取指令过程中的各部分状态变化和异常处理,当块中所有取指令过程完成时,还负责生成指令块数据结构.至此,取指令部分工作完成,在译码过后,控制单元将完成指令到分布式的执行单元的映射工作.

Figure 1
图 1 M5-edge取指令块阶段过程示意 Figure 1 The schematic of fetch instruction stage


取指令过程的模拟器实现的各阶段状态转换如图 2所示. 主要包括等待指令 (i)、取指令块块头 (fh)、取指令块块体 (fb)、等待指令缓存 (wi) 和等待异常处理 (wf). 在EDGE指令集中将指令块分为块头和块体,分别存储不同类型的指令.其中,块头中不仅有寄存器相关指令,还有其他一些和指令运行有关的重要信息,需要专门进行处理.值得注意的是,异常处理需要等到指令块递交时才能进行,因此在递交之前出现异常需要等待,直到异常处理结束.

Figure 2
图 2 取指令过程有限状态机 Figure 2 The finite state machine of fetch


2 分布式取指单元实现本文实现了一个可变数量的分布式取指令单元,可完成2、4、8、16及更多的分布式取指单元实现.在具体设计过程中参考了TFlex取指令结构随着执行核重构而产生不同的取指令结构,完成1*2、2*2、2*4等取指令结构的设计.之后开发的基于EDGE体系结构处理器,包括E2、T3等具有相同的取指设计方式.由于实现原理相同,本文以八单元分布式取指前端为例 (如图 3所示),为8取指单元cpu高层模型.

Figure 3
图 3 具有分布式取指令前端的模拟器时序模型 Figure 3 The four-stage model of M5-edge with distributed fetch units


考虑模拟器不同情况的仿真需求,分布式取指前端将以理想的无网络延时和具有实际消息传递网络两种模式实现. 图 3中,小的分布式指令缓存与分布式取指单元紧密相连,完成甚块中各部分的取指任务.两个取指单元之间的信息传递延时在理想情况下设为0,这意味着产生于某个取指单元的信息可以在相同周期内被其他取指单元获得.

由于甚块的特殊构造,取指过程被分为两个阶段.首先,甚块头必须被优先取出以获得指令块的信息,比如指令范围和chunk数量.在取指令块头结束后,改变各相关部分状态信息,并开始取甚块的指令chunk部分.

在设计取指令块头时,考虑两个方案:首先,为了实现简单选着不同的取指单元来进行头chunk和指令chunk的取指.选取取指单元0进行取指令头操作,而其他取指单元则只用于取指令chunk.这样的好处是除了单元0以外的其他取指单元可以减少指令块头信息的解释器,从而简化硬件实现.但是,由于指令chunk必须在所在甚块头chunk取完后才能取其中指令,因此,在取指令chunk时,原有的进行头chunk取指的单元将会被闲置.第二种方案中考虑使每个取指令单元完全一致,可以完成所有取指要求.这种方式同时具有更好的硬件可扩展性.

在模拟器中,取指单元的运行由其状态位决定.状态位每时钟周期进行更新,包括以下状态:运行 (running)、空闲 (idle)、插入 (squashing)、(icache wait response)、指令缓存重取等待 (icache wait retry)、阻塞 (block).当处于running状态时,取指单元开始运行.该有限状态机如图 4所示.

Figure 4
图 4 取指过程有限状态机 Figure 4 The finite state machine of fetch status


考虑实际分布式取指单元间通信时间问题,在取指单元间建立路由网络.在取指过程中,取指单元间信息传递主要出现在两个阶段.当取指令块头chunk完成时,该取指单元将会发送数据包给其他单元.数据包中主要包括:取块头完成信号,目的取指单元,指令chunk地址,下一个指令块头取指单元等.当各取指单元完成该指令块指令chunk取指任务后,将会向头取指单元发送反馈信息,并通过检查所有的返回信息判断该指令块取指是否完成.

在每个取指单元中增加路由形成网络,构成最终完整的分布式取指部件.路由内部结构如图 5所示,仲裁器通过对接收到的信息包进行译码来获知目地取指单元,并将信息包传进本地或4个方向的先进先出队列之一.

Figure 5
图 5 取指单元间路由结构 Figure 5 The structure of router


图 6展示了完整的带路由网络的取指单元的运行模式,以伪代码方式呈现.函数promoteRouter () 从fifo中得到信息,并在路由中进行处理.与之相反,promoteNetwork () 将路由器中处理好的信息传入输出端fifo中并发送数据包.

Figure 6
图 6 增加路由的取指单元伪代码 Figure 6 The pseudo-code of fetch unit with router


3 实验评估 3.1 仿真环境本文以M5-edge作为基础,在其基础上进行了分布式的取指令系统和分布式一级缓存系统的设计与实现.为了对所实现模型进行分析,基本参数配置如表 1所示.为了减少执行后端对性能的影响部分参数被设置成完美.在这种情况下,每周期执行的指令数 (IPC) 将会很好地反映取指令能力的变化对处理器性能的影响.

表 1
表 1 M5-edge模拟器仿真参数设置 Table 1 The parameter configuration of M5-edge 参数 配置

取指 分布式可变数量取指单元,每单元1 cacheline/cycle,每个cache行最多16条指令

映射 1 cycle延时,依据静态调度算法映射

分派 1 cycle延时

执行 16个分布式执行单元,每个单元单发射,单旁路宽度,功能单元延时周期:整型 (乘3、除20),浮点 (乘4、除12、平方24),其他1

递交 1 cycle延时

指令队列 分布式,每个执行单元中128个entry

操作数网络 2D-mesh 1hop/cycle

分支预测器 完美

断言 完美

一级cache 32KB,命中延时1周期

二级cache 2MB,命中延时12周期

调度方法 SPS方法



表 1 M5-edge模拟器仿真参数设置 Table 1 The parameter configuration of M5-edge


为了研究不同数量分布式取指令单元的性能影响,对2、4、8分布取指令单元进行了仿真.一级缓存总大小保持不变,固定为512 K,相应的2、4、8分布式的一级缓存大小为256 K、128 K、64 K.为了观察更明显趋势,部分仿真结果扩展到16分布取指单元.为验证模拟器性能变化,仿真平台采用经过扩展分布式取指令前段的M5-edge,分布式缓存系统仍为原有集总式实现方式.测试程序为SPEC CPU2000中TRIPS工具链可编译的18个整形和浮点程序,具体见表 2.

表 2
表 2 测试程序集列表 Table 2 The test benchmark details SPEC2000测试集 配置

整型程序 164.gzip,175.vpr,176.gcc,181.mcf,186.crafty,197.parser,253.perlbmk,255.vortex,256.bzip2,300.twolf

浮点程序 168.wupwise,171.swim,172.mgrid,173.applu,177.mesa,179.art,183.equake,188.ammp



表 2 测试程序集列表 Table 2 The test benchmark details


3.2 分布式取指性能评估采用固定单元取指令块头方式,以某一分布取指令模块作为唯一拥有取指令块块头能力的模块而专用,其他模块用作指令块其余部分取指使用,这种方式带来的好处是节省了其他取指单元的硬件资源,简化了设计难度.而不采用固定单元取块头的方式,将每个取指单元都增加相应硬件,以具备取指令块块头的功能,并在取指令块过程中循环设置,则可能会获得性能的提高.下面通过扩展后的M5-edge平台完成对两种方式的性能评估.

首先,在不考虑分布单元间通信的情况下,考虑两种实现方式的性能比较及相较于理想的集中式方式的变化.如图 7所示,在相同的较为理想的执行后端条件下,固定取指令块块头的方式在性能上较集中式方式在低数量分布单元情况下,性能相差较大,而当分布单元数量超过8时,性能基本持平.这是由于一个单元被专用于取指令块块头,而使得在取指单元较少情况下,进行取指令端口变少 (所有分布式情况均为8端口) 而引起,后面会通过同时在线指令数及cache miss率进行具体分析.

Figure 7
图 7 固定取指令块头方式与理想集总式取指单元性能比较 Figure 7 Performance comparison between fixed fashion and original fetch


图 8给出了两种取指令块头方式的性能比较.在所有情况下,循环设置方式具有更高达的性能,但性能差距随着分布单元数量的增加而减小,当数量增加到8时性能差距对于整型和浮点测试程序分别为0.66%和1.28%,循环设置方式所带来的好处已经并不明显.

Figure 8
图 8 固定取指令块头方式与循环设置方式性能比较 Figure 8 Performance comparison between fixed and round robin fashion


考虑cache miss的影响对于处理器分布式取指单元的设计来说是重要的,合适的cache大小将对处理器性能产生决定性的影响. 图 9和图 10分别给出了本文环境中处理器cache miss率随着分布式的二级cache大小的减少而产生的变化,其中512 K代表的是集总式的取指令结构,256 K则代表着两个分布取指单元,每个cache大小为256 K,以此类推,32 K代表着16个分布的取指令单元.

Figure 9
图 9 分布式cache大小与miss率关系 (整型) Figure 9 The relationship between cache size and miss rate (integer)


Figure 10
图 10 分布式cache大小与miss率关系 (浮点) Figure 10 The relationship between cache size and miss rate (float point)


整型程序cache miss率受cache尺寸变小影响更大.由图中纵坐标可以看出,两条曲线拐点出现的位置也并不相同,整型曲线出现在256 K和128 K间,也就是分布式单元超过4,cache miss率急剧上升,而浮点曲线则显示超过8时才会急剧上升.对于8分布的取指单元对比原有集总式结构,cache miss率在整型程序和浮点程序上分别上升了10.8倍和46.3倍,指数级增长的缺失率暗示了cache单元的尺寸不能过小,否则cache miss带来的性能损失将无法承受.在本文实验环境中,128 K的分布式二级cache大小可能更适合于分布的cache粒度.

考虑实际通信情况,增加路由网络,带来通信延迟,造成处理器性能下降,具体如图 11所示.随着取指单元数目增加,性能损失增加.对于整型SPEC2000测试程序来说,性能在2、4、8情况下分别下降11%、18%和38%,而对于浮点程序来说,性能分别下降了15%、17%和38%.相比于理想的集总式的取指令结构,增加通信路由后带来的性能下降是符合预期的.但分布式的取指令单元除了解决过大的集总结构无法实现的问题外,还具有潜在的性能提高的方式.将分布式的取指令单元与执行单元集成到一起,虽然取指时间相较集总式结构增加了,但是节省了指令分派时间,从而获得性能上的改善.但是,这种方式在以指令为粒度进行取指的处理器中很难实现,这是因为为了追求最优的性能,指令会被编译器安排到合理的处理单元,但是,每次取指令不是逐条进行,而是每次取出一个cache行,二次调度会浪费更多的资源和时间.目前,分布式取指单元与处理单元紧耦合结构基本上以线程或指令块为基本取指单位.而以指令为目标的分布式取指单元和执行单元则是分离的结构,比如TRIPS处理器.

Figure 11
图 11 循环取指增加路由网络后性能比较 Figure 11 Performance comparison between original fetch and round robin fashion (router)


4 结论对基于EDGE体系结构研究而设计的模拟平台M5-edge,进行了分布式取指令前段的设计,并对实现方式和重要参数进行分析. M5-edge可以实现理想的集总式取指令前段,也可以实现多种方式的分布式取指端设计.该模型既可以为基于EDGE的处理器后端微结构设计提供更精确和更灵活的取指令前段,也可以为基于前端的其他结构设计提供了基础.

通过对取指令端的整体功能、取指令单元和单元间互连网络的实现,完整介绍了分布式取指令前段的设计工作.通过仿真结果分析得到取指令块头的不同设计方法的适应性,并确认了在从理想集总式结构进行分布式实现所带来的网络延时和cache缺失所带来的损失.

本文聚焦于分布式取指前端的实现和由集总式进行分布化所带来的性能损失,缺少对分布式取指单元与指令执行单元的紧耦合设计,该方式可以部分弥补由于分布化而带来的性能损失.


参考文献
[1] CZECHOWSKI K, LEET V, GROCHIWHKI E, et al. Improving the energy efficiency of big cores[C]// ACM/IEEE 41st International Symposium on Computer Architecture (ISCA). Minneapolis: IEEE, 2014, 493-504.

[2]BUGER D, KECKLER K, MCKMLEY K S, et al. Scaling to the end of silicon with edge architectures[J].IEEE Computer, 2004, 37(7): 44-55.DOI: 10.1109/MC.2004.65

[3] ESMAEILZADEH H, BLEM, AMANT E. Dark silicon and the end of multicore scaling[C]//Proceeding of the 38th annual international symposium on Computer architecture. San Jose: IEEE, 2011:122-134.

[4]TORRELLAS J, CEZE L, TUCK J, et al. The bulk multicore architecture for improved programmability[J].Communications of the ACM, 2009, 52(12): 58-65.DOI: 10.1145/1610252

[5] SWANSON S, MICHESON K, SCHWERIN A, et al. Wavescalar[C]//Proceedings. 36th Annual IEEE/ACM International Symposium on Microarchitecture. San Jose: IEEE, 2003: 291-302.

[6]GEBHART M, MAHER B A, COONS K E, et al. An evaluation of the TRIPS computer system[J].Acm Sigplan Notices, 2009, 44(3): 1-12.DOI: 10.1145/1508284

[7]WAINGOLD E, TAYLOR M, SARKAR V, et al. Baring it all to software: the raw machine[J].IEEE Computer, 1990, 30(9): 86-93.

[8] SMITH J, GIBSON B, MACHER N, et al. Compiling for edge architectures[C]//The 4th International Symposium on Code Generation and Optimization. New York: IEEE, 2006:185-195.

[9] SANKARALINGARM K, NAGARAJAN R, MCDONAL R, et al. Distributed micro architectural protocols in the TRIPS prototype processor[C]//39th Annual IEEE/ACM International Symposium on Micro architecture. Orlando: IEEE, 2006:480-491.

[10] KIM C, SETHUMADHAVAN S, GOVINDAN M, et al. Compo-sable light weight processors[C]//40th Annual IEEE/ACM International Symposium on Microarchitecture. Chicago: IEEE, 2007: 381-394.

[11] ROBATMILI B, LI D, ESMAEILZADEH H, et al. How to implement effective prediction and forwarding for fusable dynamic multicore architectures[C]//19th IEEE International Symposium on High Performance Computer Architecture (HPCA). Shenzhen: IEEE, 2013:23-27.

[12] DURIC M, PALOMAR O, STANIC A, et al. Dynamic-vector execution on a general purpose EDGE chip multiprocessor[C]//IEEE International Conference on Embedded Computer Systems: Architectures, Modeling and Simulation. Samos Island: IEEE, 2014:18-25.

[13] GOU P, LI Q, JIN Y, et al. M5 based edge architecture modeling[C]//IEEE International Conference on Computer Design (ICCD). Amsterdam: IEEE, 2010: 289-296.

[14]BINKERT N L, DRESLINSKI R G, HSU L R, et al. The M5 simulator: modeling networked systems[J].IEEE Micro, 2006, 26(4): 52-60.DOI: 10.1109/MM.2006.82


相关话题/设计 结构 通信 空间 方案

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 前驱体温度对激光化学气相沉积YBa2Cu3O 7δ超导薄膜结构及性能的影响
    前驱体温度对激光化学气相沉积YBa2Cu3O7δ超导薄膜结构及性能的影响张琼1,赵培1,吴慰1,戴武斌1,GOTOTakashi2,徐源来3(1.等离子体化学与新材料湖北省重点实验室(武汉工程大学),武汉430205;2.东北大学金属材料研究所,沈阳160001;3.绿色化工过程省部共建教育部重点实 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 泡沫金属三明治结构压印-粘接复合接头剥离性能分析
    泡沫金属三明治结构压印-粘接复合接头剥离性能分析张杰,何晓聪,雷蕾,初明明,刘可欣,黄炎宁(昆明理工大学机电工程学院,昆明650500)摘要:为研究三明治结构压印-粘接复合接头的抗剥离性能,选取AA5052铝合金板以及泡沫镍、泡沫铜以及泡沫铁镍进行压印-粘接复合连接,对接头进行拉伸剪切试验,采用扫描 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 静不定结构的热应力分析
    静不定结构的热应力分析杨益航1,王德志2,林高用2(1.福建省功能材料及应用重点实验室(厦门理工学院),福建厦门361024;2.中南大学材料科学与工程学院,长沙410083)摘要:分析了受约束机构内材料热应力存在的危害,给出静不定结构内热应力的定量描述方式:弹性变形状态时,热应力仅与线膨胀系数、弹 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 铀铌合金结构及性能调控研究进展
    铀铌合金结构及性能调控研究进展蒙大桥,陈向林,陈冬,赵雅文,黄河,法涛(中国工程物理研究院材料研究所,四川绵阳621900)摘要:铀铌合金作为一种重要的核工程材料,因其较高的密度、优异的耐蚀性能和良好的力学性能等特点,被广泛应用于核工业领域。铀铌合金受成分及热处理工艺影响显著,表现出复杂的相转变和组 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 核壳结构纳米镁基复合储氢材料研究进展
    核壳结构纳米镁基复合储氢材料研究进展张秋雨1,2,3,邹建新1,2,3,任莉1,2,3,马哲文1,2,3,朱文1,2,3,丁文江1,2,3(1.上海交通大学轻合金精密成型国家工程研究中心,上海200240;2.上海交通大学材料科学与工程学院,上海200240;3.上海交通大学氢科学中心,上海2002 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 电冲击处理(EST)对TC11钛合金微结构和力学性能的影响研究
    电冲击处理(EST)对TC11钛合金微结构和力学性能的影响研究谢乐春1,2,刘畅1,2,华林1,2(1.现代汽车零部件技术湖北省重点实验室(武汉理工大学),武汉430070;2.汽车零部件技术湖北省协同创新中心(武汉理工大学),武汉430070)摘要:为寻求优化钛合金组织和力学性能的新思路,本文采用 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 高氮过饱和奥氏体表面改性层结构研究进展
    高氮过饱和奥氏体表面改性层结构研究进展车宏龙,王克胜,梁健,雷明凯(大连理工大学材料科学与工程学院表面工程实验室,辽宁大连116024)摘要:本文针对氮过饱和奥氏体改性层结构本质的研究现状,归纳了近年来国内外相关研究,重点阐述和总结了高氮过饱和奥氏体层的相结构、微结构,以及有序化结构3个方面的相关研 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • ECAP形变对高纯铝微结构及冲击层裂损伤的影响
    ECAP形变对高纯铝微结构及冲击层裂损伤的影响佘其海,李超,钟政烨(材料先进技术教育部重点实验室(西南交通大学),成都610031)摘要:在高应变率冲击载荷下,金属材料的主要失效方式之一是层裂损伤。为探讨微结构对层裂损伤的影响,本文利用等径角挤压(EqualChannelAngularPressin ...
    本站小编 哈尔滨工业大学 2020-12-05
  • UHMWPE初生态微观结构及不同成型条件下制品力学性能研究
    UHMWPE初生态微观结构及不同成型条件下制品力学性能研究胡逸伦1,2,3,赵文静1,2,3,李志1,2,3,夏晋程1,2,3,冯玲英1,2,3,沈贤婷1,2,3,洪尉1,2,3(1.聚烯烃催化技术与高性能材料国家重点实验室,上海200062;2.上海市聚烯烃催化技术重点实验室,上海200062;3 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 油气田污水储罐腐蚀性能模拟设计及试验研究
    油气田污水储罐腐蚀性能模拟设计及试验研究周勇1,周攀虎1,董会1,赵密锋2,孙良1,刘彦明1(1.西安石油大学材料科学与工程学院,西安710065,2.塔里木油田分公司,新疆库尔勒841000)摘要:为研究油气田污水对储罐腐蚀行为的影响,对储罐中污水进行腐蚀性能预测。模拟研究了温度、流速、压力以及p ...
    本站小编 哈尔滨工业大学 2020-12-05