删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于对偶单元法的三维集成微系统电热耦合分析

本站小编 Free考研考试/2021-12-29

摘要:随着三维集成微系统集成度和功率密度的提高, 同时考察电设计与热管理的多场耦合分析势在必行. 本文面向三维集成微处理器系统, 通过改进的对偶单元法(dual cell method, DCM)实现了系统的快速电热分析. 该方法通过引入泄漏功率、材料系数随温度的耦合, 相比于传统有限元法在更新以及组装本构矩阵上有更大的优势. 仿真验证表明, 本文所采用的算法相比传统有限元法仿真速度提升了约30%. 在考虑了材料系数以及泄露功率热耦合因素后, 系统热点温度相对于考虑耦合前上升了20.8 K. 最后采用本文所提出算法对三维集成微处理器系统进行布局研究, 比较了硅通孔阵列常规布局和集中布局在处理器核心下方两种布局方式对上下层芯片热点温度的影响, 研究了功率不均匀分配对两种布局的影响.
关键词: 三维集成微系统/
对偶单元法/
电热耦合/
有限元法

English Abstract


--> --> -->
目前三维集成技术是延续摩尔定律引领集成电路发展走向后摩尔时代的有力解决方案[1]. 三维集成微系统具有高集成度、微小型化、低功耗、高可靠性和高效率等优点, 在逻辑计算处理、成像传感和光集成等方面具有广阔的应用前景. 但是三维集成技术同时导致了微系统内单位面积上产生的热功耗急剧增加. 以处理器芯片为例, 目前CPU的功耗密度达到了100 W/cm2以上[2], 功率密度的增加和功率的不均匀分布共同导致了严重的热问题. 而这些热问题反之对诸如泄露电流、电迁移、信号和电源完整性等电设计提出了诸多挑战. 其中泄漏功率是目前处理器性能的最重要限制因素之一, 对于65 nm及更先进的工艺节点, 泄漏功率占总功率的10%以上[3]. 泄漏功率与温度呈指数关系, 因此泄漏功率将导致处理器发热并进一步增加泄漏功率本身. 随着温度的变化, 在传热过程中材料的热导率会发生改变, 从而对热点温度产生影响[4]. 综上所述, 对高功耗三维集成微系统在设计初期进行电热耦合分析在确保系统可靠性方面具有至关重要的作用.
有限元法(finite element method, FEM)由于在复杂几何形状、材料建模方面具有极好的适应性和精度, 因此常被用于电热耦合的分析研究[5-11]. 为了使该算法更适于三维集成微系统分析, 在算法改进方面开展了诸多研究工作. Lin等[12,13]提出了一种芯片级泄漏感知方法, 采用交替方向隐式法结合芯片功率、工作频率和电源电压之间的各种电热耦合, 预测芯片热分布. 该方法采用了等距网格, 这虽然提升了计算速度, 但也同时导致精度下降. 北京大学的Pi等[14]提出了一种快速的3D-IC热管理全芯片规模数值模拟方法, 该法同时考虑了横向和纵向散热的紧凑型热阻网络, 充分分析了硅通孔(through silicon via, TSV)、微凸块和再分布层中的高导热路径. 然而该研究所用的热阻网络无法获得十分准确的温度场, 并且未考虑温度带来的耦合因素. Chai等[15]开发了径向点插值法, 并对TSV阵列进行了电热耦合特性研究, 提高计算效率并降低了存储成本, 加快了基于TSV的3-D IC的电热设计. 但是这项工作目前仅集中在TSV模型上, 还无法对整个三维微系统进行分析. Wang等[16]提出了一种动态线性泄漏电流感知的全芯片热估计方法. 该算法将非线性热模型转换为多个局部线性热模型, 并设计了一种自适应降阶法以提高效率. 但线性泄露电流仅能运用于瞬态仿真迭代, 无法在稳态迭代中使用.
针对以上研究中存在的问题, 本文提出了一种能够快速计算电热耦合的改进对偶单元法(dual cell method, DCM). 该方法在考虑了泄漏功率、材料系数与温度的耦合关系的前提下, 将整体本构矩阵分解为常数矩阵和温变矩阵的乘积, 使得在每次温变迭代过程中只需计算温变矩阵. 对比传统FEM中的单元传热矩阵, 改进DCM的温变矩阵拥有更低的阶数, 在计算量和整体矩阵的组装上有着显著优势. 通过仿真验证了在相同自由度下, 改进DCM比传统FEM具有更快的计算速度. 最后面向三维集成微处理器系统基于改进的DCM对其进行了电热耦合分析, 并根据分析结果进行布局优化指导, 对三维集成微系统的设计优化具有一定的参考价值.
2
2.1.DCM原理
-->对偶单元法是一种基于传统FEM发展的代数方法, 通过FEM的网格剖分, DCM可以不通过微分方法而直接根据问题的物理场以及基本的几何和拓扑概念定义数值方案, 从而该算法更适用于实现快速计算[17,18]. DCM首先通过网格剖分得到初始单元, 并根据规则构造对偶单元. 之后通过单元对应关系及本构关系分别构造拓扑矩阵和本构矩阵, 最后组成线性方程组进行求解.
DCM求解传热问题的计算流程如图1所示, 单元节点上的温度T通过拓扑算子矩阵G表示成单元边上的温差γ. 然后通过本构关系利用温差计算出对偶面上的热通量$\varPhi $, 最后再将热通量通过拓扑算子矩阵D转化成对偶体上的整体发热量q.
图 1 DCM求解传热问题流程图
Figure1. Flow chart of DCM solving heat transfer problem.

图2所示, DCM根据四面体单元的重心、4个面的重心和6个边中点的连线构建对偶空间[19,20]. 在单个四面体中, 每条边对应着一个对偶面, 如e2对应S2, 每个顶点对应三个对偶面, 如A对应S2, S3, S6. 在单个顶点接触的所有四面体中, 对应该点的所有对偶面构成对偶单元.
图 2 对偶单元构建过程
Figure2. The process of dual unit construction.

对于传热问题的研究, 首先定义节点温度列阵T, 获得以节点温度之间的差值作为边${e_i}$的温差列阵. 温差列阵γ可表示为
$ \begin{split}{{\mathit{\boldsymbol{\gamma}}}} =\;& {{\mathit{\boldsymbol{GT}}}} = ( {{T_1} - {T_2}}\quad{{T_1} - {T_3}}\quad{{T_1} - {T_4}}\quad\\ &{{T_2} - {T_3}}\quad{{T_2} - {T_4}}\quad{{T_3} - {T_4}} )^{\rm{T}}, \end{split}$
其中拓扑算子矩阵${{\mathit{\boldsymbol{G}}}} = \left( {\begin{array}{*{20}{c}} 1&{ - 1}&0&0 \\ 1&0&{ - 1}&0 \\ 1&0&0&{ - 1} \\ 0&1&{ - 1}&0 \\ 0&1&0&{ - 1} \\ 0&0&1&{ - 1} \end{array}} \right)$, 矩
G表示了两个节点的关系, 在矩阵G中每行对应于一条边, 每列对应一个节点. 节点温度列阵${{\mathit{\boldsymbol{T}}}} = {\left( {\begin{array}{*{20}{c}} {{T_1}}&{{T_2}}&{{T_3}}&{{T_4}} \end{array}} \right)^{\rm{T}}}$.
同时两个节点间的温差${{\mathit{\boldsymbol{\gamma}}}} $也可以由单元温度梯度g和边向量L表示:
${\gamma _{\rm{i}}}{{ = }}\int_{{\mathit{\boldsymbol{L}}}} {\nabla T \cdot } {\rm{d}}{{\mathit{\boldsymbol{l}}}}{{ = }}{{\mathit{\boldsymbol{g}}}} \cdot {{{\mathit{\boldsymbol{L}}}}_i}{{ = }}\frac{{\partial T}}{{\partial x}}{l_{ix}} + \frac{{\partial T}}{{\partial y}}{l_{iy}} + \frac{{\partial T}}{{\partial z}}{l_{iz}},$
${{\mathit{\boldsymbol{\gamma}}}} = {[\begin{array}{*{20}{c}} {{\gamma _1}}&{{\gamma _2}}&{{\gamma _3}}&{{\gamma _4}}&{{\gamma _5}}&{{\gamma _6}} \end{array}]^{\rm{T}}} = {{\mathit{\boldsymbol{L}}}} \cdot {{\mathit{\boldsymbol{g}}}}.$
根据傅里叶定律, 热通量$\varPhi $的表达式为
$\varPhi = \int_{\tilde S} {{\mathit{\boldsymbol{q}}}} \cdot {\rm{d}}{{\mathit{\boldsymbol{S}}}} = - {{\mathit{\boldsymbol{J}}}} \cdot \tilde{{\mathit{\boldsymbol{S}}}} = - k \cdot {{\mathit{\boldsymbol{g}}}} \cdot \tilde{{\mathit{\boldsymbol{S}}}},$
其中k为热导率; J为热流密度; $\tilde{{\mathit{\boldsymbol{S}}}}$表示对偶面的面积向量, 方向垂直于对偶面. 结合(1)式、(3)式和(4)式可得四面体内部对偶面的热通量矩阵${{\mathit{\boldsymbol{\varPhi}}}} $
${{\mathit{\boldsymbol{\varPhi}}}} = - k \cdot \tilde{{\mathit{\boldsymbol{S}}}}{{\mathit{\boldsymbol{P}}}}{{\mathit{\boldsymbol{\gamma }}}} = - {{\mathit{\boldsymbol{M\gamma}}}} ,$
其中P$\left( {{{{\mathit{\boldsymbol{L}}}}_{1, 3 \times 3}}^{ - 1}}\;\;{{{{\mathit{\boldsymbol{L}}}}_{2, 3 \times 3}}^{ - 1}} \right)/2$, ${{{\mathit{\boldsymbol{L}}}}_{1, 3 \times 3}}$, ${{{\mathit{\boldsymbol{L}}}}_{2, 3 \times 3}}$为边矩阵的分块阵; M为传热问题的本构矩阵.
对于整体网格来说, 将所有对偶面上的热通量相加即为整体节点载荷列阵q:
${{\mathit{\boldsymbol{q}}}} = {{\mathit{\boldsymbol{D\varPhi}}}} .$
D为拓扑矩阵G转置的负矩阵即${{\mathit{\boldsymbol{D}}}} = - {{{\mathit{\boldsymbol{G}}}}^{\rm{T}}}$. 结合(1)式、(5)式和(6)式可得整体传热方程为
${{{\mathit{\boldsymbol{G}}}}^{\rm{T}}}{{\mathit{\boldsymbol{MGT}}}} = {{\mathit{\boldsymbol{q}}}}.$

2
2.2.改进的DCM耦合分析
-->随着功率密度不断增加, 芯片的整体温度不断上升, 所以对温度上升导致的耦合分析变得至关重要.
由下式可知泄漏功率与泄漏电流成正比, 其中泄漏电流${I_{\rm{leak}}}$分为亚阈值泄漏电流${I_{\rm{sub}}}$和栅极泄漏电流${I_{\rm{gate}}}$:
${P_{\rm{leak}}} = {V_{\rm{dd}}}{I_{\rm{leak}}} = {V_{\rm{dd}}} \cdot \left( {{I_{\rm{sub}}} + {I_{\rm{gate}}}} \right),$
其中栅极泄漏电流${I_{\rm{gate}}}$对温度并不敏感.
对于BSIM 4的MOSFET晶体管模型, 其亚阈值电流公式为(${V_{\rm{ds}}}\gg$${V_t}$)
${I_{\rm{sub}}}\left( T \right)=K{V_{\rm{T}}}^2{{\rm{e}}^{\tfrac{{{V_{\rm{GS}}} - {V_{\rm{th}}}}}{{\eta {V_{\rm{T}}}}}}}\Big( {1-{{\rm{e}}^{\tfrac{{ - {V_{\rm{ds}}}}}{{{V_{\rm{T}}}}}}}} \Big) \approx K{V_{\rm{T}}}^2{{\rm{e}}^{\tfrac{{{V_{\rm{GS}}} - {V_{\rm{th}}}}}{{\eta {V_{\rm{T}}}}}}},$
其中K$\eta $为相关工艺参数; ${V_{\rm{T}}}$为热电压, 与温度成正比; ${V_{\rm{th}}}$为阈值电压.
另外, 材料的热导率是与温度相关的函数, 同时材料的温度变化可以通过温度的插值函数表示, 可得热导率公式如下:
$k\left( T \right) = \sum\limits_0^4 {{c_n}{T^n}},\;\;{T_0} \leqslant T \leqslant {T_1},$
其中${c_n}$为插值系数, 具体数值参考文献[4,10].
引入耦合项${I_{\rm{sub}}}\left( T \right)$, $k\left( T \right)$后, (7)式的整体传热方程可改写为与温度相关的形式:
${{{\mathit{\boldsymbol{G}}}}^{\rm{T}}}{{\mathit{\boldsymbol{M}}}}\left( {k\left( T \right)} \right){{\mathit{\boldsymbol{GT}}}} = {{\mathit{\boldsymbol{q}}}}\left( {{I_{\rm{sub}}}\left( T \right)} \right).$
由(11)式可知, 在每次温度迭代计算时, 需要重新计算每个单元的本构矩阵${{\mathit{\boldsymbol{M}}}}\left( {k\left( T \right)} \right)$和载荷列阵${{\mathit{\boldsymbol{q}}}}\left( {{I_{\rm{sub}}}\left( T \right)} \right)$并重新组装. 对于DCM, 每个单元本构矩阵M为6 × 6的矩阵, 相比于有限元4 × 4的传热矩阵K计算量更大, 组装时间更长. 因此本文对DCM的整体传热方程做了进一步的改进. (5)式中的本构矩阵${{\mathit{\boldsymbol{M}}}}\left( {k\left( T \right)} \right)$可以分解为
${{\mathit{\boldsymbol{M}}}}\left( {k\left( T \right)} \right) = k\left( T \right) \cdot \tilde{{\mathit{\boldsymbol{S}}}}{{\mathit{\boldsymbol{P}}}} = \tilde{{\mathit{\boldsymbol{S}}}}(k\left( T \right){{\mathit{\boldsymbol{P}}}}).$
由(1)式可知在一个四面体单元中通过任意三条边的温差$ {\gamma }_{\rm{1}}, {\gamma }_{\rm{2}}, {\gamma }_{\rm{3}}$可以计算得到另外三条边的温差. 同时由(3)式可知, 求解列矩阵${{{\mathit{\boldsymbol{g}}}}_{3 \times 1}}$所需要的条件为矩阵L满秩, 所以只需要三个互不相关的边向量即可表示列阵${{{\mathit{\boldsymbol{g}}}}_{3 \times 1}}$
${{{\mathit{\boldsymbol{g}}}}_{3 \times 1}} = {\left[ {\begin{array}{*{20}{c}} {{l_{1x}}}&{{l_{2x}}}&{{l_{3x}}} \\ {{l_{1y}}}&{{l_{2y}}}&{{l_{3y}}} \\ {{l_{1z}}}&{{l_{2z}}}&{{l_{3z}}} \end{array}} \right]^{ - 1}} \cdot \left[ {\begin{array}{*{20}{c}} {{\gamma _{\rm{1}}}} \\ {{\gamma _{\rm{2}}}} \\ {{\gamma _{\rm{3}}}} \end{array}} \right].$
为了满足本构矩阵M的维度, 温差列阵γ可以由三个温差与三个0元构成, 边矩阵L可由三个边向量和3 × 3的零方阵表示:
${{\mathit{\boldsymbol{\gamma}}}} = {\left( {\begin{array}{*{20}{c}} {{\gamma _1}}&{{\gamma _2}}&{{\gamma _3}}&0&0&0 \end{array}} \right)^{\rm{T}}},$
${{\mathit{\boldsymbol{L}}}} = {\left( {\begin{array}{*{20}{c}} {{l_{1x}}}&{{l_{2x}}}&{{l_{3x}}}&0&0&0 \\ {{l_{1{\rm{y}}}}}&{{l_{2y}}}&{{l_{3y}}}&0&0&0 \\ {{l_{1z}}}&{{l_{2z}}}&{{l_{3z}}}&0&0&0 \end{array}} \right)^{\rm{T}}}.$
此时矩阵P$\left( {\begin{array}{*{20}{c}} {{l_{3 \times 3}}^{ - 1}}&{{O_{3 \times 3}}} \end{array}} \right)$, 有效数据减少为9个. 梯度阵g可表示为
${{\mathit{\boldsymbol{g}}}} = {{\mathit{\boldsymbol{P\gamma}}}} .$
最终可得整体传热方程为
$ {{{\mathit{\boldsymbol{G}}}}^{\rm{T}}}\tilde{{\mathit{\boldsymbol{S}}}}(k( T ){{\mathit{\boldsymbol{P}}}}){{\mathit{\boldsymbol{GT}}}} = {{{\mathit{\boldsymbol{G}}}}_S}{{{\mathit{\boldsymbol{P}}}}_k}(T){{\mathit{\boldsymbol{GT}}}} = {{\mathit{\boldsymbol{q}}}}\left( {{I_{\rm{sub}}}( T )} \right),$
其中${{{\mathit{\boldsymbol{G}}}}_S} = {{{\mathit{\boldsymbol{G}}}}^{\rm{T}}}\tilde{{\mathit{\boldsymbol{S}}}}$; ${{{\mathit{\boldsymbol{P}}}}_k}\left( T \right) = k\left( T \right){{\mathit{\boldsymbol{P}}}}$; ${{{\mathit{\boldsymbol{G}}}}_S}$G矩阵均可在获得网格信息后计算得出, 且不随温度变化. 此时, 每次温度更新仅计算${{{\mathit{\boldsymbol{P}}}}_k}\left( T \right)$即可, 而${{{\mathit{\boldsymbol{P}}}}_k}\left( T \right)$在单个网格单元迭代计算时只需要完成3 × 3个数据的计算和组装, 相比于FEM的4 × 4个数据有着明显的优势. 并且对于同一网格模型的研究, 每次只需计算G$\tilde{{\mathit{\boldsymbol{S}}}}$矩阵一次就可以应用于不同边界条件的求解.
算法的整体耦合迭代流程如图3所示, 首先根据划分的网格信息计算拓扑矩阵${{{\mathit{\boldsymbol{G}}}}_S}$G, 根据给定的初始温度计算初始状态下的亚阈值泄漏电流和热导率, 并带入计算本构矩阵${{{\mathit{\boldsymbol{P}}}}_k}(T)$和节点载荷${{\mathit{\boldsymbol{q}}}}\left( {{I_{\rm{sub}}}\left( T \right)} \right)$. 下一步将本构矩阵和载荷带入传热方程计算出该迭代步的温度场分布${{{\mathit{\boldsymbol{T}}}}_{{\rm{new}}}}$. 根据计算的温度场更新本构矩阵和节点载荷, 并带入传热方程计算新的温度场分布, 直到两步迭代的结果小于设定的迭代截止精度tol.
图 3 迭代算法流程图
Figure3. Flow chart of Iteration scheme.

本节采用改进的对偶单元法研究三维集成微处理器系统在耦合情况下的温度分布, 讨论不同I/O端口和TSV阵列布局对叠层芯片热点温度的影响. 图4所示为参考三星DRAM和Intel i7处理器芯片构成的两层堆叠微系统结构示意图[21]. 两层芯片的尺寸均为10 mm × 10 mm, 衬底的尺寸为20 mm × 15 mm, 热沉的尺寸为40 mm × 35 mm. 芯片层的厚度为100 μm, 带C4凸块的TIM层厚度为100 μm, 带微凸块的TIM层厚度为40 um. 初始温度和环境温度为293 K, 热对流系数为100 W·m–2·K–1. DRAM和处理器的版图布局如图5所示, 其中DRAM被分为8个Bank区, 处理器芯片由4个Core构成(从左到右分别记为Core1, Core2, Core3, Core4). 在DRAM芯片的I/O区域中均匀分布了16 × 80个TSV. 为了能直观表征Core区和Bank区的温度, 选取如图5中所示的黑色虚线为观察芯片温度分布的基准线. 根据DRAM和处理器的典型工作状态, 本文在仿真中将DRAM的工作功率设为2.82 W, 处理器工作功率设36 W, 其中四个核的总功率为26.5 W, 整个微系统泄漏功率占比为12%[3,21].
图 4 三维集成微处理器系统结构示意图
Figure4. Schematic diagram of the three-dimensional integrated microprocessor system.

图 5 工作区域分布图 (a) DRAM芯片; (b) Intel i7处理器芯片
Figure5. Work area distribution map: (a) DRAM; (b) processor.

2
3.1.改进的DCM准确性验证
-->在保证精度的前提下为了降低仿真复杂度, 采用等效模型法对TSV阵列进行了等效处理, 通过插值法获得等效区域各向异性的热导率[22]. 当处理器4个核心功率均匀分布时, 处理器和DRAM芯片上观察基准线上的温度分布分别如图6所示. 当不考虑电热耦合时, FEM求解得出的处理器和DRAM芯片的热点温度分别为351.83 K和346.64 K, DCM求解得出的处理器和DRAM芯片的热点温度分别为351.83 K和346.63 K. 改进的DCM与FEM获得的温度曲线几乎完全吻合, 有着良好的一致性. 在考虑电热耦合时, 发现用改进的DCM与FEM仿真得到的处理器芯片与DRAM芯片的热点温度为分别为373.64, 374.07 K和365.87, 366.24 K, 改进的DCM仿真相比于传统FEM误差仅为0.53%和0.51%(仿真后温度与初始温度的差值进行误差计算, 下文同), 其精度满足应用要求.
图 6 不考虑耦合与考虑耦合时芯片温度分布 (a) DRAM; (b) 处理器
Figure6. Chip temperature distribution without considering coupling and considering coupling: (a) DRAM; (b)processor.

对比考虑电热耦合前后的仿真结果, 发现在考虑电热耦合因素之后两个芯片的平均温度均提高了约20 K. 这是因为随着工作温度的上升, 芯片泄漏功率急剧增大, 这使得芯片发热量进一步增大, 形成温度正反馈循环, 这是影响三维集成微系统工作温度的主要因素. 同时材料的热导率会随着温度的升高而降低, 使得结构的导热性能变差, 从而使得温度再度升高, 因此在三维集成微系统的设计过程中, 综合考虑电热耦合对系统可靠性的影响是十分必要的, 否则存在低估系统工作温度的风险.
表1所列为将FEM和改进DCM应用于分析三维集成微系统的仿真时间对比情况. 仿真中均使用相同的网格信息, 因此求解自由度相同. 在不考虑电热耦合时, 两者仿真时间相近. 而在考虑电热耦合后, 进行了5次仿真迭代计算, 改进的DCM在更新计算组装新的本构矩阵方面其计算量更有优势. 并且改进的DCM在不考虑耦合时已经根据网格信息计算得到了拓扑矩阵, 所以在进行耦合迭代计算时不需再次计算拓扑项, 进一步提高了仿真效率. 综上所述, 改进的DCM仿真速度要明显优于传统FEM, 将仿真时间提升了约32.0%.
耦合情况仿真方法仿真时间仿真自由度
不考虑耦合FEM60 S416941
改进DCM55.3 S
电热耦合FEM154 S
改进DCM104.7 S


表1FEM与改进DCM的仿真时间对比
Table1.Simulation time comparison between FEM and improved DCM.

2
3.2.三维集成微系统的布局分析
-->在三维集成电路中, 由于具有高热导率的TSV阵列是温度传导的重要路径, 因此I/O端口中的TSV阵列常被作为重要的散热手段, 而TSV阵列的Core-布局方式通常被认为能够有效的降低系统的热点温度[23]. Core-布局的具体布局方式如图7(b)所示, 即将DRAM芯片中I/O区域的TSV阵列布局位置对应上层处理器芯片4个Core的位置. 在以往的研究中采用Core-布局结构的上下层芯片功率相近, 使得两层芯片的温度变化连续, 因此能够使得上下层芯片的热点温度同时下降[23,24]. 而本文所考察的微处理器系统工作状态中处理器功率远大于DRAM的功率, 并且上下层芯片的热点温度相差接近8 K, 因此有必要重新评估Core-布局的可行性.
图 7 两种不同的TSV阵列布局 (a) 常规布局; (b) Core-布局
Figure7. Two different TSV array layouts: (a) Conventional layout; (b) core layout.

为了比较两种布局的温度分布, 首先将处理器的四个Core功率设置为均匀分布, 采用改进的DCM对两种布局结构进行电热耦合仿真分析. 如图8所示采用Core-布局结构时, 处理器芯片的热点温度下降了2.20 K. 而与此同时图9所示DRAM芯片的热点温度为370.93 K, 相比3.1节仿真得到的常规布局热点温度上升了4.30 K. 这是由于TSV阵列作为重要散热路径, Core-布局结构会将处理器高功率Core区域产生的热量传导到下层, 使得处理器芯片温度下降的同时让DRAM芯片的整体温度上升. 对比TSV阵列常规布局的情况, Core-布局使得处理器芯片热点温度下降2.73%, 而使得DRAM芯片的热点温度上升5.85%. 考虑到高温会导致DRAM的晶体管电荷损失加快, 使得数据丢失. 因此在选择布局方式时, 需要综合考虑处理器芯片的降温情况与DRAM芯片的升温情况.
图 8 两种不同TSV阵列布局时处理器的温度分布
Figure8. Temperature distributions of processors with two different TSV arrays.

图 9 Core-布局时DRAM温度分布图
Figure9. DRAM temperature distributions in core-layout.

在实际工作中, 多核处理器芯片在执行事务时各个Core会工作在不同功率下, 因此有必要结合不同的Core功率分配情况, 对两种布局结构的热分布对功率配比的敏感度进行分析. 图10给出了几种典型的Core功率分配情况, 4个Core的总功率值保持为26.5 W, 其中Case1为大功率事务集中在单侧两个Core, Case2为大功率事务交错分布, Case3为大功率集中在外侧Core, Case4为大功率事务集中在中间两个Core, Case5为外侧单个Core大功率工作, Case6为内侧单个Core大功率工作.
图 10 典型Core功率分配情况
Figure10. Typical core power allocation.

基于本文所提出的改进DCM对不同功率分配情况下的DRAM和处理器芯片的热点温度进行了统计分析. 几种情况仿真时间如表2所列, 在对两种布局的仿真分析中, 改进的DCM与传统FEM相比仿真速度提升了约30%.
布局方式改进的DCM法仿真时间/sFEM平均时间/s自由度
Case1Case2Case3Case4Case5Case6
常规布局105.6106.1106.0105.7107.2104.8152.2416941
Core布局100.9105.6102.6101.4101.9100.3144.9404345


表2不同功率分配时仿真时间
Table2.Improving simulation time of DCM and FEM with different power allocation.

结合图11图12的统计结果, 发现处理器芯片在内侧核高功率的Case6下热点最高, 功率均匀分配时热点温度最低. DRAM芯片在Case1下的热点温度最高, 功率均匀分配时的热点温度最低. 由此可见在Core功率分布不均匀时会加剧热点问题, 因此处理器工作时应尽量保持各核功率分布均匀能有效降低整个微系统的热点温度. 同时发现单侧两个Core处理大功率事务的Case1以及单核处理大功率事务的Case5, Case6情况下, 整个微系统的热点温度均会显著升高, 因此在系统设计时应尽量避免这种情况.
图 11 不同功率分配下处理器芯片最高温度
Figure11. Maximum temperature of processor chip under different power allocation.

图 12 不同功率分配下DRAM芯片最高温度
Figure12. Maximum temperature of DRAM chip under different power allocation.

在不同功率配比的情况下, TSV阵列Core-布局对比常规布局的处理器芯片降温与DRAM芯片升温情况如表3所列. 可以看出当Core功率不均匀分布时, Core-布局对处理器芯片的降温效果与功率均匀分布时相比有提升, 同时也加剧了DRAM芯片的升温. 比较功率均匀分布与降温最多的Case5, 处理器芯片降温效果提升了42.27%, 而DRAM芯片的升温上升了82.52%. 因此Core-布局在功率不均匀分布时, DRAM芯片会受到更大影响. 在设计三维集成微处理器系统时, 若要降低整体系统的热点温度, 在采用Core-布局时需要考虑到DRAM芯片能工作在容限温度内. 若要降低DRAM芯片热点温度, 则需要将TSV阵列即I/O端口布局在远离Core的区域.
温度变化均匀Case1Case2Case3Case4Case5Case6
处理器降温/K2.202.822.252.252.823.132.90
DRAM升温/K4.296.695.776.126.097.837.88


表3不同功率分配下Core-布局相比于常规布局的芯片温度变化
Table3.Chip temperature change of core layout compared with conventional layout under different power allocation.

本文针对三维集成微系统的电热耦合问题提出了一种改进的DCM算法. 基于三维集成微处理器系统对所提算法进行了仿真验证, 并对微系统的布局设计、功率分配进行了分析讨论. 研究表明: 本文提出的改进DCM能快速准确地对三维集成微系统实现建模计算, 在分析电热耦合问题方面具有显著的时间优势; 在考虑电热耦合因素后, 微系统泄漏功耗上升, 材料热导率下降, 热点温度对比耦合前上升约20 K, 表明了对三维集成微系统进行电热耦合分析的必要性; 在微系统布局设计方面, TSV阵列的Core-布局虽然能够降低处理器芯片的热点温度, 但却同时恶化了DRAM芯片的热点问题, 在Core功率不均匀分配时影响尤为严重. 因此在系统设计时, 要综合考虑处理器和DRAM芯片的容限温度来确定TSV阵列布局方案. 综上所述, 本文提出的算法能快速分析三维集成微系统的电热耦合问题, 实现系统热点预测, 为微系统芯片布局设计提供理论指导.
相关话题/系统 计算 传热 工作 设计

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 小液滴撞击壁面传热特性数值分析
    摘要:小液滴撞击壁面现象在喷雾冷却等领域都有广泛应用.为研究小液滴(微米)撞击热壁面(非沸腾区)传热过程,建立了二维液滴撞壁瞬态模型,并采用相场方法对小液滴换热过程中对流热通量和导热热通量的大小进行了对比.研究结果表明:液滴撞击壁面初期形成“冷斑”,有利于小液滴与壁面的传热;小液滴撞击壁面过程中热通 ...
    本站小编 Free考研考试 2021-12-29
  • 铝基薄膜忆阻器作为感觉神经系统的习惯化特性
    摘要:感觉神经系统可在外界刺激与生物体反应之间建立联系.感觉神经系统中的最小单位神经元可直接将外界刺激传递至中枢神经,再由中枢神经通过控制和调节生物体对外界刺激作出反应.神经突触连接了相邻神经元进行脉冲信息传递功能.习惯化是神经突触在信息传递中过滤外界无关信息时的一个基本特性,可以让感觉神经系统更快 ...
    本站小编 Free考研考试 2021-12-29
  • 外加横向电场作用下石墨烯纳米带电子结构的密度泛函紧束缚计算
    摘要:采用基于密度泛函理论的紧束缚方法计算研究了外加横向电场对边缘未加氢/加氢钝化的扶手椅型石墨烯纳米带的电子结构及电子布居数的影响.计算结果表明,石墨烯纳米带的能隙变化受其宽带影响.当施加沿其宽度方向的横向外加电场时,纳米带的能带结构及态密度都会产生较大的变化.对于具有半导体性的边缘未加氢纳米带, ...
    本站小编 Free考研考试 2021-12-29
  • 高能质子在散裂靶中的能量沉积计算与实验验证
    摘要:高能质子在散裂靶中的能量沉积是散裂靶中子学研究的重要内容之一,准确掌握高能质子在散裂靶中引起的能量沉积分布与瞬态变化是开展散裂靶热工流体设计的重要前提.本文采用MCNPX,PHITS与FLUKA三种蒙特卡罗模拟程序,计算并比较了高能质子入射重金属铅靶、钨靶的能量沉积分布及不同粒子对总能量沉积的 ...
    本站小编 Free考研考试 2021-12-29
  • 自由分子区内纳米颗粒的热泳力计算
    摘要:基于非平衡态分子动力学模拟方法,研究了自由分子区内纳米颗粒的热泳特性.理论研究表明,纳米颗粒与周围气体分子之间的非刚体碰撞效应会明显地改变其热泳特性,经典的Waldmann热泳理论并不适用,但尚未有定量的直接验证.模拟计算结果表明:对于纳米颗粒而言,当气-固相互作用势能较弱或气体温度较高时,气 ...
    本站小编 Free考研考试 2021-12-29
  • Duffing系统的主-超谐联合共振
    摘要:非线性动力系统极易发生共振,在多频激励下可能发生联合共振或组合共振,目前关于非线性系统的主-超谐联合共振的研究少见报道.本文以Duffing系统为对象,研究系统在主-超谐联合共振时的周期运动和通往混沌的道路.应用多尺度法得到系统的近似解析解,并利用数值方法对解析解进行验证,结果吻合良好.基于L ...
    本站小编 Free考研考试 2021-12-29
  • 四稳系统的双重随机共振特性
    摘要:提出了一类8次势函数并讨论了其分岔特性,得到由左、右2个小尺度双稳势和中间势垒构成的对称四稳系统.建立了在周期力和随机力共同作用下四稳系统输出响应的近似解析表达式,并从能量角度引入功这一过程量来刻画大、小不同尺度双稳势之间的作功能力,发现四稳势中存在着双重随机共振现象.理论分析与数值仿真结果表 ...
    本站小编 Free考研考试 2021-12-29
  • 深紫外双层金属光栅偏振器的设计与分析
    摘要:193nm波长浸没式步进扫描投影光刻机是实现45nm及以下技术节点集成电路制造的核心装备.增大数值孔径是提高光刻分辨率的有效途径,而大数值孔径曝光系统的偏振性能严重影响光刻成像质量.光刻机曝光系统偏振参数的高精度检测是对其进行有效调控的前提.基于光栅的偏振检测技术能实现浸没式光刻机偏振检测装置 ...
    本站小编 Free考研考试 2021-12-29
  • 基于拟沸腾理论的超临界CO<sub>2</sub>管内传热恶化量纲分析
    摘要:超临界流体广泛应用于工程技术领域,其流动传热特性对工程设计具有重要意义,但是,由于超临界流体的物理微观和宏观行为的机理尚不清晰,所以其异常的流动传热特性并未得到很好的解决.普遍认为超临界流体在分子尺度上可分为类气和类液两种不同的特性,直到最近通过实验在宏观上监测到超临界水类液和类气之间的转变, ...
    本站小编 Free考研考试 2021-12-29
  • 一种用于Z箍缩实验的软X射线成像系统
    摘要:基于塑料闪烁体转换和光学条纹相机的方法建立了一套用于Z箍缩实验中的软X射线条纹图像诊断系统,解决了以往实验中使用的X射线条纹相机易被电磁环境干扰以及相机电极部件易被实验产生的高速粒子损伤的问题.诊断系统的光谱响应范围主要集中在0.2—10keV,系统的空间分辨率经过理论评估小于120μm,通过 ...
    本站小编 Free考研考试 2021-12-29