基于图形处理器加速数值求解三维含时薛定谔方程

全文HTML

--> --> -->

1.引　言

强场激光物理是过去二十多年随着超短强激光技术的发展而快速发展起来的前沿学科, 主要研究超强超短激光与电子的相互作用. 早在1917年, 爱因斯坦的辐射理论就提出了受激辐射的基本概念, 预测到光可以产生受激辐射. 直至1960年, 世界上第一台激光器诞生, 此后的几十年间激光技术飞速发展, 从自由输出到调Q技术(Q-switch)、锁模技术(mode locking), 再到啁啾脉冲放大技术, 激光的脉冲宽度越来越短, 功率越来越大. 利用先进激光技术获得的超快强激光脉冲与物质相互作用, 成为了研究物质基本性质的一种重要手段. 其中, 强场中一些非线性现象, 如高次谐波的产生(HHG)^[1-5]、次序和非次序双电离^[6-8]等, 受到了广泛的关注.
强场激光物理的主要理论方法是数值求解含时薛定谔方程(TDSE)^[9-11]、强场近似(SFA)^[12-14]和半经典模型^[15-17]. 求解三维含时薛定谔方程得到的结果可以认为相当于发生在数值上的实验. 但是求解三维含时薛定方程并非一项简单的任务, 无法获得解析解, 只能借助计算机数值求解. 在直角坐标系下哈密顿算符的表示很直观, 但由于正交网格在三个维度上均较为致密, 因此对存储空间和计算量的需求十分巨大. 而在球极坐标系中只有径向网格较为致密, 另外两个维度相对稀疏. 尽管如此, 求解三维含时薛定谔方程的计算量也是十分巨大. 为了缩短计算的时间, 更快地得到计算结果, 就有必要使用并行方法去加速计算.
在过去的一段时间里, 对基于图形处理器(GPU)并行求解三维含时薛定谔方程的优化与加速主要体现在两个方面. 一方面, 不断改进TDSE算法或者引入其他方法以减小计算量, 如在柱坐标系下采用的混合数值迭代格式^[18]. 另一方面, 采用不同的并行平台, 比如: 使用CUDA (compute unified device architecture)平台编写TDSE程序^[19], 使用OpenCL(open computing language)语言编写TDSE程序^[20-22]. 但在CUDA架构或OpenCL架构下对算法并行计算进行加速, 使用起来难度较高.
基于硬件的不同, 并行加速有中央处理器(CPU)并行和GPU并行两种方法. CPU中多条指令构成指令流水线, 且每个线程都有独立的硬件来操纵整个指令流. 采用复杂的分支预测技术来达到并行计算目的. GPU是图形处理器, 图形运算的特点是大量同类型数据的密集运算—如图形数据的矩阵运算, 正因为如此, GPU的微架构就是面向适合于矩阵类型的数值计算而设计的, 这类计算可以分成众多独立的数值计算—大量数值运算的线程, 而且数据之间没有像程序执行的那种逻辑关联性. GPU并行计算的崛起得益于大数据时代的到来, 而传统的CPU并行计算已经远远不能满足大数据的需求. CPU的核处理器相对较少, 并行的效率较低. GPU最大的特点是拥有超多计算核心, 往往成千上万核. 而每个核心都可以模拟一个CPU核心的计算功能. 因此GPU的并行效率比CPU并行效率高.
本文基于GPU加速数值求解三维含时薛定谔方程, 通过在GPU上并行加速求解三维含时薛定谔方程, 并且与CPU并行加速做对比, 得到GPU相对于CPU的加速比. 在GPU加速的应用程序中, 工作负载的顺序部分运行在CPU上(这是为单线程性能优化的), 而应用程序的计算密集型部分并行运行在数千个GPU内核上. 正是如此, GPU并行计算可以得到很好的加速效果.

2.理论方法

2.1.三维含时薛定谔方程求解方案

-->

2.1.三维含时薛定谔方程求解方案

物理系统的时间演化由波函数$\varPsi (t)$

来描述, 满足含时薛定谔方程

${\rm{i}}\frac{\partial }{{\partial t}}\varPsi (t) = H(t)\varPsi (t).$

本文以线偏振激光电场作用下的氢原子为例, 在球极坐标中系统的哈密顿量为(如无特殊说明, 下文一律使用原子单位):

$\begin{split} H\left( t \right) =\;& T + V + W(r,\theta,t) \\ =\;& - \dfrac{1}{2}\frac{{{\partial ^2}}}{{\partial {r^2}}} + \dfrac{{{L^2}}}{{2{r^2}}} - \dfrac{1}{r} - E(t)r\cos \theta, \end{split}$

这里$H\left( t \right)$

指作用在约化波函数$\varPhi \left( t \right) = r\varPsi \left( t \right)$

上的算符, 其中${L^2}$

为系统的总角动量算符, $E(t)$

为线偏振入射激光电场.
将波函数$\varPsi (r, t)$

在球谐函数${{\rm{Y}}_{lm}}(\theta, \varphi )$

下展开,

$\varPsi \left( {r,t} \right) = \frac{1}{r}\sum\limits_{l = 0}^\infty {\sum\limits_{m = - l}^l {{\varPhi _{lm}}\left( t \right)} {{\rm{Y}}_{lm}}\left( {\theta,\varphi } \right)} .$

由于m是一个好量子数, 通过对方位角$\varphi $

进行积分并把角动量算符数值求解.含时薛定谔方程的一般步骤是先给定一个初始波函数$\varPhi (t = 0)$

, 然后将时间演化算符作用在该初始波函数上, 反复迭代直至得到任意时刻的末态波函数. 假设将波函数向前推进$\Delta t$

时间增量, 那么t时刻和$t + \Delta t$

时刻的波函数关系为

$\varPhi (t + \Delta t) = {{\rm{e}}^{ - {\rm{i}}H(t)\Delta t}}\varPhi (t).$

利用分裂算符法^[23]将(2)式代入(4)式, 可以得到

$\begin{split}\varPhi (t + \Delta t) =\;& {{\rm{e}}^{ - {\rm{i}}\tfrac{{\Delta t}}{2}T}}{{\rm{e}}^{ - {\rm{i}}\tfrac{{\Delta t}}{2}V}}{{\rm{e}}^{ - {\rm{i}}\Delta tW(r,\theta,t)}}{{\rm{e}}^{ - {\rm{i}}\tfrac{{\Delta t}}{2}V}}\\&\times{{\rm{e}}^{ - {\rm{i}}\tfrac{{\Delta t}}{2}T}}\varPhi (t) + O(\Delta {t^3}),\end{split}$

这里产生的变换误差为$\Delta t$

的三阶误差项. 由于m是一个好量子数, 通过对方位角$\varphi $

进行积分并把角动量算符${L_z}$

替换为它的本征值m, 可以使问题大为简化. 为了方便起见, 下文只讨论$m = 0$

的情况. 假设波函数可以在有限勒让德多项式下展开:

$\varPhi ({r_i},{x_j},t) = \sum\limits_{l = 0}^L {{f_l}({r_i},t){P_l}({x_j})},\;{x_j} = \cos {\theta _j}.$

${P_l}$

为球谐函数${{\rm{Y}}_{l0}}$

, ${f_l}({r_i}, t)$

可以由高斯-勒让德求积法数值计算得出,

${f_l}({r_i},t) = \sum\limits_{j = 1}^{L + 1} {{w_j}{P_l}({x_j})} \varPhi ({r_i},{x_j},t),$

这里${x_j}$

为勒让德多项式${P_{L + 1}}({x_j})$

的$L + 1$

个零点, ${w_j}$

为与之对应的求积权重. 对于l的不同取值, 一维径向波函数${f_l}({r_i}, t)$

均定义在R点等距径向网格上, 它的网格表示为

$\begin{split}&{f_l}(t) = {\left\{ {{f_l}({r_0},t),{f_l}({r_1},t), \cdots,{f_l}({r_{R - 1}},t)} \right\}^{\rm{T}}},\quad\\&{r_i} - {r_{i - 1}} = \Delta r,~i = 1,2, \cdots,R - 1.\end{split}$

(4)式中时间演化算符的作用可以分为三步.
1) 径向动能算符$T = ( - {1 / {2)}}{{{\partial ^2}} / {\partial {r^2}}}$

独立作用在每个一维径向波函数${f_l}({r_i}, t)$

上, 利用带边界条件的傅里叶谱方法^[24], 得到

$\begin{split}{{\rm{e}}^{ - {\rm{i}}\tfrac{{\Delta t}}{2}T}}{f_l}(r,t)\dot =\;& {{\cal{F}}^{\sin }} \cdot {\rm{diag}}\Big( {{{\rm{e}}^{ - {\rm{i}}\tfrac{{\Delta t}}{2}\tfrac{{{k^2}}}{2}}}} \Big) \cdot {{\cal{F}}^{\sin }} \cdot {f_l}(t),\quad\\{k_j} =\;& \frac{\pi }{{R\Delta r}}j.\\[-12pt]\end{split}$

上述操作中, 由于对所有径向波函数都进行了一维正弦变换, 应用径向动能算符的计算复杂度为$O(R{\log _2}(R)L)$

.
2) 等效势能算符V分为离心势能项${{{L^2}} /{(2{r^2})}}$

和库仑势能项${{ - 1} / r}$

, 其中总角动量算符${L^2}$

在球谐函数表象下是对角化的, 对角元为它的本征值$l(l + 1)$

, 因此可以得到

$\begin{split}{{\rm{e}}^{ - {\rm{i}}\tfrac{{\Delta t}}{2}V}}{f_l}({r_i},t) \approx \;& {{\rm{e}}^{{\rm{i}}\tfrac{{\Delta t}}{2}\left[ {\frac{{l\left( {l + 1} \right)}}{{2r_i^2}} - \tfrac{1}{{{r_i}}}} \right]}} {f_l}({r_i},t), \\ i =\; & 0,1,2, \cdots ,R - 1.\end{split}$

3) 相互作用势能算符$W(r, \theta, t)$

在坐标表象$\{ r, \theta \} $

下是对角化的, 利用 (5)式重构波函数$\varPhi (r, x, t)$

, 得到

${{\rm{e}}^{ - {\rm{i}}\tfrac{{\Delta t}}{2}W(r,\theta,t)}}\varPhi (r,x,t) \!\doteq\! {{\rm{e}}^{{\rm{i}}\Delta tE(t){r_i}{x_j}}} \cdot \varPhi ({r_i},{x_j},t).$

上述对应算法步骤如表1所列.

算法　　　$\varPhi (t + \Delta t) = {{\rm{e}}^{ - {\rm{i}}H(t)\Delta t}}\varPhi (t)$
Input: ${f_l}({r_i}, t)$
Output: ${f_l}({r_i}, t)$
1. for n do
2.　for l do
3.　　${f_l}({r_i}, t) = {\rm{ifft} }\left( { {\rm{diag} }\Big( { { {\rm{e} }^{ - {\rm{i} }\tfrac{ {\Delta t} }{2}\tfrac{ { {k^2} } }{2} } } } \Big) \cdot {\rm{fft} }\left( { {f_l}({r_i}, t)} \right)} \right)$
4.　end for
5.　for i and l do
6.　　${f_l}({r_i}, t) = { {\rm{e} }^{ - {\rm{i} }\tfrac{ {\Delta t} }{2}\left[ {\tfrac{ {l(l + 1)} }{ {2 r_i^2} }\, - \, \frac{1}{ { {r_i} } } } \right]} } \cdot {f_l}({r_i}, t)$
7.　end for
8.　for i and j do
9.　　$\varPhi ({r_i}, {x_j}, t) = \sum\limits_{l = 0}^L {{f_l}({r_i}, t){P_l}({x_j})} $
10. end for
11.　for i and j do
12.　$\left\| {\varPhi ({r_i}, {x_j}, t)} \right\rangle = { {\rm{e} }^{ {\rm{i} }\Delta tE(n){r_i}{x_j} } } \cdot \left\| {\varPhi ({r_i}, {x_j}, t)} \right\rangle$
13.　end for
14.　for i and j do
15.　${f_l}({r_i}, t) = \sum\limits_{j = 1}^{L + 1} {{w_j}{P_l}({x_j})} \varPhi ({r_i}, {x_j}, t)$
16.　end for
17. for i and l do
18.　${f_l}({r_i}, t) = { {\rm{e} }^{ - {\rm{i} }\tfrac{ {\Delta t} }{2}\left[ {\tfrac{ {l(l + 1)} }{ {2 r_i^2} }\, - \, \frac{1}{ { {r_i} } } } \right]} } \cdot {f_l}({r_i}, t)$
19. end for
20. for l do
21.　${f_l}({r_i}, t) = {\rm{ifft} }\left( { {\rm{diag} }\Big( { { {\rm{e} }^{ - {\rm{i} }\tfrac{ {\Delta t} }{2}\tfrac{ { {k^2} } }{2} } } } \Big) \cdot {\rm{fft} }\left( { {f_l}({r_i}, t)} \right)} \right)$
22. end for
23. end for

表1TDSE算法步骤
Table1.TDSE algorithm steps.

通过(6)式再次展开成径向波函数${f_l}({r_i}, t)$

, 接下来只需要依次执行步骤2)和步骤1), 就完成了波函数向前推进$\Delta t$

的一次迭代. 在含时演化中, 重复执行上述步骤, 能够得到任意时刻的末态波函数. 步骤1)中的快速傅里叶变换操作以及(5)式和(6)式中的变换操作都可以通过向量化提高计算效率.
连续态波函数在球谐函数表象下可以写成

$\begin{split}{\psi _k}\left( r \right) =\; &\dfrac{1}{{k\sqrt {2{\rm{\pi }}} }}\sum\limits_{l,m} {{{\rm{e}}^{{\rm{i}}\left( {{\sigma _l} + {\delta _l}} \right)}}} {\rm Y}_{{lm}}^*\left( {\theta,\varphi } \right) \\& \times {\varPhi _{lm}}\left( {r,t} \right){{\rm Y}_{l'm'}}\left( {\theta ',\varphi '} \right),\end{split}$

其中是${\sigma _l} = \arg \varGamma \left( {1 + l - {\rm{i}}Z/k} \right)$

是库仑散射相移, ${\delta _l}$

是除去长程库仑势的短程势产生的相移.
电子与电场相互作用后的末态动量分布是

$\begin{split}\dfrac{{{\rm{d}}P}}{{{\rm{d}}k}} =\;& {\left| {\left\langle {{\psi _k}\left( r \right)} \right|\left. {\varPsi \left( {r,t} \right)} \right\rangle } \right|^2} \\=\;& \Bigg| \frac{1}{{k\sqrt {2{\rm{\pi }}} }}\sum\limits_{l,m} {{\left( { - {\rm{i}}} \right)}^l}{{\rm{e}}^{{\rm{i}}\left( {{\sigma _l} + {\delta _l}} \right)}}{{\rm Y}_{lm}}\left( {\theta,\varphi } \right)\\&\times\int\nolimits_0^\infty {{\rm{d}}r{\varPhi _{lm}}\left( {r,t} \right)r} {f_l}\left( {r,t} \right) \Bigg|^2.\end{split}$

2.2.并行计算方案

-->

2.2.并行计算方案

本文在Matlab环境下调用设备端(GPU)来实现并行计算, 离散化的初始波函数以及传播算符均保存在主机端(CPU), 如图1所示. GPU上数组的创建和传输通过Matlab并行计算工具箱的相关函数完成, 使用gpuArray()函数从主机端向设备端发送Matlab数组, 即将Matlab工作区内的数组传输到设备端内存. 在GPU中进行数值计算完毕以后, 再通过gather()函数从设备端向主机端发送Matlab数组, 即将设备端内的Matlab数组传输到主机端内存.

图 1 数据传输流程图
Figure1. The flowchart of data transmission.

在求解含时薛定谔方程时, 具体需要并行计算的部分是: 快速傅里叶变换、逆快速傅里叶变换、矩阵乘法和数组点乘. 将需要进行变换的数组从CPU传输到GPU, 然后在GPU上对数组按列分别进行快速傅里叶变换. 不同的列在进行快速傅里叶变换时是相互独立的, 所以可以在不同的线程内对不同的列同时进行快速傅里叶变换, 这样就达到了并行的目的. 计算得到的数组存储在GPU内存中, 将计算结果传输回CPU后, 可以释放在GPU中占用的内存. 逆快速傅里叶变换与快速傅立叶变换类似. 矩阵乘法的思路是将左乘矩阵的任一行和右乘矩阵的任一列做点积, 得到目标矩阵的任一元素. 每个目标矩阵元素的计算都是相互独立的, 因此可以同时计算多个目标矩阵元素, 以达到并行计算的目的. 数组点乘是Matlab中的一种运算方式, 直接对两个数组中相同位置的元素做乘法, 即可得到目标数组的对应元素. 因此, 数组点乘本质上是一种标量运算, 非常便于利用多线程进行并行计算.

3.结果与讨论

3.1.测试环境与测试算例

-->

3.1.测试环境与测试算例

本文所有计算使用的并行环境包含1个CPU (Intel Xeon E7-8880 v4, 22核, 主频2.2 GHz)和NVIDIA Tesla P100卡中的1个GPU (3584核心, 主频1.3 GHz). 程序的实现基于Matlab环境, GPU中的矩阵向量操作调用了重载的Matlab函数. 本次测试算例以线偏振红外激光电场作用下氢原子的阈上电离为背景. 红外激光电场强度$I = 9 \times {10^{13}}\;{\rm{ W}}/{\rm{c}}{{\rm{m}}^2}$

, 波长$\lambda = 800\;{\rm{ nm}}$

, 具有正弦平方脉冲包络, 共8个光学周期. 其中计算采用的空间范围${r_{\max }} = 1000\;{\rm{ a}}.{\rm{u}}.$

, 时间步长$\Delta t = 0.0037\;{\rm{ a}}.{\rm{u}}.$

.
2

3.2.实验结果

-->

3.2.实验结果

为获取GPU并行的优化表现, 需要给出CPU上的并行性能作为基准. 通过改变角量子数L和径向网格点R计算演化时间结束后的末态波函数, 比较不同参数下GPU相对于CPU的加速比(单个CPU计算时间与单个GPU计算时间的比值):

$S = \frac{{{T_{{\rm{CPU}}}}}}{{{T_{{\rm{GPU}}}}}}.$

首先, 设置径向网格点R = 1024 × 32不变, 选取不同的角量子数L, 计算结果如表2和图2所示.

角量子数L	计算时间/s
角量子数L	CPU	GPU
4	2164.309	159.368
9	4120.602	164.418
19	7922.537	205.440
39	17682.308	378.104
79	36774.347	757.198

表2不同角量子数下CPU与GPU的计算时间比较
Table2.Computation time of CPU and GPU under different angular quantum numbers.

图 2 加速比随着角量子数的变化
Figure2. Speedup ratio as a function of angular quantum number.

角量子数L = 19保持不变, 改变径向网格点R的大小, 然后将CPU与GPU的计算时间对比, 如表3和图3所示.

径向网格点数R	计算时间/s
径向网格点数R	CPU	GPU
2¹²	1118.348	148.302
2¹³	1871.128	154.614
2¹⁴	3846.120	160.763
2¹⁵	7922.537	205.440
2¹⁶	16862.467	354.554

表3不同径向网格点下CPU与GPU的计算时间比较
Table3.Computation time of CPU and GPU under different radial grid points.

图 3 加速比随着径向网格点的变化
Figure3. Speedup ratio as a function of radial grid point.

同时改变径向网格点和角量子数的大小, 也就是改变径向波函数集{f_l (r_i, t)}的矩阵大小, 比较CPU和GPU的计算时间, 结果如表4和图4所示.

矩阵大小	计算时间/s
矩阵大小	CPU	GPU
5 × 2¹²	199.158	149.895
10 × 2¹³	965.276	166.039
20 × 2¹⁴	3846.120	160.763
40 × 2¹⁵	17682.308	378.104
80 × 2¹⁶	74761.695	1524.669

表4不同矩阵大小下CPU与GPU的计算时间比较
Table4.Computation time of CPU and GPU under different matrix sizes.

图 4 加速比随着矩阵大小的变化
Figure4. Speedup ratio as a function of the size of matrix.

此外, 为了进一步测试GPU的加速性能, 又进行了一组1600 nm中红外激光的实验, 中红外激光电场强度$I = {\rm{1}} \times {10^{13}}\;{\rm{ W}}/{\rm{c}}{{\rm{m}}^2}$

, 波长$\lambda = 1600\;{\rm{ nm}}$

, 具有正弦平方脉冲包络, 共8个光学周期. 其中计算采用的空间范围${r_{\max }} = 1000\;{\rm{ a}}.{\rm{u}}.$

, 时间步长$\Delta t = 0.0037\;{\rm{ a}}.{\rm{u}}.$

. 此时与第三组实验相同, 同时改变径向网格点和角量子数的大小, 也就是改变径向波函数集{f_l (r_i, t)}的矩阵大小, 比较CPU和GPU的计算时间, 结果如表5和图5所示.

矩阵大小	计算时间/s
矩阵大小	CPU	GPU
5 × 2¹²	437.584	315.448
10 × 2¹³	2075.667	463.183
20 × 2¹⁴	9252.539	629.088
40 × 2¹⁵	40617.723	814.985
80 × 2¹⁶	182135.643	3024.669

表5不同矩阵大小下CPU与GPU的计算时间比较
Table5.Computation time of CPU and GPU under different matrix sizes.

图 5 加速比随着矩阵大小的变化
Figure5. Speedup ratio as a function of the size of matrix.

选取一组800 nm激光电场作用下氢原子的阈上电离, 由CPU计算得到的末态波函数与GPU的计算结果对比, 如图6所示, 电子末态动量分布保持一致.

图 6 氢原子的光电子末态动量分布　(a) CPU计算结果; (b) GPU计算结果
Figure6. Photoelectron final-state momentum distributions of hydrogen atom: (a) Calculation results of CPU; (b) calculation results of GPU.

同时计算两种方法得到的约化波函数的误差为$5 \times {10^{ - 21}}$

, 动量分布误差为$2 \times {10^{ - 18}}$

. 其中波函数误差计算公式为

$\sum\limits_{l = 0}^L {\sum\limits_{r = 0}^r {{{| {( {{f_l}{{( {{r_i}, t} )}_{{\rm{CPU}}}} - {f_l}{{( {{r_i}, t} )}_{{\rm{GPU}}}}} )} |}^2}} },$

动能谱的误差计算公式为

$\sum\limits_{jx = 0}^{200} \sum\limits_{jz = 0}^{\text{π}} \big| ({\rm YYS}{{( {jx, jz} )}_{{\rm{CPU}}}} - {\rm YYS}{{( {jx, jz} )}_{{\rm{GPU}}}} ) \big|^2.$

3.3.实验结果讨论

-->

3.3.实验结果讨论

通过上述的计算可以得出: 1)相同计算量下CPU与GPU的计算时间有很大的差距, 当计算量较小时加速比急剧升高, 随着计算量的增大加速比趋于一个稳定值, 最高达到了约60倍的加速提升, 加速效果十分明显; 2)从不同的计算量对比也可以看出, 当计算量越大时, 加速的效果也就越好. 并不是所有的计算都要选取GPU来计算, CPU将数据传输到GPU需要一定的时间, 当数据比较大时, 采用GPU来并行计算, 能够获得更大的加速比; 3)如果只是改变一个维度的大小, 所得到的实际加速效果有时候并不理想, 这和CPU以及GPU存储数据、读取数据的方式有关. 所以在计算的时候为了获得最好的加速比, 需要同时在至少两个维度上调整矩阵的大小; 4)无论采用CPU计算还是GPU计算, 都能得到相同的计算结果, 计算误差也在可接受的范围内, 并且该结果也符合现有的阈上电离物理规律.

4.结　论

本文详细分析了在强场电离的背景下数值求解氢原子三维含时薛定谔方程基于不同硬件的并行速度. 借助于分裂算符-傅里叶变换方法, 在球极坐标下得到了三维含时薛定谔方程的末态解. 同时, 依托于GPU的多线程结构, 使得GPU发挥细粒度方面的并行优势, 实现整体算法的并行加速. 采用了CPU并行和GPU并行两种加速计算模式, 探讨了两者并行加速的性能. 通过与现有的物理规律相对比, 验证了程序的正确性. 计算结果表明, 当计算量较小时GPU相对于CPU的加速效果不突出, 随着计算量的增大加速比迅速增加, 然后趋于一个稳定值. GPU并行对于数值求解三维含时薛定谔方程有着相对于CPU最高约60倍的加速. 可见, 计算量越大, 采用GPU并行获得的加速比越大. 这一工作对利用GPU高效数值求解含时薛定谔方程有着重要的指导意义.

本站小编 Free考研考试/2021-12-29

English Abstract

Numerical solution of three-dimensional time-dependent Schr?dinger equation based on graphic processing unit acceleration

Hubei Key Laboratory of Optical Information and Pattern Recognition, Wuhan Institute of Technology, Wuhan 430205, China

Corresponding author:Liao Qing, liaoqing@wit.edu.cn

全文HTML

2.1.三维含时薛定谔方程求解方案

2.2.并行计算方案

3.1.测试环境与测试算例

3.2.实验结果

3.3.实验结果讨论

相关话题/计算 激光 数据 技术 实验

领限时大额优惠券,享本站正版考研考试资料!

基于飞秒激光成丝测量燃烧场温度

国产部分掺杂光纤实现3 kW全光纤激光振荡输出

桌面飞秒极紫外光原子超快动力学实验装置

椭球胶体在圆球胶体体系中扩散行为的实验研究

基于数字微镜器件的数字线扫描荧光显微成像技术

电池材料数据库的发展与应用

多光子成像技术的生物医学应用新进展

基于PE型压机中子衍射高温高压组装的优化设计与实验验证

基于Tikhonov正则化参数矩阵的激光吸收光谱燃烧场二维重建光路设计方法

X波段高重频长脉冲高功率多注相对论速调管放大器的设计与实验研究