全文HTML
--> --> -->对等离子体发射光谱进行量化分析的基础是碰撞辐射模型. 该模型通过求解等离子体中激发态粒子的速率平衡方程, 将发射光谱特性与等离子体密度、电子温度等特征参数建立联系. 光谱诊断就是找寻模型预测结果与待测等离子体发射光谱的最佳逼近, 获取待测等离子体特征参数的过程. 研究人员在这一领域开展了大量的研究工作. 有研究者在氯、氧等离子体中混入氖、氩、氪、氙等示踪气体, 通过监测这些稀有气体的发射光谱, 实现对氯、氧等离子体中电子能量分布函数和电子温度的监测[11-13]. 发射光谱方法在材料表面处理等离子体设备中的等离子体动力学过程研究中的应用也得到了发展[14-16]. 研究人员面向使用氩、氮、氙、氪等工质的感性、容性耦合射频等离子体, 介质阻挡放电以及霍尔推力器等多种放电形式等离子体中电子温度、等离子体密度、气体温度等特征参数监测需求, 开展了一系列研究[17-19].
碰撞辐射模型对等离子体中激发、电离等物理过程速率的描述依赖于碰撞截面等基础物理数据. 碰撞截面的主要来源有两个: 一是通过实验方法测量; 二是从第一性原理出发, 基于量子力学和原子物理学相关理论计算得到. 在当前技术条件下, 通过实验测量所能获得的数据较为有限[20-23]. 由于信噪比、测量系统标定等方面的问题, 上述测量工作中普遍存在一定的测量误差. 理论计算方面, 由于求解过程中涉及到碰撞体系中任意两电子坐标的相互纠缠, 求解过程需要使用多级展开的方法对体系进行描述, 并进行适当的截断处理, 这对截面计算结果的准确性产生了一定的限制[24-26]. 在这一背景下, 有部分研究人员通过向模型中引入调整因子对碰撞辐射模型使用的速率系数进行修正[11,27,28]. 然而, 由于等离子体中各种物理反应过程众多, 且相互耦合, 难以通过有限的实验对描述这些反应过程的截面数据进行恰当的修正, 导致截面数据所含偏差通过碰撞辐射模型向诊断结果传递, 给等离子体光谱诊断工作带来了困难.
近年来, 机器学习方法在物理领域得到了广泛的应用. 经过训练的神经网络, 可构建起不同物理量间的映射关系. 凭借在特征辨识方面具有的优势, 这一方法在诊断监测[29,30]、天体活动研究[31,32]、地球物理科学[33,34]、理论计算[35]等方面的应用得到了发展. 常用的机器学习方法包括前馈神经网络、循环神经网络、残差神经网络等[35,36]. 前馈神经网络是一种神经元分层排列、各层神经元只与前一层中的神经元连接、层间不存在反馈的神经网络, 具有较强的多维映射能力[35], 适合解决光谱诊断这类问题.
本文以稀有气体放电为例, 基于前馈神经网络开发了一种能够辨识等离子体光谱特征, 减小截面数据偏差向诊断结果传递的光谱诊断方法. 分析了以往常用的最小二乘拟合诊断方法与新方法的误差特性. 并通过解算实验光谱数据, 进一步验证了基于神经网络的诊断方法对抗基础数据偏差的能力.
本文的章节安排为: 第2节介绍文中使用的碰撞辐射模型, 第3节介绍实验设置, 第4节阐述使用的光谱解算方法和误差分析方法, 第5节介绍神经网络的训练过程和验证结果, 对比最小二乘和神经网络两种诊断方法的误差特性, 并比较两种方法解算实验光谱数据的性能, 第6节对全文进行总结.
本文使用的碰撞辐射模型中考虑了以下动力学过程.
1)电子碰撞激发过程:
考虑这些过程, 激发态x的速率平衡方程写为
碰撞过程反应速率Rcol的计算需要使用速率系数Q, 计算公式为
辐射和自吸收项则由下式给出:
最后, 稀有气体原子由扩散导致的壁面淬熄频率由下式给出:
将电子温度、电子密度等参数连同截面等基础数据代入, 联立求解方程(8)—(11), 可以得到激发态密度和等离子体发射光谱. 本文以氙等离子体为例开展研究, 碰撞辐射模型求解所使用截面数据的详细描述和模型的实验验证见文献[10].

Figure1. Structure of the Kaufmann discharge chamber and the scheme of measurement.
实验中使用的朗缪尔探针为直径0.3 mm的钨丝和陶瓷管制成的端面探针. 光谱采集系统由Horiba FHR-1000型光谱仪和Synapse CCD探测器组成, 在400—1000 nm波段的光谱分辨率优于0.05 nm. 实验前使用卤钨灯校准光谱采集系统的光谱响应. 采集光谱时, 光谱仪狭缝设置为20 μm, 光探针垂直于等离子体源轴线布置. 实验中, 使用步进电机驱动朗缪尔探针和光探针沿等离子体源轴向运动, 实现对等离子体源轴线上9个不同测点处光谱和探针伏安特性的采集. 实验时阴极供气流量为5 sccm (1 sccm = 1 mL/min), 电流为7 A. 本文使用的实验装置与文献[37]使用的装置相同.
2
4.1.基于最小二乘拟合的光谱诊断方法
首先对基于最小二乘拟合的光谱诊断方法进行介绍. 碰撞辐射模型可看作如(12)式所示的, 以等离子体参数向量P为自变量, 以发射光谱向量I为因变量的函数,
Figure2. Diagram of optical emission spectroscopy based on least square method.
使用光谱中各谱线相对强度诊断等离子体参数的方法因为不需要对测量系统进行绝对标定, 在实践中得到了普遍应用[38-40]. 不失一般性, 本文使用如(13)式所示的, 利用所选谱线组中所有谱线对该组谱线强度总和作归一化的正规化方法(比和法), 获得表征谱线相对强弱关系的向量R:
序号 | 波长/nm | 上能级 | 序号 | 波长/nm | 上能级 | |
1 | 460.303 | 5p4(3P2)6p $ {}^{2}{\left[1\right]}_{3/2}^\circ $ | 9 | 834.745 | 5p5($ {}^{2}{\mathrm{P}}_{1/2}^\circ $)6p 2[3/2]2 | |
2 | 484.433 | 5p4(3P2)6p $ {}^{2}{\left[3\right]}_{7/2}^\circ $ | 10 | 840.919 | 5p5($ {}^{2}{\mathrm{P}}_{3/2}^\circ $)6p 2[3/2]1 | |
3 | 492.148 | 5p4(3P1)6p $ {}^{2}{\left[2\right]}_{5/2}^\circ $ | 11 | 881.941 | 5p5($ {}^{2}{\mathrm{P}}_{3/2}^\circ $)6p 2[5/2]3 | |
4 | 529.222 | 5p4(3P2)6p $ {}^{2}{\left[2\right]}_{5/2}^\circ $ | 12 | 895.225 | 5p5($ {}^{2}{\mathrm{P}}_{3/2}^\circ $)6p 2[3/2]2 | |
5 | 541.915 | 5p4(3P2)6p $ {}^{2}{\left[3\right]}_{5/2}^\circ $ | 13 | 904.545 | 5p5($ {}^{2}{\mathrm{P}}_{3/2}^\circ $)6p 2[5/2]2 | |
6 | 788.739 | 5p5(2P°1/2)6p 2[1/2]0 | 14 | 916.265 | 5p5($ {}^{2}{\mathrm{P}}_{3/2}^\circ $)6p 2[3/2]1 | |
7 | 823.163 | 5p5(2P°3/2)6p 2[3/2]2 | 15 | 979.970 | 5p5($ {}^{2}{\mathrm{P}}_{3/2}^\circ $)6p 2[1/2]1 | |
8 | 828.012 | 5p5(2P°3/2)6p 2[1/2]0 | 16 | 992.320 | 5p5($ {}^{2}{\mathrm{P}}_{3/2}^\circ $)6p 2[5/2]2 |
表1本文研究中选用的氙谱线表
Table1.Xenon spectral lines used in this work.
所选谱线构成的光谱向量I = [I1, I2, ···, I16]经比和法正规化后得到比和向量R = [R1, R2, ···, R16]. 由比和向量构建的误差函数为
2
4.2.基于前馈神经网络的光谱诊断方法
基于前馈神经网络建立的光谱诊断方法流程和使用的神经网络结构如图3所示. 输入层由16个神经元组成, 对应本文所选的16条谱线; 输出层由两个神经元组成, 对应电子温度和电子密度2个待测等离子体参数. 本文选用一种双隐层结构(两个隐藏层分别含有10个和5个神经元)和一种三隐层结构(三个隐藏层分别含有12个、8个和4个神经元)的网络结构进行训练. 隐藏层使用S函数(Sigmoid)进行激活, 其表达式为
Figure3. Diagram of optical emission spectroscopy based on feedforward neural network.
2
4.3.诊断方法的比较
分别利用由碰撞辐射模型和光谱测量实验获得的数据, 对前文介绍的最小二乘和神经网络两种光谱诊断方法进行比较和误差特性分析. 一方面, 使用碰撞辐射模型, 设定电子温度









图4中横坐标和纵坐标分别为正规化后的电子温度





Figure4. Definition of error radius and eccentricity.
2
5.1.神经网络训练及验证
本文训练神经网络所使用的数据由碰撞辐射模型生成. 生成训练集使用的Te-ne组合由51个Te和47个ne值两两组合而成, 共计2397种. 所涵盖的参数范围为Te = 5—10 eV, ne = 5 × 1010—6 × 1011 cm–3. 误差引入方案为对所选的16条谱线涉及的15个谱线上能级, 使用–30%—30%范围内的60个随机数作为相对偏差, 引入每个上能级对应的截面数据. 以上述2397种Te-ne组合作为碰撞辐射模型输入参数, 配合900种误差引入方案, 形成包含2397 × 900组数据的光谱数据集, 用于训练神经网络.考虑到光谱向量向等离子体参数的映射属于回归问题, 本文使用均方误差作为损失函数. 图5所示的是使用两种数据正规化方法和两种神经网络结构时, 神经网络的训练情况. 图中纵坐标表示训练时的均方误差, 由每步迭代中的网络输出值与训练目标值作均方差得到. 由图5可见, 在本文所选网络结构和正规化方法中, 双隐层网络结构搭配比和正规化方法有最快的收敛速度和最小的残差.

Figure5. Variation of mean square error with the number of iterations using different network structures and data normalization methods.
图6所示的是电子温度和电子密度的训练目标和神经网络预测结果的对应关系. 可以看出, 无论是对训练集还是测试集, 使用双隐层网络搭配比和正规化方法训练得到的网络都可以较好地预测电子温度和密度信息. 网络预测结果在电子温度5—7 eV, 电子密度1 × 1011—3 × 1011 cm–3的参数范围内误差较大, 不过整体上Te的预测结果与目标值间偏差均小于1%, ne的网络预测结果与目标值误差均小于3%. 在5.3节对神经网络诊断方法和最小二乘诊断方法的对比分析中, 使用双隐层网络结构搭配比和正规化方法训练的网络进行讨论.

Figure6. Corresponding relationship between the network prediction result and the training target: (a) Corresponding relationship of the electron temperature; (b) corresponding relationship of the electron density; (c) prediction error of the electron temperature; (d) prediction error of the electron density.
2
5.2.最小二乘诊断方法和神经网络诊断方法误差特性的对比
首先就基础数据偏差对最小二乘方法的影响进行探讨. 这里使用未含偏差的碰撞辐射模型生成待测光谱, 使用带有偏差的模型对其进行最小二乘拟合, 模拟实际诊断中基础数据存在偏差的情形, 以揭示模型所使用基础数据上存在的偏差对最小二乘诊断方法的影响. 进行最小二乘拟合时, 电子温度和电子密度作为拟合参数, 其他等离子体参数设置为与生成待测光谱时相同的值.图7所示的是在向氙等离子体光谱诊断中经常使用的881.941 nm谱线对应的上能级的截面数据中分别引入5%, 15%和30%的偏差时, 待测光谱与使用最小二乘方法得到的最佳拟合的对比. 生成图中待测光谱的参数设定值为电子温度



Figure7. Fitting results obtained by the least square method (in order to improve the readability of the image, the intensity of the ion spectral line is amplified, and a bias is introduced into the wavelength of the fitting spectrum).
图7(a)是向拟合使用的模型中引入5%的偏差时, 待测光谱与光谱的对比情况. 图中蓝色谱线为使用设定参数


可见, 基础数据所含偏差导致最小二乘方法的拟合存在残差, 并使得诊断结果与参数设定值间产生偏差. 基础数据的偏差大小与最小二乘方法的拟合残差和诊断结果偏差大小呈正相关. 从上述例子还可以发现, 向一条谱线引入的偏差会导致所有谱线的拟合结果存在残差. 这是最小二乘方法的特性使然: 由于等离子体中各种物理反应过程的强耦合作用, 寻找所有谱线均方误差最小的过程, 会导致单条谱线的偏差向其他谱线传递. 导致实践中难以锁定偏差的根源来自哪些谱线, 无法通过实验获得恰当的调整因子. 这正是使用调整因子方法进行光谱诊断的困难.
之后通过对比两种光谱诊断方法的误差半径和偏心距, 对两种方法的误差特性进行比较. 在本文所研究的参数范围内, 选择Te和ne各11个值作为设定值使用碰撞辐射模型生成待测光谱数据. 对这11 × 11个Te-ne组合的每个点, 使用一组均匀分布在–30%—30%间的60个随机数作为偏差值, 依次作用于碰撞辐射模型中的15个能级截面, 得到包含121 × 15 × 60组待测光谱的数据集. 对于这组待测光谱, 分别使用基于最小二乘拟合和神经网络的诊断方法得到诊断结果. 使用4.3节中定义的误差半径和偏心距, 对最小二乘诊断方法和神经网络诊断方法得到的结果进行评价.
图8和图9分别给出两种诊断方法诊断结果的平均误差半径和最大误差半径. 图10所示的是两种诊断方法诊断结果的偏心距. 可以看出, 在本文讨论的参数范围内, 最小二乘方法诊断结果的平均误差半径在0.60%—15.88%之间, 最大误差半径在1.0%—26.70%之间, 偏心距在0.0007%—0.28%之间; 而神经网络方法诊断结果的平均误差半径在0.06%—0.71%之间, 最大误差半径在0.31%—2.08%之间, 偏心距在0.05%—0.79%之间. 总体上, 神经网络诊断方法结果的误差半径明显小于最小二乘方法获得的误差半径; 在偏心距方面, 神经网络方法获得的结果与最小二乘方法基本相当, 两种方法获得的偏心距均在1%以下.

Figure8. (a) Average error radius of the diagnosis result of the least square method; (b) average error radius of the diagnosis result of the neural network method.

Figure9. (a) The maximum error radius of the diagnosis result of the least square method; (b) the maximum error radius of the diagnosis result of the neural network method.

Figure10. (a) Eccentricity of the diagnosis result of the least square method; (b) the eccentricity of the diagnosis result of the neural network method.
在本文讨论的等离子体参数空间内, 两种方法获得的误差半径和偏心距的分布有所不同. 对于最小二乘诊断方法, 在电子密度高于1011 cm–3时, 诊断结果的误差半径和偏心距普遍比电子密度低于1011 cm–3时大; 而神经网络诊断方法获得的误差半径和偏心距分布较为平缓, 呈现中间高两边低的分布特性.
可见, 截面数据上的偏差向诊断结果的传递量的大小与电子温度密度参数范围也有关系, 这可能是由不同参数条件下, 等离子体中各种动力学过程此消彼长导致的: 被引入截面偏差的过程在激发态粒子产生或损失中的占比会随着等离子体参数的变化而改变. 当被引入截面偏差的过程在激发态产生或损失中占据主导地位时, 截面数据上的偏差便会对激发态密度产生更大的影响, 进而导致最终的诊断结果出现更大的偏差. 以后的工作中还将针对这一问题开展更深入的研究.
2
5.3.诊断方法的考核实验
本节对神经网络和最小二乘两种光谱诊断方法解算实验采集的光谱数据的性能进行比较. 图11所示的是两种光谱诊断方法获得的电子密度和电子温度与朗缪尔探针所得结果的对比. 图11(a)和图11(b)分别给出了电子密度和电子温度的对比结果. 图11(c)和图11(d)分别给出了两种光谱方法获得的电子密度和电子温度相对于朗缪尔探针所得结果的误差. 可以看出, 整体上, 电离室内电子密度随着测点位置远离阴极, 呈现逐渐下降的趋势. 这是由于随着测点远离阴极, 阴极发射的电子沿电离室径向逐渐扩散, 轴线上的电子密度因而逐渐减小. 受到电离室内会切型磁场的影响, 电子在磁尖端附近存在一定的聚集效应, 导致6号位置处电子密度有所抬升.
Figure11. (a) Diagnostic results of ne in Kaufman ion source; (b) diagnostic results of Te in Kaufman ion source; (c) relative error of ne by least-square method and neural network method; (d) relative error of Te by least-square method and neural network method. “探针”, “最小二乘”, “神经网络” denotes the diagnostic results obtained by Langmuir probe, least-square diagnostic method and neural network diagnostic method, respectively.
同时, 由于电离室筒形的阳极结构, 电场沿电离室轴线远离阴极的方向逐渐减弱, 电子获能随之变差, 导致电子温度随着测点远离阴极位置呈减小的趋势. 由图10(c)和图10(d)可以看出, 在解算实验光谱时, 神经网络方法的误差均小于最小二乘方法. 神经网络方法获得的结果相对于朗缪尔探针所获结果的误差不超过5%, 而最小二乘方法在部分测点处的误差超过了50%.
从本文的研究结果可以发现: 1)由于等离子体中各种物理反应过程众多, 相互耦合作用强, 最小二乘法会使截面数据偏差在不同谱线间传递, 导致无法从拟合光谱与待测光谱得到的误差向量中锁定误差的来源. 这给利用调整因子修正模型的方法带来了困难. 2)神经网络方法能够辨识等离子体发射光谱的特征, 进而减弱部分谱线存在的偏差对整体诊断结果的影响. 从本文的研究结果来看, 截面数据偏差向诊断结果的传递量平均可由最小二乘方法的70%减小至神经网络方法的7%, 即神经网络方法可以减少60%以上的误差传递量. 3)本文基于前馈神经网络开发的诊断方法能够对抗截面数据上存在的偏差. 从5.3节中两种诊断方法解算实验光谱数据的结果对比来看, 神经网络诊断方法所得结果的误差明显小于最小二乘拟合方法.
神经网络方法不仅可用于电子温度密度的诊断, 在利用分子转动谱测量气体温度、使用绝对光强方法测量激发态密度等问题的求解中同样具有良好的应用前景. 此外, 使用神经网络方法分析等离子体发射光谱所消耗的时间要远小于基于最小二乘拟合的光谱诊断方法, 能够实时在线处理光谱数据. 使其在刻蚀、材料处理等的等离子体加工工艺流程, 以及空间等离子体装置工作时对等离子体参数的在线监测上也具有良好的应用前景.
感谢Maxime Bezanilla先生对本文工作的启发.