1.Harbin Institute of Technology, Harbin 150001, China 2.Key Laboratory of Aerospace Plasma Propulsion, Ministry of Industry and Information Technology, Harbin 150001, China 3.Beijing Orient Institute of Measurement and Test, Beijing 100086, China
Fund Project:Project supported by the National Natural Science Foundation of China (Grant No. 11775063), the Defense Industrial Technology Development Program, China (Grant No. JCKY2018203B029), and the Defense Industrial Metering Program, China (Grant No. JSJL2016203B017)
Received Date:31 December 2020
Accepted Date:14 March 2021
Available Online:26 April 2021
Published Online:05 May 2021
Abstract:Optical emission spectroscopy (OES) has been widely applied to plasma etching, material processing, development of plasma equipment and technology, as well as plasma propulsion. The collisional-radiative model used in OES is affected by the deviation of fundamental data such as collision cross sections, thus leading to the error in diagnostic results. In this work, a novel method is developed based on feedforward neural network for OES. By comparing the error characteristics of the new method with those of the traditional least-square diagnostic method, it is found that the neural network diagnosis method can reduce the transmission of basic data deviation to the diagnosis results by identifying the characteristics of the spectral vector. This is confirmed by the experimental results. Finally, the mechanism of the neural network algorithm against fundamental data deviation is analyzed. This method also has a good application prospect in plasma parameter online monitoring, imaging monitoring and mass data processing. Keywords:optical emission spectroscopy/ feedforward neural network/ collisional-radiative model
本文训练神经网络所使用的数据由碰撞辐射模型生成. 生成训练集使用的Te-ne组合由51个Te和47个ne值两两组合而成, 共计2397种. 所涵盖的参数范围为Te = 5—10 eV, ne = 5 × 1010—6 × 1011 cm–3. 误差引入方案为对所选的16条谱线涉及的15个谱线上能级, 使用–30%—30%范围内的60个随机数作为相对偏差, 引入每个上能级对应的截面数据. 以上述2397种Te-ne组合作为碰撞辐射模型输入参数, 配合900种误差引入方案, 形成包含2397 × 900组数据的光谱数据集, 用于训练神经网络. 考虑到光谱向量向等离子体参数的映射属于回归问题, 本文使用均方误差作为损失函数. 图5所示的是使用两种数据正规化方法和两种神经网络结构时, 神经网络的训练情况. 图中纵坐标表示训练时的均方误差, 由每步迭代中的网络输出值与训练目标值作均方差得到. 由图5可见, 在本文所选网络结构和正规化方法中, 双隐层网络结构搭配比和正规化方法有最快的收敛速度和最小的残差. 图 5 使用不同网络结构和数据正规化方法获得的均方误差随迭代次数的变化 Figure5. Variation of mean square error with the number of iterations using different network structures and data normalization methods.
图6所示的是电子温度和电子密度的训练目标和神经网络预测结果的对应关系. 可以看出, 无论是对训练集还是测试集, 使用双隐层网络搭配比和正规化方法训练得到的网络都可以较好地预测电子温度和密度信息. 网络预测结果在电子温度5—7 eV, 电子密度1 × 1011—3 × 1011 cm–3的参数范围内误差较大, 不过整体上Te的预测结果与目标值间偏差均小于1%, ne的网络预测结果与目标值误差均小于3%. 在5.3节对神经网络诊断方法和最小二乘诊断方法的对比分析中, 使用双隐层网络结构搭配比和正规化方法训练的网络进行讨论. 图 6 网络预测结果与训练目标的对应关系 (a)电子温度的对应关系; (b)电子密度的对应关系; (c)电子温度的预测误差; (d)电子密度的预测误差 Figure6. Corresponding relationship between the network prediction result and the training target: (a) Corresponding relationship of the electron temperature; (b) corresponding relationship of the electron density; (c) prediction error of the electron temperature; (d) prediction error of the electron density.
25.2.最小二乘诊断方法和神经网络诊断方法误差特性的对比 -->
5.2.最小二乘诊断方法和神经网络诊断方法误差特性的对比
首先就基础数据偏差对最小二乘方法的影响进行探讨. 这里使用未含偏差的碰撞辐射模型生成待测光谱, 使用带有偏差的模型对其进行最小二乘拟合, 模拟实际诊断中基础数据存在偏差的情形, 以揭示模型所使用基础数据上存在的偏差对最小二乘诊断方法的影响. 进行最小二乘拟合时, 电子温度和电子密度作为拟合参数, 其他等离子体参数设置为与生成待测光谱时相同的值. 图7所示的是在向氙等离子体光谱诊断中经常使用的881.941 nm谱线对应的上能级的截面数据中分别引入5%, 15%和30%的偏差时, 待测光谱与使用最小二乘方法得到的最佳拟合的对比. 生成图中待测光谱的参数设定值为电子温度$ T_{\rm e}^0 $= 7.5 eV, 电子密度$ n_{\rm e}^0 $= 2 × 1011 cm–3. 图 7 使用最小二乘方法获得的拟合结果(为保证图的可读性, 对离子谱线强度进行了放大处理, 并将拟合所得光谱的波长进行了偏置) Figure7. Fitting results obtained by the least square method (in order to improve the readability of the image, the intensity of the ion spectral line is amplified, and a bias is introduced into the wavelength of the fitting spectrum).
图7(a)是向拟合使用的模型中引入5%的偏差时, 待测光谱与光谱的对比情况. 图中蓝色谱线为使用设定参数$ {T}_{\mathrm{e}}^{0} $和$ {n}_{\mathrm{e}}^{0} $代入模型生成的待测光谱; 红色谱线为使用最小二乘拟合得到的最佳拟合光谱. 图7(d)中红圈所示的是引入5%偏差时拟合结果与待测光谱谱线归一化强度的比值. 可以看出此时谱线拟合的最大残差为3%; 诊断结果为电子温度Te = 7.4 eV, 电子密度ne = 1.9 × 1011 cm–3. 图7(b)和图7(e)为向拟合所用模型引入15%偏差时的结果, 此时谱线拟合的最大残差为9%; 诊断结果为电子温度Te = 7.2 eV, 电子密度ne = 1.8 × 1011 cm–3. 图7(c)和图7(f)是向拟合所用模型引入30%偏差时的结果, 此时谱线拟合的最大残差为22%; 诊断结果为电子温度Te = 7 eV, 电子密度ne = 1.5 × 1011 cm–3. 可见, 基础数据所含偏差导致最小二乘方法的拟合存在残差, 并使得诊断结果与参数设定值间产生偏差. 基础数据的偏差大小与最小二乘方法的拟合残差和诊断结果偏差大小呈正相关. 从上述例子还可以发现, 向一条谱线引入的偏差会导致所有谱线的拟合结果存在残差. 这是最小二乘方法的特性使然: 由于等离子体中各种物理反应过程的强耦合作用, 寻找所有谱线均方误差最小的过程, 会导致单条谱线的偏差向其他谱线传递. 导致实践中难以锁定偏差的根源来自哪些谱线, 无法通过实验获得恰当的调整因子. 这正是使用调整因子方法进行光谱诊断的困难. 之后通过对比两种光谱诊断方法的误差半径和偏心距, 对两种方法的误差特性进行比较. 在本文所研究的参数范围内, 选择Te和ne各11个值作为设定值使用碰撞辐射模型生成待测光谱数据. 对这11 × 11个Te-ne组合的每个点, 使用一组均匀分布在–30%—30%间的60个随机数作为偏差值, 依次作用于碰撞辐射模型中的15个能级截面, 得到包含121 × 15 × 60组待测光谱的数据集. 对于这组待测光谱, 分别使用基于最小二乘拟合和神经网络的诊断方法得到诊断结果. 使用4.3节中定义的误差半径和偏心距, 对最小二乘诊断方法和神经网络诊断方法得到的结果进行评价. 图8和图9分别给出两种诊断方法诊断结果的平均误差半径和最大误差半径. 图10所示的是两种诊断方法诊断结果的偏心距. 可以看出, 在本文讨论的参数范围内, 最小二乘方法诊断结果的平均误差半径在0.60%—15.88%之间, 最大误差半径在1.0%—26.70%之间, 偏心距在0.0007%—0.28%之间; 而神经网络方法诊断结果的平均误差半径在0.06%—0.71%之间, 最大误差半径在0.31%—2.08%之间, 偏心距在0.05%—0.79%之间. 总体上, 神经网络诊断方法结果的误差半径明显小于最小二乘方法获得的误差半径; 在偏心距方面, 神经网络方法获得的结果与最小二乘方法基本相当, 两种方法获得的偏心距均在1%以下. 图 8 (a)最小二乘方法诊断结果的平均误差半径; (b) 神经网络方法诊断结果的平均误差半径 Figure8. (a) Average error radius of the diagnosis result of the least square method; (b) average error radius of the diagnosis result of the neural network method.
图 9 (a)最小二乘方法诊断结果的最大误差半径; (b) 神经网络方法诊断结果的最大误差半径 Figure9. (a) The maximum error radius of the diagnosis result of the least square method; (b) the maximum error radius of the diagnosis result of the neural network method.
图 10 (a)最小二乘方法结果的偏心距; (b) 神经网络方法结果的偏心距 Figure10. (a) Eccentricity of the diagnosis result of the least square method; (b) the eccentricity of the diagnosis result of the neural network method.
本节对神经网络和最小二乘两种光谱诊断方法解算实验采集的光谱数据的性能进行比较. 图11所示的是两种光谱诊断方法获得的电子密度和电子温度与朗缪尔探针所得结果的对比. 图11(a)和图11(b)分别给出了电子密度和电子温度的对比结果. 图11(c)和图11(d)分别给出了两种光谱方法获得的电子密度和电子温度相对于朗缪尔探针所得结果的误差. 可以看出, 整体上, 电离室内电子密度随着测点位置远离阴极, 呈现逐渐下降的趋势. 这是由于随着测点远离阴极, 阴极发射的电子沿电离室径向逐渐扩散, 轴线上的电子密度因而逐渐减小. 受到电离室内会切型磁场的影响, 电子在磁尖端附近存在一定的聚集效应, 导致6号位置处电子密度有所抬升. 图 11 (a)考夫曼离子源中电子密度的诊断结果; (b)考夫曼离子源中电子温度的诊断结果; (c)最小二乘方法和神经网络方法获得的电子密度结果的相对误差; (d)最小二乘方法和神经网络方法获得的电子温度结果的相对误差. “探针”、“最小二乘”和“神经网络”分别表示由朗缪尔探针、最小二乘方法和神经网络方法获得的诊断结果 Figure11. (a) Diagnostic results of ne in Kaufman ion source; (b) diagnostic results of Te in Kaufman ion source; (c) relative error of ne by least-square method and neural network method; (d) relative error of Te by least-square method and neural network method. “探针”, “最小二乘”, “神经网络” denotes the diagnostic results obtained by Langmuir probe, least-square diagnostic method and neural network diagnostic method, respectively.