全文HTML
--> --> -->通常情况下, 采用TDLAS技术同时测量混合气体浓度时, 需要根据每一种气体分子吸收谱线的“指纹识别区”设计一套特定波段的监测系统, 也就是气体和激光光源是一一对应的关系, 这也就导致了整套系统的复杂程度和成本的增加. 虽然当两种气体的吸收谱线比较接近并且不会互相重叠时(如CO和CO2在1579 nm附近的吸收谱线), 可以采用温度控制和驱动电流控制的方法使得一台分布反馈式激光器(distributed feedback laser, DFB laser)能够同时扫描过这两种气体的吸收波长, 进而实现两种气体同时在线检测[15]. 这样不仅能够降低检测系统的复杂程度以节省成本, 也提高了系统的响应率和检测速度. 然而像CO和CO2气体的这类相近而又独立的吸收谱线是特殊的, 大多数情况下两种气体之间的吸收谱线足够接近且存在交叉干扰现象. 为了对混合气体中多种成分进行测量, 科研人员进行了多种相关研究[16,17], 如: Zhang等[18]利用中心波长为1578和1747 nm的两个激光器对比了分时锯齿法、光开关法和多频正弦调制法同时检测H2S和HCl两种气体的优缺点; Shao等[19]利用中心波长为2.3 μm的DFB激光器在低压条件下完成了CO和CH4气体的同时检测. 以上方法虽然提高了混合气体实时检测的可靠性, 但是同时也会增加系统电路、光路或者气路的复杂性. 此外, 在某些应用场合, 上述处理方式仍不可避免地遇到谱线间的交叉干扰问题. 例如常温常压下, CO和CH4的吸收谱线存在严重的交叉干扰现象, 特别是在含有高浓度CH4的特殊场合(例如矿井、天然气泄漏检测等), CO的吸收信号会被湮没在不规则的多峰CH4吸收谱线之下, 此时难以对这两种气体, 特别是微量CO气体进行准确地解析.
为了解决上述谱线干扰的共性问题, 进一步实现简化系统复杂程度、降低系统成本、增加系统可靠性的目的, 本文提出了一种基于支持向量回归(support vector regression, SVR)模型的方法, 来解决TDLAS系统遇到的多组分混合气体检测中的谱线干扰问题. 支持向量机在气体检测方面已经得到了广泛应用. Qu等[20]利用改进的网格搜索算法对支持向量机进行参数优化, 建立了气体的红外光谱定量分析方法, 并且在1%—25%浓度范围内对CO2气体进行定量分析, 得到的绝对误差小于4%; Laref等[21]对比了支持向量回归和偏最小二乘回归在定量分析松树精油蒸气应用中的性能, 得出了支持向量回归具有更高测量精度的结论. 本文以微量CO和较高浓度CH4为例, 经过小样本数据集训练得到CO和CH4气体浓度回归模型, 分别为CO-SVRmodel和CH4-SVRmodel. 经不同浓度的气体测量实验验证, 该模型能够显著解决微量CO气体吸收信号在高浓度CH4吸收信号下被湮没的谱线重叠干扰问题, 实现了微量CO和较高浓度CH4的同时检测, 为实现多组分气体的TDLAS同时测量技术奠定了基础和可行性论证.
2.1.TDLAS原理
根据Lambert-Beer定律, 特定波长的激光光束穿过待测气体会被吸收, 透射光强变化可以表示为


为了提高系统的抗干扰能力和检测灵敏度, 引入波长调制技术. 在激光器的扫描信号上叠加一个高频的正弦调制信号, 则激光器在某一时刻t的瞬时频率和出光强度可以表示为











2
2.2.支持向量回归(SVR)原理
SVR原理可以分为线性回归和非线性回归[23], 首先给定一组样本集: (x1, y1), (x2, y2), ···, (xn, yn). 其中, xi (xi∈

当所测气体为单一气体时, 气体浓度与光谱数据之间符合线性关系, 构造线性回归模型如下:

采用ε-不敏感损失函数作为误差函数, 表达式如下:





令





图 1 DFB激光器电流-波长调谐性能曲线Figure1. Current-wavelength tuning curve of DFB laser.
实验装置原理图如图2所示, 分别由电路部分(Part A)、光学部分(Part B)、数据采集与分析部分(Part C)、配气系统(Part D)四个功能模块组成. 首先, 电路部分包括函数发生器、激光驱动器和双通道锁相放大器, 该部分完成DFB激光器驱动以及信号调制和解调的功能. 函数发生器产生低频扫描信号和高频正弦信号, 频率分别为10 Hz和10 kHz. 低频扫描信号使得激光器扫描输出2 cm–1的波长范围, 而高频正弦信号使激光器波长得到调制输出. 通过锁相放大器对接收到的信号进行解调而获得一次谐波信号(1f)和二次谐波信号(2f). 其次, 光学部分包括蝶形封装的DFB激光器、带有光纤准直和光电探测器的光学吸收池, 其光程为20 m. 最后, 在数据采集和分析部分中, 从锁相放大器获得的1f和2f分别包含2000个采样点, 采集触发信号为10 Hz. 最后将1f和2f数据通过串口通信发送给计算机进行分析和计算. 配气系统主要用于不同浓度CO和CH4混合气体的配比, 标准浓度的CO和CH4气体分别通过质量流量计1和质量流量计2混合后通入吸收池, 通过已知的CO和CH4气体浓度和对应质量流量计的读数, 可计算得到混合气体中CO和CH4的浓度.
图 2 实验系统原理图Figure2. Schematic diagram of the experimental system.
图3为HITRAN数据库[24]仿真得到的在上述DFB激光器的扫描波数范围内浓度分别为20 × 10–6和400 × 10–6的CO气体、浓度为1 × 10–2的CH4气体吸收谱线, 该处及下文(包括表1)中气体浓度均为气体对应的体积分数. 可以发现浓度为400 × 10–6的CO气体, 其吸收谱线的峰值信号强度仍然小于浓度为1 × 10–2的CH4气体在该波长位置的吸收信号强度. 所以利用传统的浓度反演方法, 在高浓度CH4气体的大信号背景下, 要实现精确地定量检测微量CO气体是非常困难的, 因此本文采用基于支持向量回归模型解决激光吸收光谱遇到的类似谱线重叠的共性问题.
图 3 CO (20 × 10–6, 400 × 10–6)和CH4 (1 × 10–2)的模拟吸收光谱图Figure3. Simulated absorption spectra of CO (20 × 10–6, 400 × 10–6) and CH4 (1 × 10–2).
| Group | Standard gas category and concentration | Ratio | Gas category and concentration in multi-pass cell | ||
| CO/10–6 | CH4/10–2 | CO/10–6 | CH4/10–2 | ||
| 1 | 19.3 | 0 | — | 19.3 | 0 |
| 2 | 54.0 | 0 | — | 54.0 | 0 |
| 3 | 102.0 | 0 | — | 102.0 | 0 |
| 4 | 0 | 0.50 | — | 0 | 0.50 |
| 5 | 0 | 1.04 | — | 0 | 1.04 |
| 6 | 0 | 2.02 | — | 0 | 2.02 |
| 7 | 0 | 5.02 | — | 0 | 5.02 |
| 8 | 54.0 | 1.04 | 1∶1 | 27.0 | 0.52 |
| 9 | 102.0 | 1.04 | 1∶1 | 51.0 | 0.52 |
| 10 | 19.3 | 1.04 | 1∶1 | 9.6 | 0.52 |
| 11 | 19.3 | 0.50 | 1∶1 | 9.6 | 0.25 |
| 12 | 19.3 | 5.02 | 1∶1 | 9.6 | 2.51 |
| 13 | 19.3 | 2.02 | 1∶1 | 9.6 | 1.01 |
| 14 | 19.3 | 8.50 | 1∶1 | 9.6 | 4.25 |
表1训练数据集
Table1.Training data set.
4.1.模型训练
基于支持向量回归原理和CO, CH4两种气体在2327 nm附近的重叠吸收光谱特征, 选择了14组经过1f归一化处理之后的2f数据(2f/1f)[19]作为训练集构建SVR模型. 训练数据集的气体种类及其对应浓度如表1所列. 其中包含3组CO标气、4组CH4标气、7组CO和CH4混合气体(标气按照1∶1比例配比而成). 经过计算, 光学多通池中气体种类及实际浓度如表1中最后两列所示.选择表1中三组气体, 分别为Group 1 (CO标气), Group 4 (CH4标气)和Group 10 (混合气体), 它们的信号如图4所示, 其对应浓度如图4中图例所示. 对比图4中曲线和划线的差别可知, CH4气体的吸收信号(Group 4)和包含微量CO的混合气体信号(Group 10)在图4黑框中(对应采样点范围为100到500之间)基本一致, 采用传统的计算方法无法将微弱的CO吸收信号解调出来.
图 4 三组气体(Group 1、Group 4、Group 10)的2f/1f信号Figure4. 2f/1f signals of three groups of gases (Group 1, Group 4, Group 10).
而本文基于Matlab R2018a平台, 采用5折交叉验证经过15次迭代构建SVR模型, 并且采用序列最小最优化(sequential minimal optimization, SMO)算法进行参数优化, 得到两个SVR模型, 分别命名为CO-SVRmodel和CH4-SVRmodel, 这两个模型的主要参数如表2中所列. 其中, BoxConstraint(C)为惩罚系数, 主要影响模型的泛化能力; KernelScale是归一化常数; ε是不敏感损失函数设置的损失阈值.
| CO-SVRmodel | CH4-SVRmodel | |
| BoxConstraint(C ) | 0.3443 | 0.0180 |
| KernelScale | 0.0617 | 0.9205 |
| ε | 0.1710 | 65.1810 |
| Total function evaluations | 15 | 15 |
| Total elapsed time in seconds | 26.2545 | 12.5730 |
表2SVR模型主要参数
Table2.Optimal parameters of SVR model.
鉴于混合气体中CO和CH4气体的浓度差距在103—104量级, 且两种气体的吸收峰会产生明显的交叠, 所以为了使两种气体的回归模型都能够得到精准的结果, 两个模型采用的训练数据集不完全相同. CH4-SVRmodel的训练采用整个2f/1f光谱数据进行训练, 能够充分反映CH4气体的吸收谱线特征; CO-SVRmodel则放弃了光谱冗余数据, 选择只包含CO吸收信息的光谱数据(光谱中的第100—500个点之间的范围)进行训练, 如图4中黑色方框所示.
为了初步验证两种气体SVR模型的可用性, 首先对表1中的14组气体分别进行60组测试, 然后根据回归模型(CO-SVRmodel, CH4-SVRmodel)分别对CO和CH4气体进行浓度计算, 得到CO和CH4气体浓度的计算结果分别如图5(a) 和图5(b)所示. 从图5中可以看出, 不管是CO气体还是CH4气体, 基于SVR模型计算得到的结果和真实值相差都不大, 其中CO气体的误差最大值为2 × 10–6, CH4气体的误差最大值为0.16 × 10–2, 该处及下文中误差均是指气体浓度的绝对误差. 并且可以发现CO和CH4气体发生最大误差具有统一性, 即都发生在CO气体浓度为0, CH4气体浓度为5.02 × 10–2时的测量结果. 出现这种结果的原因是CO和CH4气体的浓度相差越大, 就会导致CO信号被湮没地越彻底, 并且在实验中也发现了浓度为5.02 × 10–2的CH4气体在信号稳定(观察信号稳定)后仍然会存在相对大的波动, 也导致了CO和CH4气体的测量结果在此处产生了最大的误差. 经过验证, 采用线性核函数, 并且基于以上两个数据集分别训练得到的两个浓度回归模型比采用整个光谱数据集得到的回归模型更加精确.
图 5 CO和CH4浓度设置值和测试值对比 (a) CO浓度值; (b) CH4浓度值Figure5. Comparisons between set and test values: (a) CO concentration; (b) CH4 concentration.
2
4.2.CO和CH4配比实验
4.1节训练集数据的验证从一定程度上反映了SVR模型对CO和CH4两种气体浓度计算有效. 但是其中训练集和测试集的浓度设置完全一致, 所以不能很好地说明系统具有良好的泛化能力(泛化能力是指对于训练数据集之外的数据仍然能够得到准确的计算结果, 标志着模型是否具有通用性和普适性). 为了更进一步探讨该模型的泛化能力, 进行了气体配比实验.将浓度为102 × 10–6的CO气体与浓度分别为2.02 × 10–2, 4.5 × 10–2的CH4气体进行1∶4, 2∶3, 3∶2, 4∶1比例的混合, 并利用该实验系统对以上配比的混合气体进行检测, 待信号稳定后记录每组混合气体30组的数据, 并对其求平均值, 然后根据两个气体浓度回归模型(CO-SVRmodel和CH4-SVRmodel)对得到的数据进行回归计算. CO和CH4气体浓度的真实值和测量值之间的相关性, 及其测量误差如图6所示.
图 6 设置值和测量值之间相关性及测量误差 (a) CO相关性; (b) CH4相关性; (c) CO测量误差; (d) CH4测量误差Figure6. Correlation and test errors between set and average values: (a) CO correlation; (b) CH4 correlation; (c) CO errors; (d) CH4 errors.
图6(c), (d)可以说明: 基于上文的浓度回归模型分别对CO和CH4气体浓度进行浓度测量, CO和CH4气体浓度误差分别不超过2 × 10–6和0.1 × 10–2; 且由图6(a),(b)可知, CO和CH4的真实值与预测值之间的相关系数分别为0.998和0.9995. 由此可得CO-SVRmodel和CH4-SVRmodel回归模型在固定配比数据集上能够取得良好的浓度回归测量效果, 证明上述两个模型良好的泛化能力.
2
4.3.混合气体浓度定量解析
为了验证该算法在不同浓度的CH4环境下仍能够对微量CO进行准确测量. 将18 × 10–6的CO气体和四种浓度的CH4气体(浓度分别为0.5 × 10–2, 1.04 × 10–2, 2.02 × 10–2, 5.02 × 10–2)进行1∶3的配比, 待信号稳定后进行浓度结果回归计算, 每组配比的气体进行120组数据测量, 其中CO和CH4的浓度真实值如图7中黑色数字标注. CO浓度回归结果和CH4回归结果如图7所示. 从图7中可以看出, 该TDLAS系统结合SVR模型计算得到的CO和CH4气体浓度在较小的范围之内波动. 微量CO气体在受高浓度CH4气体干扰的条件下, 其最大误差小于2 × 10–6; 而CH4气体得到的测量结果最大误差小于0.2 × 10–2, 证明了系统的抗干扰能力, 说明CO-SVRmodel和CH4-SVRmodel能够克服吸收谱线数据中的特征干扰问题并得到精确的浓度回归结果.
图 7 不同浓度CH4对CO测量结果的干扰Figure7. Interference on CO measurement results by different concentrations of CH4.
为了更进一步验证CO-SVRmodel和CH4-SVRmodel两个浓度回归模型的动态可靠性, 利用上述实验系统进行了两组充气过程实验, 分别如下: 在两组过程中均利用CO-SVRmodel和CH4-SVRmodel得到CO和CH4的浓度结果.
第一组充气过程中CO和CH4气体的浓度变化趋势如图8所示. 初始状态气体池中底气为1.04 × 10–2的CH4气体, 在某一时刻, 将浓度为20 × 10–6的CO气体和浓度为1.04 × 10–2的CH4气体按照1:1的配比同时打开, 可以观察到CO气体浓度逐渐上升, CH4气体浓度逐渐下降, 且两者浓度变化过程具有时间上的统一性, 也会随着时间的推移接近按照1:1比例配比的浓度(CO浓度接近10 × 10–6, CH4浓度接近0.52 × 10–2); 当CO和CH4混合气体吸收信号无明显变化, 待信号稳定一段时间后, 关闭CH4气体气阀, 保持CO气体气阀打开, 可以观察到CO气体浓度逐渐上升并趋近20 × 10–6, CH4气体浓度继续逐渐下降并趋近0, 且两者浓度变化过程具有时间上的统一性.
图 8 第一组充气过程中CO和CH4浓度变化Figure8. Concentration measured of CO and CH4 during the first set of inflation.
第二组充气过程中CO和CH4气体的浓度变化趋势如图9所示. 气体池中底气为浓度8.5 × 10–2的CH4气体和浓度20 × 10–6的CO气体按照1:1比例混合的气体, 从图9中可以看出CO和CH4气体均能够获得比较准确且稳定的结果, 在某一时刻, 关闭CH4气体气阀, 保持CO气体气阀打开, 此时会发现CH4气体浓度会微微增大, 再缓慢减小, 直至信号稳定, 此时CH4气体浓度已经减小到0附近并保持; 在关闭CH4气阀的同时, 观察到CO气体浓度会下降约3 × 10–6, 然后再逐渐上升至20 × 10–6左右并保持. 出现上述现象的原因是由于此时混合气体中CH4含量较高(为4.25 × 10–2), 关闭CH4气阀瞬间, 信号会产生波动, 而该波动对多峰的CH4浓度回归计算影响较小, 但是对特征量较少的CO气体浓度回归计算会产生较大的影响.
图 9 第二组充气过程中CO和CH4浓度变化Figure9. Concentration measured of CO and CH4 during the second set of inflation.
通过上述两组充气过程的验证, TDLAS系统结合SVR模型能够对包含微量CO和浓度不超过4.25 × 10–2的CH4的混合气体进行动态实时监测, 且在整个动态过程中能够将CO和CH4的误差分别控制在3 × 10–6和0.5 × 10–2; 待信号稳定后, 利用该回归模型得到的CO和CH4浓度误差仍然不超过2 × 10–6和0.2 × 10–2. 充气动态过程实验充分验证了基于SVR模型解调CO和CH4混合气体重叠干扰吸收谱线的可靠性和完备性.
