微粒碰撞噪声检测(Particle Impact Noise Detection, PIND)方法是目前多余物检测的主要方法,该方法由美国国家航空航天局提出,在美军标MIL-STD-202G[3]中做了详细规定。将被测元器件放置在振动台上,施加一定的振动冲击以激活内部的多余物颗粒,使其进入游离状态,多余物与腔体内壁碰撞产生声信号,由贴附在元器件外表面的传感器采集后以电压形式输出。该信号放大后经扬声器或示波器输出,测试人员可通过听声音及观察波形来判断多余物是否存在。但由于声信号对于人而言不易区分,往往识别准确率较低,随着机器学习的发展,使用计算机进行自动识别成为研究趋势。
针对PIND信号识别,现有研究主要基于机器学习方法。张龙[4]通过小波包变换提取了能量分布向量作为样本特征,分别使用BP(Back Propagation)神经网络与LVQ(Learning Vector Quantization)神经网络实现了4种材质的识别,准确率达80%,具有一定实用价值,但选用的特征较为单一,区分度不足,准确率仍有较大提升空间。陈蕊[5]提出基于经验模态分解、希尔伯特黄变换和非负张量分解的特征向量提取方法,采用相关向量机进行了材质分类,识别准确率达85%,但仅能识别金属与非金属,实际应用时需要更具体的材质分类。陈金豹[6]提取梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)作为特征,使用隐马尔可夫模型(Hidden Markov Model, HMM)实现了4种材质的识别,准确率达91%,但采集的每条信号长达5s,实际工程中若存成数据库数据量过大。
针对现有方法的不足,本文提出了基于支持向量机(Support Vector Machine, SVM)的飞行器多余物识别方法。选取多种时频域特征与MFCC拼接,有效解决特征单一区分度不足的问题;使用SVM训练模型识别材质,能够将低维特征进一步映射至高维空间,对于复杂信号分类问题有较好效果;采集的信号长度仅有一百多毫秒,使数据库保存成为可能。本文方法在3类材质的识别上达到98%的准确率,效果显著。
1 多余物信号分析及预处理 本文基于PIND方法采集多余物信号,其过程如图 1所示。待测试件被固定于转台上,多余物存在于试件腔体内,试件表面固定了声传感器。手摇转台转盘使转台转动,带动试件一起转动,声传感器实时采集振动信号,将电压数据通过PCI数据采集卡传输至计算机。计算机软件将波形实时显示,并不断检查是否达到设定的电压阈值。若内部多余物在转动时游离并碰撞腔体内壁,信号电压突增超过电压阈值,此时则记录触发时间前后若干点信号数据。采集后的信号经由软件算法处理,使用预先训练好的模型进行分析识别,给出识别结果。
图 1 多余物检测系统 Fig. 1 Loose particle detection system |
图选项 |
多余物信号从波形上看包含一个或多个振荡衰减脉冲,脉冲之间存在不定的时间间隔。图 2展示了几种不同材质的多余物信号波形及对应频谱。仅观察时间域上的原始波形难以看出明显差异,但通过观察傅里叶频谱可以看出,信号在频域主要分布在30~160kHz之间,且不同材质的多余物信号频谱分布存在一定差异,因而可以依据频域特征进行分类。另外,实际采集的同种多余物信号也存在频谱差异较大的情况,仅靠时频域特征仍有不足。
图 2 不同材质的多余物信号及对应频谱 Fig. 2 Loose particle signals of different material and corresponding spectra |
图选项 |
预处理主要分为小波去噪和脉冲提取两部分。小波去噪[7]可以有效提高微小多余物信号的信噪比,其关键在于小波基和去噪阈值的选取。Wu等[8]针对PIND信号的小波去噪进行了详细研究,本文据此选取DB4小波及软阈值方法进行小波去噪。
多余物信号中除了脉冲信号以外,在脉冲之间还存在纯噪声段落,取整段信号进行分析有时不足以反映碰撞信号的特征,因此需要预先进行脉冲提取。脉冲提取即从原始信号中检测出多段脉冲的起止点,剔除无脉冲的纯噪声段,用于后续的特征提取。以往研究中大多采用短时能量法[4-6, 9],该方法对于信噪比较高的脉冲能够很好地提取,但对于信噪比较低甚至能量接近于噪声的脉冲往往会遗漏。因此本文采用短时自相关函数法,该方法具有与能量无关的特性,对于小脉冲同样能够提取出来。
设加窗分帧后的第i帧信号为 x i,帧长为Ni,时延为k,短时自相关函数的数学表达式为
(1) |
定义每帧自相关函数的最大值与次大值之比为主次峰比,求每帧的主次峰比作为该帧的函数值。图 3为一段多余物信号及其主次峰比,图 3(a)中深色部分为提取的脉冲段,浅色部分为噪声段。可见,脉冲段的主次峰比相比噪声段明显较小,且幅值不同的脉冲主次峰比值相近,反映出其能量无关特性。在主次峰比图像上使用双门限法搜索脉冲起止点,即可将脉冲分离出来。
图 3 一段PIND信号样例及主次峰比 Fig. 3 An example of PIND signal and main-secondary peak ratio |
图选项 |
2 多余物材质识别 2.1 基于SVM的材质识别方法 基于SVM的多余物材质识别方法主要有以下步骤:
步骤1多余物信号的预处理。对原始信号进行小波去噪,提高信噪比。使用短时自相关函数法提取脉冲信号,用于后续的特征提取。
步骤2提取多余物信号特征。根据2.2节方法提取时域特征、频域特征及MFCC特征,将其拼接作为样本特征。本文提取时频域特征共10维,MFCC特征24维,共计34维特征作为样本的特征向量。
步骤3训练SVM模型。将人工标注的、包含不同材质多余物信号的特征库作为训练样本集,训练相应的SVM模型。
步骤4使用训练好的模型对未知样本进行识别。对未知信号进行预处理及特征提取,将提取的特征向量输入到SVM模型,根据输出标签判别材质。
整体方案流程可用图 4表示。
图 4 基于SVM的材质识别方法流程 Fig. 4 Process of method for material identification based on SVM |
图选项 |
2.2 特征向量提取 原始信号数据量多达几万个采样点,不适用于传统机器学习方法,需要提取维度较低的特征向量。时频域特征在信号识别中应用广泛,本文提取了脉冲过零率、脉冲平均时间、峰值频率、频谱质心、频谱方差、频谱四分位点、带宽等时频域特征。此外,由于人工特征MFCC在语音识别领域应用广泛,本文还提取了MFCC特征,将其与时频域特征拼接作为完整的特征向量。
2.2.1 时频域特征提取 脉冲过零率定义为脉冲段信号单位时间内通过零点的次数,其计算公式为
(2) |
式中:x 为经脉冲提取后的脉冲信号;N为脉冲信号总点数;fs为采样频率;sgn(x)为符号函数,x < 0,sgn(x)=-1,x>0,sgn(x)=1,x=0,sgn(x)=0。
脉冲平均时间定义为多段脉冲的平均持续时间,即脉冲总时间除以脉冲个数,其衡量的是连续撞击过程中单次振动的平均时间。
峰值频率定义为频谱(指幅度谱)峰值处对应频率,其代表频谱中幅度最大的频率分量。先通过傅里叶变换并取绝对值求得频谱,去除直流分量后取幅值最大处对应频率作为峰值频率。
频谱质心定义为以频谱幅值作为权重求得的平均频率,其反映了频谱集中分布的中心,计算公式为
(3) |
式中:fi为离散频谱的第i个频率;Ai为该频率对应的频谱幅值;L为离散频率分量个数。
频谱方差定义为频谱幅值向量的方差,其反映了频谱的分散程度,对于频谱分布集中的信号,其频谱方差较小,反之则较大。
频谱四分位点定义为频谱图上从低频率到高频率曲线与横轴所围面积占总面积比例分别达25%、50%、75%的点对应频率,其可以反映频谱的整体分布情况。
带宽是衡量信号频域范围的指标,其计算公式为
(4) |
类似于频谱方差,带宽可以反映频谱的分布范围。
2.2.2 MFCC特征提取 MFCC[10]在语音识别领域应用广泛,其综合了信号的时频域信息,提取过程如图 5所示。
图 5 MFCC提取过程 Fig. 5 Process of MFCC extraction |
图选项 |
MFCC的主要提取步骤如下:
步骤1预处理。先将原信号通过一个高通滤波器,以突出信号的高频部分。设定帧长和帧移后进行分帧,再对每帧加汉明窗,得到每帧的时域信号。
步骤2对每帧信号进行离散傅里叶变换(DFT)得到其频谱,取绝对值的平方得到每帧的能量谱。
步骤3将每帧的能量谱通过一组Mel滤波器并取对数,得到对数化的Mel能量谱。Mel滤波器组如图 6所示,其为一组分布在不同频段的三角带通滤波器。
图 6 Mel滤波器组 Fig. 6 Mel filter set |
图选项 |
Mel滤波器在Hz频率域非均匀分布,但在Mel频率域均匀分布,Mel频率与Hz频率的转换公式为
(5) |
步骤4对Mel能量谱作离散余弦变换(DCT),即可得到MFCC系数,DCT公式为
(6) |
式中:s i为第i帧的对数Mel能量谱;n为滤波器序号;Nf为滤波器个数。当M取12时,即可得到12维MFCC系数。
步骤5取原12维MFCC系数及其一阶差分共24维系数作为MFCC特征向量,一阶差分MFCC的计算公式为
(7) |
式中:MFCC i为第i帧的MFCC系数; P为总帧数。
2.3 支持向量机 SVM[11]是统计学习中一种应用广泛的有监督机器学习算法,其基本思想是:通过核方法将低维空间中的原始样本特征映射到高维空间的高维样本特征,使得在原空间中线性不可分的样本变得线性可分。在高维空间中,借助凸优化技术求解最优超平面,将2类样本划分开来。
SVM通过核函数来实现低维空间到高维空间的映射,常用核函数有线性核、多项式核、径向基函数(RBF)核及Sigmoid核等,不同核函数在不同分类任务上效果有所差异。核函数的选取目前仍是一个未决问题[12],通常凭借经验选择。本文对不同核函数进行初步实验对比后,选择了效果较好的RBF核,其表达式为
(8) |
式中:σ为RBF核的带宽,需要根据实际选取。
SVM针对二分类任务设计,为应用于多分类任务,本文采用“一对一”训练方法[13]。在训练时,对每两类样本训练一个SVM分类器,则对于类问题,共训练k(k-1)/2个分类器。分类时,将测试样本分别输入到各分类器中,由每个分类器给出的标签进行投票,取票数最多的一类作为分类结果。图 7显示了4分类SVM的判别过程,从分类器到类别的连线表示该分类器可能给出的类别,实线表示其对于某输入样本实际给出的结果。在6个分类器的投票下,1~4类分别获得了3、1、1、1票,因此最终判别为类别1。
图 7 SVM多分类策略 Fig. 7 SVM multi-classification strategy |
图选项 |
在常用的软间隔SVM[12]中,共有2个参数(惩罚因子C及RBF核带宽σ)需在训练前选取。C和σ的选取对于训练结果有很大影响,C影响模型对于样本错分的容忍度,而σ影响分离面的平滑度[14]。本文使用网格搜索法[15]寻找最优参数,预先确定一个大的C和σ的搜索范围(C1, C2)、(σ1, σ2)及搜索步长p。从C1和σ1开始,遍历所有处于搜索网格(见图 8)上的C和σ作为
图 8 搜索网格 Fig. 8 Grid for search |
图选项 |
参数进行训练,获取每组参数下交叉验证的分类准确率,最后取准确率最高的一组参数作为训练参数,重新训练最终模型。该过程可用图 9表示。
图 9 网格搜索过程 Fig. 9 Process of grid search |
图选项 |
3 实验 3.1 实验环境 信号检测系统由转台和上位机组成,转台用于激活微粒,上位机用于信号采集与分析,由高灵敏度的声传感器、信号调理电路、PCI数据采集卡和计算机软件组成。数据由PCI数据采集卡采集,并由计算机软件进行检测识别。图 10为采集信号所使用的实际设备。
图 10 实验设备 Fig. 10 Experiment equipment |
图选项 |
3.2 实验设计与结果分析 本节实验针对3种材质的多余物(锡渣、环氧、细丝)进行了识别实验,为适应不同轻重的情况,选取的多余物质量分布在0.1~4mg之间。其中,锡渣有1、2、3、4mg四种,环氧有0.1、0.5、1、3、4mg五种,细丝有0.1、0.5、1mg三种。采集3种材质的样本各500个,共计1500个样本,随机抽取1000个作为训练集,剩余500个作为测试集。SVM网格搜索范围为2-5~25,步长为2。
表 1为仅使用时频域特征的识别实验结果,表 2为结合时频域特征与MFCC的识别实验结果。仅使用时频域特征整体准确率约93%,而结合MFCC特征后可达到98%,结果表明MFCC对时频域特征起到了很好的补充作用。
表 1 仅使用时频域特征的识别结果 Table 1 Identification results by using features in time and frequency domain
材质 | 样本数 | 正确识别数 | 错误识别数 | 识别准确率/% |
锡渣 | 181 | 174 | 7 | 96.13 |
环氧 | 169 | 150 | 19 | 88.76 |
细丝 | 150 | 143 | 7 | 95.33 |
表选项
表 2 时频域特征与MFCC组合的识别结果 Table 2 Identification results by using features in time and frequency domain combined with MFCC
材质 | 样本数 | 正确识别数 | 错误识别数 | 识别准确率/% |
锡渣 | 181 | 176 | 5 | 97.24 |
环氧 | 169 | 167 | 2 | 98.82 |
细丝 | 150 | 148 | 2 | 98.67 |
表选项
表 3从材质类别、颗粒质量、信号长度、识别准确率等多方面对比了本文及同类研究(参见文献[5-6])的实验结果。可以看出,本文方法大幅减小了信号长度,同时取得了更好的识别准确率。
表 3 与同类方法的结果对比 Table 3 Result comparison with other methods
方法 | 材质类别 | 颗粒 质量/mg | 信号 长度/s | 识别 准确率/% |
文献[5] | 金属与非金属 | 1.8~4.4 | 10 | 85 |
文献[6] | 铝、锡、导线、芯片 | 1~4 | 5 | 91 |
本文 | 锡渣、环氧、细丝 | 0.1~4 | 0.128 | 98 |
表选项
4 结论 1) 针对飞行器多余物信号识别任务,提出将时频域统计特征与MFCC特征结合起来,尽管MFCC常用于语音识别领域,但其应用于多余物信号的分类识别问题同样有效。
2) 基于特征使用SVM训练构建分类器,在3类材质的多余物信号上能够达到98%左右的准确率。实验验证其能够有效对多余物信号进行区分,可以代替人工识别,具有较高实用价值。
3) 本文方法依赖于人工选择特征,对不同实验条件下的数据不一定完全适用。未来可以使用深度学习避免人工特征提取,提高算法的通用性。
参考文献
[1] | 王国涛, 王强, 韩笑, 等. 密封电子元器件多余物检测技术综述[J]. 机电元件, 2017, 37(1): 55-63. WANG G T, WANG Q, HAN X, et al. Summarize of loose particles detection method for sealed electronic components[J]. Electromechanical Components, 2017, 37(1): 55-63. DOI:10.3969/j.issn.1000-6133.2017.01.014 (in Chinese) |
[2] | 西印. 多余物导致发射失败质子号发动机厂受到批评[J]. 导弹与航天运载技术, 2000(2): 63. XI Y. Loose particles cause launch failure and proton engine factory is criticized[J]. Missle and Space Vehicles, 2000(2): 63. (in Chinese) |
[3] | United States Department of Defense.Test method standard electronic and electrical component parts: MIL-STD-202G[S]. Washington, D.C.: United States Department of Defense, 2002: 4-7. |
[4] | 张龙.星载电源多余物检测系统的研究[D].哈尔滨: 哈尔滨工业大学, 2010. ZHANG L.Research on particles detection and identification system for aerospace power[D].Harbin: Harbin Institute of Technology, 2010(in Chinese). |
[5] | 陈蕊.航天电子装置多余物检测与材质识别方法研究[D].哈尔滨: 哈尔滨工业大学, 2014. CHEN R.Research on detection and classification method of remainders in aerospace electronic equipments[D].Harbin: Harbin Institute of Technology, 2014(in Chinese). |
[6] | 陈金豹.密封电子设备多余物检测的信号特征识别与置信度评价[D].哈尔滨: 哈尔滨工业大学, 2015. CHEN J B.Signal pattern recognition and confidence evaluation for loose particle detection of sealed electronic devices[D].Harbin: Harbin Institute of Technology, 2015(in Chinese). |
[7] | HSUNG T C, LUN D P K, SIU W C. Denoising by singularity detection[J]. IEEE Transactions on Signal Processing, 1999, 47(11): 3139-3144. DOI:10.1109/78.796450 |
[8] | WU Y G, WANG S C, WANG S J.Research on wavelet threshold de-noising method of remainder detection for stand-alone electronic equipments in satellite[C]//International Conference on Pervasive Computing Signal Processing & Applications.Piscataway, NJ: IEEE Press, 2010: 1013-1017. |
[9] | 王强.密封电子元器件多余物检测信号调理优化与组件信号识别[D].哈尔滨: 哈尔滨工业大学, 2018. WANG Q.Signal conditioning optimization and component signal recognition for redundant particles detection of sealing electronic components[D].Harbin: Harbin Institute of Technology, 2018(in Chinese). |
[10] | DAVIS S B, MERMELSTEIN P. Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences[J]. IEEE Transactions on Acoustics Speech and Signal Processing, 1980, 28(4): 357-366. DOI:10.1109/TASSP.1980.1163420 |
[11] | CORTES C, VAPNIK V. Support-vector networks[J]. Machine Learning, 1995, 20(3): 273-297. |
[12] | 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016: 121-146. ZHOU Z H. Machine learning[M]. Beijing: Tsinghua University Press, 2016: 121-146. (in Chinese) |
[13] | KNERR S, PERSONNAZ L, DREYFUS G. Single-layer learning revisited:A stepwise procedure for building and training a neural network[M]. Berlin: Springer, 1990: 41-50. |
[14] | SUN L, BAO J, CHEN Y Y, et al. Research on parameter selection method for support vector machines[J]. Applied Intelligence, 2018, 48(2): 331-342. DOI:10.1007/s10489-017-0975-3 |
[15] | STAELIN C.Parameter selection for support vector machines: HPL-2002-354R1[R].Palo Alto: Hewlett-Packard Company, 2003. |