基于改进GAN算法的电机轴承故障诊断方法

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2020-03-23

徐林, 郑晓彤, 付博, 田歌
东北大学信息科学与工程学院，辽宁沈阳 110819
收稿日期：2019-01-08
基金项目：国家自然科学基金资助项目(61573087)。
作者简介：徐林(1970-)，男，辽宁沈阳人，东北大学教授，博士。

摘要：提出一种基于改进GAN(生成对抗网络)的滚动轴承故障诊断方法，以振动信号作为主要依据，结合连续小波变换处理非平稳信号的能力和半监督生成对抗网络(semi-supervised generation adversarial networks, SSGAN)处理和识别图像的功能，在半监督生成对抗网络的基础上引入条件模型并对损失函数进行优化，指导生成器和判别器的训练.首次将改进GAN算法应用于故障诊断领域并利用其生成模型和半监督学习能力分别解决了样本数据不足和样本标记问题.实验表明，连续小波变换与改进GAN结合的故障诊断方法与其他主流诊断方法相比能达到较高准确率.
关键词：轴承连续小波变换时频图半监督学习GAN(生成对抗网络)故障诊断
Fault Diagnosis Method of Motor Bearing Based on Improved GAN Algorithm
XU Lin, ZHENG Xiao-tong, FU Bo, TIAN Ge
School of Information Science & Engineering, Northeastern University, Shenyang 110819, China
Corresponding author: ZHENG Xiao-tong, E-mail: zxtneu@163.com
Abstract: A fault diagnosis method was proposed for rolling bearing based on improved generation adversarial networks(GAN). Taking the vibration signal as the main basis, combined with the ability of continuous wavelet transform to process non-stationary signals and the functions of semi-supervised generation adversarial networks (SSGAN) processing and image recognition for fault diagnosis, the condition model was introduced based on semi-supervised generation adversarial networks, and the loss function was optimized to guide the generator and discriminator. For the first time, the improved GAN algorithm was applied to the field of fault diagnosis and its generation model and semi-supervised learning ability were used to solve the problem of sample data shortage and sample labeling. Experimental results showed that the fault diagnosis method combining continuous wavelet transform and improved GAN can achieve higher accuracy than that of the other mainstream diagnostic methods.
Key words: bearingcontinuous wavelet transformtime-frequency representationssemi-supervised learninggeneration adversarial networksfault diagnosis
工业生产过程中，电机出现故障的频率相对较高，作为一种由轴承、定子、转子等组成的综合电气设备^[1]，造成其故障的原因及类型多样，其中，轴承故障最为常见，因此，对于电机轴承的故障诊断具有理论和实际意义.
轴承故障诊断常用的方法是振动分析法，对于采集的振动信号进行分析和预处理，然而轴承振动信号具有非平稳性等特点^[1]，因此对其进行特征提取变得尤为困难，而连续小波变换(CWT)作为一种时频分析方法，能够有效提取非平稳信号的时频特征.CWT的作用是以一维信号作为输入，其时频分析结果本质上是反映信号在不同时间和频率的能量强度二维图谱，输出以时频图的形式展现.目前，连续小波变换在机械故障诊断与检测、气象、医学等领域均得到广泛应用.例如，文献[2-3]提出CWT分别与反向传播(BP)神经网络、支持向量机(SVM)以及卷积神经网络(CNN)相结合实现不同电机的故障诊断.但是上述大多数应用中特征向量是以时频图作为基础而人为构造的，而且所选网络特征学习表达能力有限^[4]，存在一定弊端.
Goodfellow等提出了生成对抗网络(generation adversarial networks，GAN)，利用生成器和判别器的相互对抗，不断优化网络，达到更好的效果^[5].GAN具有多个隐藏的深度学习网络模型，具有良好的特征学习能力.最初，GAN主要应用于数据生成以及图像生成，用于解决样本数据不足的问题，随着研究的深入，GAN的衍生模型不断提出，其中以半监督学习为基础提出半监督生成对抗网络(semi-supervised generation adversarial networks，SSGAN)^[6]，SSGAN与GAN结构类似，生成器结构保持不变，判别器在二分类器的基础上添加输出层达到多分类功能，自提出后逐渐被应用于语音的生成与识别^[7]、图像识别以及样本分类等领域.例如，文献[8]提出将SSGAN应用于人体动作识别，将视频以帧为单位截取图片作为网络输入进行动作识别.在上述应用中，SSGAN达到了良好的识别效果.
目前，对于电机轴承故障诊断的研究被专家学者广泛关注，基于各种智能化方法的电机故障诊断技术层出不穷，但是大多数模型采用监督学习的方式，并且所需样本量较大.本文对SSGAN进行改进和优化，提出一种基于连续小波变换和改进GAN的电机轴承故障诊断方法，采用一维振动信号作为原始信息，经过预处理后生成时频图，以此作为网络的输入进行轴承故障检测与诊断.
1 模型描述1.1 连续小波变换(CWT)对于任意的L²(R)空间中的函数f(t)，其CWT的定义为

(1)

(2)

式中:a为尺度因子；τ为平移因子；ψ_{a, τ}(t)为小波基函数^[9].
通过对信号进行CWT，相当于将原来的一维信号投影到二维平面，CWT的时频图上同时反映了振动信号的频率随时间变化的关系.
1.2 改进生成对抗网络SSGAN由生成器和判别器组成，生成器属于生成式模型，与其他模型不同之处在于生成器不需要预先建模，而是通过与判别器的对抗过程不断生成逼近真实数据的生成数据，然而由于缺少限制条件，导致生成数据过于自由.针对上述问题，本文提出一类改进GAN算法，在SSGAN算法的基础上添加条件变量，使用额外信息对模型增加条件指导生成器和判别器的训练过程.
该算法主要用于故障诊断领域，因此选取故障种类作为条件变量与生成器进行连接.为了增强条件变量的指导作用，将4维故障标签与生成器每一层的输入连接后作为整体输入到下一层网络中，需注意的是，输入为三维张量时需将故障标签转换为三维张量通过第3个通道进行连接，例如在第一层反卷积层将故障标签转化为(1, 1, 4)与噪声(1, 1, 100)连接为(1, 1, 104)作为反卷积层输入.由于判别器执行识别功能而不能引入条件变量干扰模型的识别能力.根据故障诊断的特点以及条件变量的影响对损失函数进行优化，在生成器损失函数中增加了条件变量C以达到更好的训练效果.
改进GAN的生成器由若干反卷积层、激励层以及选取的防止过拟合和加快训练速度方法组成，对于输入的n维噪声信号连接条件变量，最终输出与真实信号几近相同的“假”信号，可以达到以假乱真的状态，有利于扩充样本，达到更好的训练效果.判别器由若干卷积层、激励层、全连接层、分类输出层以及相应的防止过拟合和加快训练速度的方法组成，判别器将真实信号即所需进行检测的信号和生成器生成的“假”信号同时作为输入，与其他方式的不同点在于判别器最终输出的类别为K+1类(K为故障信号种类，1为“假”信号)^[6]，改进GAN算法的流程结构图如图 1所示.
图 1(Fig. 1)

图 1 流程结构图Fig.1 Process structure diagram

2 实验与结果分析基于改进GAN算法的轴承故障诊断，使用CWT将一维振动信号转化为频率-时间-小波系数图(时频图)，达到对振动信号的时频分析，获得更加全面细致的信息，利用GAN的特征提取以及图像识别能力，以压缩后的时频图作为输入，既能降低特征图各维的大小，又能提高训练速度.
2.1 样本集构造本文使用的实验数据为凯斯西储大学(Case Western Reserve University，CWRU)轴承数据库的滚动轴承振动加速度数据^[10].该实验以电机驱动端的轴承作为诊断对象，测试滚动体、内圈及外圈故障.
采集到的振动信号以mat文件的形式保存读取文件并将信号进行分割处理，其中每个样本包括1 024个采样点，在4种工况下按照故障种类以及损伤直径分别取样，其中每种工况下正常信号样本为450个，3种故障信号各为150个，最终得到4种状态下样本数据各为1 800个.
将分割后的信号绘制原始信号振动波形图，如图 2所示.
图 2(Fig. 2)

图 2 原始振动信号波形图Fig.2 Waveform of the original vibration signal

在绘制振动信号波形图后对分割信号进行CWT处理，选择cmor3-3小波作为CWT小波基函数，以图 2的信号进行CWT为例，图 3为其所对应的时频图以及进行压缩处理后的时频图.
图 3(Fig. 3)

图 3 时频图以及压缩后的时频图Fig.3 Time-frequency diagram and compression diagram (a)—正常信号；(b)—内圈故障；(c)—外圈故障；(d)—滚动体故障.

经过数据预处理后，可以得到每种工况下的二维时频图各1 800个，选取其中的75%作为训练样本，其余25%作为测试样本.在读取样本图片时，对不同的故障类型进行标记，原始标签为一位数字，为了便于定义和使用，利用one_hot转换为向量，标签配置如表 1所示.
表 1(Table 1)

表 1 标签配置Table 1 Label configuration

信号类别	原始标签	one_hot
外圈故障	3	[0 0 0 1]^T
滚动体故障	2	[0 0 1 0]^T
正常信号	1	[0 1 0 0]^T
内圈故障	0	[1 0 0 0]^T

表 1 标签配置 Table 1 Label configuration

2.2 网络模型的构建2.2.1 损失函数在网络搭建前需要根据任务的需求选择和构造适当的损失函数来指导训练，在改进GAN中包括判别器损失和生成器损失，其中在生成器损失中引入条件指导数据生成.
1) 判别器损失函数.作为半监督学习，损失函数包含监督学习和无监督学习两部分:

(3)

其中:

(4)

(5)

对于无监督学习而言，在识别中不需识别种类，只需输出真假即可，因此，可以令

(6)

其中:p_model表示判别为假的概率；D(x)则表示输出为真的概率.那么无监督学习的损失函数又可表示为

(7)

2) 生成器损失函数.生成器的主要思想在于使生成器构造的‘假’信号经过判别器的各层计算训练之后与真实信号输入到判别器得到的结果尽可能相似，因此，损失函数公式如下：

(8)

其中f(x)为判别器每一层输出.
在训练过程中，损失函数作为指导依据，利用梯度下降来更新生成器和判别器，在生成器与判别器的对抗中当某一方损失函数不断下降且稳定于较小值时，表示相应的网络模型性能更佳，而另一方则处于劣势.
2.2.2 训练算法SSGAN训练算法
输入:iteration:迭代次数；labeled_rate:标签率；batch_size:批处理量(令其为m)
For iteration=1，…，iteration
取m噪声样本{z¹…z^m}，来自于噪声分布p_z
取m诊断样本(包括样本数据及对应标签){(x¹, y¹)…(x^m, y^m)}，来自于真实样本
根据labeled_rate抹除部分样本标签
根据梯度下降更新生成器(G)与判别器(D)

输出:K+1类诊断结果(K类故障+1类生成样本)
End for
2.2.3 训练结果分析将经过数据预处理后并打包为文件的样本分别作为SSGAN和改进GAN的输入信号，对网络进行训练，网络训练参数设置如下:batch_size=100，labeled_rate=0.5，iteration=1 000.在此设置下训练结果(图 4)为两种模型故障识别准确度，图 5，图 6分别为改进GAN判别器和生成器损失函数变化曲线图.
图 4(Fig. 4)

图 4 训练准确度曲线Fig.4 Training accuracy curve

图 5(Fig. 5)

图 5 判别器损失函数曲线Fig.5 Discriminator loss function curve

图 6(Fig. 6)

图 6 生成器损失函数曲线Fig.6 Generator loss function curve

图 5中，D-loss表示判别器总体损失函数，D-supervised loss表示监督损失函数，D-unsupervised loss表示无监督损失函数.
通过训练曲线可以发现，原始SSGAN训练准确率维持在96%左右，改进GAN在97.2%左右，且改进后的准确率方差减小.判别器的损失函数由监督以及半监督损失组成，SSGAN判别器损失函数收敛于0.21，改进GAN收敛于0.11，SSGAN生成器的损失函数在8.5左右，改进GAN在8.35左右.由结果得出改进GAN算法的故障诊断能力优于原始SSGAN.
2.3 结果分析2.3.1 半监督强度的影响本文与其他方法的不同点之一在于采取了半监督学习的方式，训练所采用的标记样本数通过参数labeled_rate决定，因此选取了labeled_rate分别为0.1，0.3，0.5，1，即标记样本数分别占样本总量的10%，30%，50%，100%，其中100%时为监督学习方式，观察训练结果，将4种结果整理于表 2.
表 2(Table 2)

表 2 不同labeled_rate的准确率与损失Table 2 Accuracy and loss of different labeled_rate

labeled_rate	准确率/%	判别器损失	生成器损失
0.1	96.5	0.157	7.233
0.3	96.9	0.127	8.023
0.5	97.2	0.111	8.347
1	97.8	0.0953	8.162

表 2 不同labeled_rate的准确率与损失 Table 2 Accuracy and loss of different labeled_rate

在标记样本数不同的情况下，labeled_rate增大时，即有标记样本数所占比例较大时，识别的准确率稍高.
2.3.2 批处理量的影响根据半监督参数的影响，选取labeled_rate为0.5固定值，选取批处理量分别为50, 100, 150, 200进行对比，在表 3中列举出准确率以及损失函数.
表 3(Table 3)

表 3 不同batch_size的准确率与损失Table 3 Accuracy and loss of different batch_size

batch_size	准确率/%	判别器损失	生成器损失
50	98	0.099	7.748
100	97.2	0.118	8.347
150	96.97	0.119	8.822
200	96.55	0.123	8.225

表 3 不同batch_size的准确率与损失 Table 3 Accuracy and loss of different batch_size

在批处理量不同的情况下，可观察出批处理量较小时，准确度略高.
2.3.3 不同诊断方法对比为了验证本文方法的轴承故障诊断效果，将此方法与现有其他轴承故障诊断方法^[11-12]比较，均采用相同的数据集.文献[3]中连续小波变换与卷积神经网络结合的诊断准确率为97%；对文献[13]中集合经验模态分解与包络谱分析方法进行复现，诊断准确率为90%；文献[14]中基于一维卷积神经网络的自适应诊断算法的诊断准确率为96.3%.对比得出本文提出的方式达到了良好的效果，本文方法选择批处理量为50，标签率为50%，对比结果见表 4.
表 4(Table 4)

表 4 不同诊断方法对比Table 4 Comparison of different diagnostic methods

故障诊断方法	平均准确率/%
CWT+CNN^[3]	97
EEMD+包络谱^[13]	90
ACNN-FD^[14]	96.3
CWT+改进GAN(本文方法)	98

表 4 不同诊断方法对比 Table 4 Comparison of different diagnostic methods

3 结论1) 证明了改进GAN运用于电机轴承故障诊断的可行性.实验结果显示labeled_rate=0.5, batch_size=50时的平均准确率为98%，可以得出改进GAN算法能达到良好的效果.
2) 本文的方法利用了改进GAN的半监督学习能力，在实验中选取batch_size=100，labeled_rate=0.1时可以达到96.5%的准确率，在batch_size=50，labeled_rate=0.5条件下可达98%，改进GAN应用于故障诊断是合理有效的.
3) 通过样本以及训练参数的选取可以发现模型具有很好的稳定性和泛化能力，样本涉及不同的损伤直径及负载，在取参不同时模型仍达到良好的诊断结果.此外，与其他方法比较，批处理量可容许范围大，batch_size=50时，准确率达到98%，随着批处理量增加，准确率有所下降，但仍可达到96.55%以上.
参考文献

[1]	Yang Z, Gao L. Wavelet analysis and fault feature extraction of rolling bearing[M]. London: Springer, 2014.
[2]	Jawade A, Paraskar S, Jadhav S. Artificial neural network based induction motor fault classifier using continuous wavelet transform[J].Systems Science & Control Engineering, 2014, 2(1): 684–690.
[3]	袁建虎, 韩涛, 唐建, 等. 基于小波时频图和CNN的滚动轴承智能故障诊断方法[J].机械设计与研究, 2017, 33(2): 93–97. ( Yuan Jian-hu, Han Tao, Tang Jian, et al. An approach to intelligent fault diagnosis of rolling bearing using wavelet time-frequency representations and CNN[J].Machine Design and Research, 2017, 33(2): 93–97.)
[4]	徐久强, 洪丽萍, 朱宏博, 等. 一种用于肺结节恶性度分类的生成对抗网络[J].东北大学学报(自然科学版), 2018, 39(11): 1556–1562. ( Xu Jiu-qiang, Hong Li-ping, Zhu Hong-bo, et al. Generative adversarial networks for the classification of lung nodules malignant[J].Journal of Northeastern University(Natural Science), 2018, 39(11): 1556–1562.DOI:10.12068/j.issn.1005-3026.2018.11.008)
[5]	Goodfellow I, Pouget-Abadie J, Mirza M, et al.Generative adversarial nets[C]//Proceedings of the 27th Conference on Advances in Neural Information Processing Systems.Montreal: Curran Associates, Inc, 2014: 2672-2680.https://www.researchgate.net/publication/319770355_Generative_Adversarial_Nets?ev=prf_high
[6]	Salimans T, Goodfellow I, Zaremba W.Improved techniques for training GANs[EB/OL].(2016-06-10).https://arxiv.org/abs/1606.03498.
[7]	Yu L T, Zhang W N, Wang J, et al.SeqGAN: sequence generative adversarial nets with policy gradient[C]//Proceedings of the 31st AAAI Conference on Artificial Intelligence.San Francisco, 2017: 2852-2858.https://www.researchgate.net/publication/308324937_SeqGAN_Sequence_Generative_Adversarial_Nets_with_Policy_Gradient
[8]	Ahsan U, Sun C, Essa I.DiscrimNet: Semi-supervised action recognition from videos using generative adversarial networks[EB/OL].(2018-01-22).https://arxiv.org/abs/1801.07230.
[9]	Levie R, Sochen N.A wavelet Plancherel theory with application to sparse continuous wavelet transform[EB/OL].(2018-08-17).https://arxiv.org/abs/1712.02770.
[10]	Lolparo K A.Bearing vibration data set[D].Cleveland: Case Western Reserve University, 2003.
[11]	Lyu L, Yuan R, Song G B. Multivariate empirical mode decomposition and its application to fault diagnosis of rolling bearing[J].Mechanical Systems and Signal Processing, 2016, 81: 219–234.DOI:10.1016/j.ymssp.2016.03.010
[12]	Chen Z Q, Li C, Sanchenz R. Gearbox fault identification and classification with convolutional neural networks[J].Shock and Vibration, 2015(2): 1–10.
[13]	李辉, 郑海起, 唐立伟. 声测法和经验模态分解在轴承故障诊断中的应用[J].中国电机工程学报, 2006, 26(15): 124–128. ( Li Hui, Zheng Hai-qi, Tang Li-wei. Application acoustic emission and empirical mode decomposition to faults diagnosis of bearing[J].Proceeding of the CSEE, 2006, 26(15): 124–128.DOI:10.3321/j.issn:0258-8013.2006.15.023)
[14]	曲建岭, 余路, 袁涛, 等. 基于一维卷积神经网络的滚动轴承自适应诊断算法[J].仪器仪表学报, 2018, 39(2): 134–143. ( Qu Jian-ling, Yu Lu, Yuan Tao, et al. Adaptive fault diagnosis algorithm for rolling bearings based on one-dimensional convolutional neural network[J].Chinese Journal of Scientific Instrument, 2018, 39(2): 134–143.)