基于对不平衡数据集进行二次迁移学习的滚动轴承剥落类故障诊断方法

doi:10.16183/j.cnki.jsjtu.2022.008

基于对不平衡数据集进行二次迁移学习的滚动轴承剥落类故障诊断方法

郭俊锋, 王淼生^,, 王智明

兰州理工大学机电工程学院, 兰州 730050

Fault Diagnosis of Rolling Bearing with Roller Spalling Based on Two-Step Transfer Learning on Unbalanced Dataset

GUO Junfeng, WANG Miaosheng^,, WANG Zhiming

School of Mechanical and Electronic Engineering, Lanzhou University of Technology, Lanzhou 730050, China

通讯作者: 王淼生,硕士生;E-mail:wmiaos@163.com.

责任编辑: 李博文

收稿日期: 2022-01-20 修回日期: 2022-03-2 接受日期: 2022-03-14

基金资助:

国家自然科学基金资助项目(51465034)

Received: 2022-01-20 Revised: 2022-03-2 Accepted: 2022-03-14

作者简介 About authors

郭俊锋(1978-),教授,主要从事现代测试与故障诊断技术研究.

摘要

滚动轴承在运行过程中正常工作状态时间长,故障时间很短,导致数据集不平衡,从而极大地影响深度学习模型故障诊断的准确率.针对该问题,提出一种基于二次迁移学习的滚动轴承不平衡数据集故障诊断方法.首先使用源域和目标域中的少量数据通过条件梯度惩罚生成对抗网络(CWGAN-GP)生成过渡数据集,然后将搭建好的卷积神经网络模型在源域数据集、过渡数据集和目标域数据集之间进行两次迁移,最后使用目标域的少量数据对迁移后的模型进行微调,得到最终的故障诊断模型.实验结果表明,该方法对不同工况下数据集不平衡的滚动轴承剥落类故障有较好的诊断识别效果.

关键词： 迁移学习; 故障诊断; 不平衡数据集; 生成对抗网络

Abstract

Under operating conditions, bearings have a substantial service life with short failure time periods, which leads to unbalanced dataset and greatly affects the accuracy of deep learning model fault diagnosis. To address this problem, a fault diagnosis method of rolling bearing unbalanced dataset based on two-step transfer learning is proposed in this paper. First, a small amount of data in the source and target domains is used to generate the transition dataset by conditional gradient penalized generative adversarial network (CWGAN-GP). Then, the constructed convolutional neural network model is migrated twice between the source domain dataset, the transition dataset, and the target domain dataset. Finally, a small amount of data from the target domain is used to fine-tune the transferred model to obtain the final fault diagnosis model. The experimental results show that the method has a good diagnostic recognition effect on rolling bearing spalling class faults with unbalanced dataset under different working conditions.

Keywords： transfer learning; fault diagnosis; unbalanced dataset; generative adversarial network

PDF (5567KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

郭俊锋, 王淼生, 王智明. 基于对不平衡数据集进行二次迁移学习的滚动轴承剥落类故障诊断方法[J]. 上海交通大学学报, 2023, 57(11): 1512-1521 doi:10.16183/j.cnki.jsjtu.2022.008

GUO Junfeng, WANG Miaosheng, WANG Zhiming. Fault Diagnosis of Rolling Bearing with Roller Spalling Based on Two-Step Transfer Learning on Unbalanced Dataset[J]. Journal of Shanghai Jiaotong University, 2023, 57(11): 1512-1521 doi:10.16183/j.cnki.jsjtu.2022.008

随着机械设备趋向于高精度化、高复杂化、大型化和智能化,机械设备的健康状况影响着生产过程的安全性以及产品质量的稳定性.滚动轴承作为旋转机械的核心支撑部件,旋转机械的安全平稳运行离不开轴承正常工作.因此在实际生产中,对滚动轴承的运行状态进行实时的动态检测、故障分析与预测具有重要意义.

在滚动轴承运行过程中,疲劳、过载以及载荷变化过大等原因极易使轴承内外圈产生表面剥落,导致轴承受到损伤.这种剥落现象的出现是因为轴承内外圈及其滚动体长时间处于弹性变形,并且反复扭曲与弯折.如果主轴弯曲或者损坏,轴承运行过程中也会承受反复的冲击载荷而导致其出现损伤.此外,如果轴承润滑不够或密封不足导致异物侵入,也会使其剧烈磨损导致剥落类故障.因此,对轴承的剥落故障进行状态监测与诊断是保证机械设备正常工作的基础.

机械设备运行过程中的振动信号是进行故障诊断重要且可靠的依据 ^[1-2].传统的故障诊断方法是从原始振动信号中提取有用的故障特征信息,如时域分析方法^[3]、频域分析方法^[4]等,但其十分依赖于技术人员的工作经验,对于经验不足的工作人员来说,这些方法很难达到期望的诊断效果.而且现今机械设备的原始振动信号呈现出海量与复杂的特点,传统的故障诊断方法很难实现对大量复杂数据的精确分析与处理^[5].

随着人工智能技术的深入发展,基于深度学习的诊断方法开始应用于机械设备的故障诊断^[6],这种方法可以从海量的振动数据中自动地学习提取故障特征信息,提取到的信息有助于实现准确的故障分类,减少人工经验对结果的影响,提高故障识别准确率.文献[7]中提出了一种基于深度信念网络的多传感器故障诊断方法,实现了飞机发动机的健康管理;文献[8]中提出了一种基于卷积神经网络结构的轴承故障诊断方法,在噪声环境下具有很高的准确性和鲁棒性;Zhao等^[9]提出了一种基于自适应稀疏算法和无监督极限学习机相结合的滚动轴承故障诊断方法,解决了故障诊断过程中的过拟合和效率低的问题;Zhang等^[10]提出了一种基于深度卷积神经网络的多模型集成深度学习方法,实现对高维数据的故障识别.对于基于深度学习的故障诊断方法而言,如果要实现准确的故障诊断,需要大量带有标签且平衡的训练数据^[11].实际应用中,机械设备在正常工作状态下,可以收集到足够多的正常数据,而故障数据很少,由于成本和时间的限制,机械设备不可能在长时间的故障工况下运行,这就造成了数据集的不平衡.除此之外,基于深度学习的故障诊断方法还存在以下问题:①深度学习模型只有在训练数据集和测试数据集均服从相同分布的情况下才能取得较好的诊断效果;②在转速、负载复杂多变的工况中,基于深度学习的故障诊断模型并不通用;③难以在不同工况下获得足够多带标签的样本训练深度学习模型.

针对上述问题,提出一种基于对不平衡数据集进行二次迁移学习的滚动轴承剥落类故障诊断方法.在该方法中,生成对抗网络(GAN)是一种用于图像生成的深度学习模型,能将一维轴承原始振动信号转换为二维时频图像,更好地发挥其数据生成能力.该方法首先利用小波变换将源域和目标域数据转变为时频图,并使用源域和目标域的少量数据通过条件梯度惩罚GAN(CWGAN-GP)生成过渡数据集,然后使卷积神经网络在源域数据集、过渡数据集和目标域数据集之间进行两次迁移学习得到迁移后的模型,最后使用目标域的少量数据对迁移后的模型微调得到最终的故障诊断模型,从而进行故障诊断.实验结果表明,该方法对不同工况下滚动轴承不平衡数据集的剥落类故障有很好的诊断精度.

1 基本原理

1.1 小波变换

时频分析是一种将原始振动信号的时域频域信息转换到时频域的技术,它比单纯的时域或频域分析更具有优势.轴承振动信号具有非平稳的特性,而小波变换对非平稳信号具有很好的分析效果.虽然短时傅里叶变换也可以将振动信号转换为时频图像,但是其变换的窗口大小是固定的.因此利用小波变换将原始振动信号转换为时频图像,能使信号在低频段具有较高的频率分辨率和较低的时间分辨率,在高频段具有较低的频率分辨率和较高的时间分辨率,这非常符合信号的转换特性^[12-13].小波变换定义^[14]为

(1)W_φ(a,b)=

\frac{1}{\sqrt{a}}

∫x(t)φ^*

\frac{t - b}{a}

dt, a>0

式中:x(t)为给定的时间序列;φ为母小波,φ^*为φ的复共轭;a为控制小波展开的比例;b为标识其位置的平移因子.

1.2 CWGAN-GP网络

GAN是一种深度生成模型,最初由Goodfellow等 ^[15]提出,用于图像生成,模型包括生成器和判别器两部分.该模型能够很好地学习数据的特征并生成与之非常相似的数据,其训练过程是一个零和博弈过程.它以简单的噪声作为输入,通过生成器G将其映射到与真实数据相同的数据空间,判别器D则用来判断生成数据和真实数据,并且在判断过程中提高不被生成数据欺骗的能力.当判别器无法判断时,就说明生成数据的分布与真实数据的分布非常接近.GAN的目标函数如下式所示:

(2)$\begin{array}{l}\min _{G} \max _{D} V(D, G)= \\\quad E_{x \sim P_{\mathrm{r}}}[\log D(x)]+E_{x \sim P_{\mathrm{g}}}[\log (1-D(x))]\end{array}$

式中:P_r为真实数据的分布;P_g是由两个隐式x=G(z)和z~p(z)定义的生成数据分布,其中z从简单的噪声分布中采样得到;D(x)为判别器认为x是真实样本的概率,D的目标是识别输入样本来自真实样本的概率,并将其最大化;G的目标是使生成样本的分布无限接近于真实样本分布;E为数学期望.

但是GAN在训练过程中存在梯度消失、模式崩溃、训练困难、生成数据没有指向性以及生成数据质量差的问题.为了解决GAN存在的上述问题,CWGAN-GP^[16]被提出,该模型将衡量两个分布距离的Jensen-Shannon(JS)散度改为Earth-Mover(EM)距离,也被称为Wasserstein-1距离.同时该模型用梯度惩罚解决了Wasserstein GAN(WGAN)^[17]权重裁剪的问题,并且在模型训练过程中加入标签信息y用于指导模型的训练过程,这些改进解决了GAN 的上述问题,并且在几乎不调节超参数的情况下,就可以生成高质量数据.结构示意图如图1所示.

图1

新窗口打开| 下载原图ZIP| 生成PPT

图1 CWGAN-GP结构示意图

Fig.1 Schematic diagram of CWGAN-GP structure

CWGAN-GP的目标函数式为

(3)$\begin{array}{l}\min _{G} \max _{D} V(D, G)= \\\quad E_{x \sim P_{\mathrm{r}}}[D(x \mid y)]-E_{\tilde{x} \sim P_{\mathrm{g}}}[D(\tilde{x} \mid y)]- \\\quad \lambda E_{\hat{x} \sim P_{\hat{x}}}\left[\left(\left\|\nabla_{\hat{x}} D(\hat{x} \mid y)\right\|_{2}-1\right)^{2}\right]\end{array}$

式中:λ为梯度惩罚系数;Δ为梯度算子;D(x|y)和D( $\tilde{x}$ |y)分别是D识别标签为y的x和 $\tilde{x}$ 来自真实样本的概率; $\hat{x}$ 是沿真实数据分布P_r和生成数据分布P_g之间连线的随机插值采样,

(4)$\begin{array}{l}\hat{x}=\varepsilon x+(1-\varepsilon) \tilde{x}, \quad \varepsilon \sim N[0,1] \\x \sim P_{\mathrm{r}}, \quad \tilde{x} \sim P_{\mathrm{g}}\end{array}$

式中:ε从分布N[0,1]中采样得到.

1.3 迁移学习

迁移学习是将某个领域或任务上学习到的知识或模式应用到不同但相关领域中的方法.根据特征、目标域和学习方法分类,迁移学习可分为基于样本的迁移学习、基于特征的迁移学习、基于参数的迁移学习和基于关系的迁移学习^[18].基于样本、特征、关系的迁移学习方法有特定的适用范围,很难达到理想的迁移效果.在实际应用中,基于参数的迁移学习方法可以共享源域和目标域的模型参数,只需对神经网络进行微调就可以很好地适应目标域,这使得基于参数的迁移学习方法具有通用性和普遍性^[19].

迁移学习的域由特征空间χ和边缘概率分布P(X)两部分组成.假设源域D_S以及源任务H_S为

(5)D_S={χ_S, P(X_S)}

(6)H_S={Y_S, f_S(·)}

式中:Y_S为标签空间;f_S(·)为预测函数.迁移学习可以将源域{(x_S1, y_S1), …, (x_S_n, y_S_n)}的知识信息应用到目标域D_T{χ_T, P(X_T)},从而更加准确地预测目标域特征χ_T对应的输出Y_T的类别.迁移学习的原理如图2所示.

图2

新窗口打开| 下载原图ZIP| 生成PPT

图2 迁移学习原理示意图

Fig.2 Schematic diagram of transfer learning principle

2 二次迁移故障诊断方法

2.1 基于CWGAN-GP的迁移过渡数据集的生成

在迁移学习中,如果源域和目标域差异较大,模型将无法很好地学习源域数据集的信息.本文利用CWGAN-GP构建源域向目标域迁移的过渡数据集,消除了因源域和目标域数据分布差异过大而导致的负迁移^[20]问题.过渡数据集的构造方法如下:首先利用小波变换将源域和目标域原始一维振动信号转变为时频图,然后在目标域与源域训练集中随机选取相等的数据混合形成融合数据集,最后使用融合的数据集训练CWGAN-GP模型,模型收敛后,取出CWGAN-GP的生成器生成过渡数据集.

CWGAN-GP的结构如图3所示,模型结构如下:首先生成器采用反卷积结构,共有5个反卷积层.服从高斯分布的100维噪声随机变量通过卷积,被映射和整形为许多的特征图,最后转换成64像素×64像素×3大小的图像,其中3表示通道数.然后判别器采用卷积结构,共有4个卷积层,输入为64像素×64像素×3的图像,随后通过卷积,被映射和整形为许多卷积表示的特征图.最后,将全连接层作为输出层.在生成器中,前四层卷积核的大小为5×5,最后一层为3×3.在判别器中,卷积核的大小均为3×3.

图3

新窗口打开| 下载原图ZIP| 生成PPT

图3 CWGAN-GP结构

Fig.3 CWGAN-GP structure

2.2 基于二次迁移的故障诊断方法与流程

提出的故障诊断方法首先利用小波变换,将源域和目标域数据的一维原始振动信号转换为时频图,并用源域数据集训练卷积神经网络进行一次迁移,然后用CWGAN-GP生成的过渡数据集再次对一次迁移后的卷积神经网络模型进行训练,然后进行二次迁移,随后用目标域的少量数据对训练好的模型微调,最后进行故障诊断.卷积神经网络结构如图4所示,故障诊断流程图如图5所示.

图4

新窗口打开| 下载原图ZIP| 生成PPT

图4 卷积神经网络结构图

Fig.4 Structure diagram of convolutional neural network

图5

新窗口打开| 下载原图ZIP| 生成PPT

图5 二次迁移学习故障诊断流程图

Fig.5 Fault diagnosis of secondary transfer learning

故障诊断具体步骤如下:

步骤1 利用小波变换将源域和目标域的原始振动信号转换为时频图像,并分为训练集和测试集.

步骤2 在目标域和源域数据中选取少量数据混合成为融合数据集,同时将目标域的少量数据用于对二次迁移后的模型微调.

步骤3 用融合数据集训练CWGAN-GP模型直到其收敛,取出CWGAN-GP的生成器生成数据构造过渡数据集.

步骤4 利用源域数据集训练卷积神经网络,并用测试集进行测试,调整参数直到准确率满足要求,进行一次迁移.

步骤5 在源域数据集的知识进行一次迁移以后,用过渡数据集进行再次训练,直到准确率满足要求,进行二次迁移.

步骤6 固定二次迁移后得到的模型卷积层参数,利用目标域的少量数据对模型进行微调,最后得到故障诊断模型.

步骤7 利用目标域的测试集对模型进行测试,得到故障诊断结果.

3 实验验证

3.1 实验数据集介绍

实验数据集来自凯斯西储大学的公开轴承数据集,该数据集利用电火花对滚动轴承进行损伤,模拟轴承内圈、外圈以及滚动体剥落故障.损伤直径分别为0.007、0.014、0.021和0.028英寸(1 英寸=25.4 mm).试验台的运行负载为0~3 HP(原始数据集中负载单位为HP,1 HP≈745 W),数据集包含轴承4种工作状态,即正常状态、内圈故障、外圈故障以及滚动体故障.数据集的振动信号通过加速度计从试验台采集,试验台如图6所示.该试验台由2 HP电动机(左)、扭矩传感器(中心)、测力计(右)和控制电子设备组成,测试轴承支撑着电动机轴.驱动端轴承型号为SKF6205,风扇端轴承型号为SKF6203.

图6

新窗口打开| 下载原图ZIP| 生成PPT

图6 凯斯西储大学轴承试验台

Fig.6 Bearing test bench of Case Western Reserve University

3.2 数据预处理

实验中,将采样频率为12 kHz的风扇端和驱动端的轴承振动信号分别作为源域和目标域数据集.以风扇端工作负载0,转速 1 797 r/min,且损伤直径分别为0.007、0.014、0.021英寸的故障轴承作为源域研究对象.同时,以驱动端工作负载/转速分别为 0 HP/1 797 r/min、1 HP/1 772 r/min 和 2 HP/1 750 r/min 且损伤直径分别为0.007、0.014、0.021英寸的故障轴承作为目标域研究对象.将上述内圈、滚动体、外圈3种不同类型且不同损伤直径的故障分别记为I(i)、B(i)、O(i)(其中i=1,2,3,分别代表0.007、0.014、0.021英寸的故障大小).对于原始振动信号,为了获得尽可能多的训练样本,采取重叠采样方法,以600个点的长度为一个样本,相邻的段之间有300个点重复.负载为0 时,目标域原始振动信号如图7所示,其中Normal表示无故障的滚动轴承.

图7

新窗口打开| 下载原图ZIP| 生成PPT

图7 目标域原始振动信号

Fig.7 Original vibration signal of target domain

样本分割完成后,对每个样本进行小波变换转变为时频图,在每种工作状况下,可以得到400张时频图像.将风扇端的时频图组成源域数据集,将驱动端每种工况下的时频图组成不同的目标域数据集,每种工况的轴承数据集包含10种状态.源域和目标域数据集的详细信息如表1所示.

表1 源域和目标域数据集信息

Tab.1 Information of source domain and target domain dataset

序号	故障类型	源域 0 HP	目标域
序号	故障类型	源域 0 HP	0 HP	1 HP	2 HP
1	Normal	400	400	400	400
2	I(1)	400	400	400	400
3	I(2)	400	400	400	400
4	I(3)	400	400	400	400
5	B(1)	400	400	400	400
6	B(2)	400	400	400	400
7	B(3)	400	400	400	400
8	O(1)	400	400	400	400
9	O(2)	400	400	400	400
10	O(3)	400	400	400	400

新窗口打开| 下载CSV

目标域中,负载在0下的数据小波变换后的结果如图8所示.在本实验中,实验的电脑系统为Windows10;CPU为Intel Core i7-9700F,3.00 GHz;RAM为16 GB;显卡为GTX1660.编程语言为Python3.6版本,深度学习框架为Keras.

图8

新窗口打开| 下载原图ZIP| 生成PPT

图8 预处理后的样本

Fig.8 Sample after pretreatment

从图8中可以发现,小波变换后的时频图具有很好的特征辨识性,轴承每类故障之间的时频特征基本没有重叠,这说明利用小波变换将原始振动信号转换为时频图,并将其作为卷积神经网络的输入具有优势.此外,时频图可以使卷积神经网络具有更快的训练速度,取得更好的训练效果,提高故障诊断的准确率.

3.3 故障诊断实验结果和分析

为了证明所提的二次迁移方法对轴承不平衡数据集剥落类故障诊断的有效性,进行了3项故障诊断任务,分别为源域0 HP向目标域0 HP、源域0 HP向目标域1 HP、源域0 HP向目标域2 HP迁移的故障诊断实验.为了训练故障诊断模型,将源域数据集按7∶3的比例划分为训练集和测试集,将目标域数据集按1∶1的比例划分为训练集和测试集.为了模拟目标域训练数据集的不平衡,将目标域的训练集中各故障类型的数据缩减到原来数据的10%,即训练数据集的不平衡率为10∶1.

同时,为了说明在不平衡数据集下,传统的各种故障诊断方法性能将会被制约,故在不进行迁移学习的情况下,使用上述不平衡数据集分别训练了多层感知器(MLP)、支持向量机(SVM)以及卷积神经网络作为对比实验.此外,为了证明不同迁移学习方法对故障诊断的效果,基于上述源域和目标域数据集进行了以下实验:一次迁移后的卷积神经网络方法(Pre-CNN)、不使用过渡数据集仅对一次迁移后的网络进行微调的方法(TCNN)以及提出的基于生成对抗的二次迁移故障诊断方法(GAN-TCNN).之后,除SVM方法外,对不使用迁移学习的方法训练30个Epoch,使用迁移学习的方法在每个迁移阶段训练30个Epoch,并在每种方法下进行10次实验,其中Epoch表示将训练数据集中的所有样本都且仅过一遍的训练过程.在不同负载下,各故障诊断方法在目标域测试集上的故障诊断平均准确率如图9所示.

图9

新窗口打开| 下载原图ZIP| 生成PPT

图9 不同故障诊断方法在目标域上的准确率

Fig.9 Accuracy of different fault diagnosis methods in target domain

图9结果表明,Pre-CNN的故障诊断准确率均小于30%,这说明源域和目标域的数据有很大的差异性,仅利用源域数据对模型进行训练然后进行故障诊断的方法不可行.SVM、MLP、CNN三种方法的故障诊断准确率最高达到84%左右,这说明不平衡的数据集对故障诊断的准确率有很大的影响,其中,基于SVM的浅层机器学习方法的故障诊断准确率高于基于MLP 的方法,这说明全连接的神经网络在特征提取方面的效果并不理想.虽然基于SVM的方法较好,但是其故障诊断准确率也很难再提高,并且不平衡的数据集也很容易使其过拟合.在基于TCNN的方法中,目标域负载为0时准确率达到了90%,高于CNN方法,但是当目标域的负载为 1 HP 和2 HP时,其准确率均低于CNN方法,这很可能是因为当源域和目标域数据相似时,源域数据对故障诊断起到了积极的促进作用,当源域和目标域数据差别较大时,源域数据对故障诊断产生了消极的影响.基于GAN-TCNN的方法在3种目标域负载下,均取得了最高的准确率,远远高于其他方法,这说明源域和目标域之间的过渡数据集对基于迁移学习的不平衡数据集的故障诊断起着非常重要的作用,过渡数据集将源域和目标域数据集特征联系了起来,避免了因源域和目标域差异过大而导致的负迁移问题.综上所述,所提出的方法对于不平衡数据集的滚动轴承剥落类故障能够进行很好地识别.同时负载和转速的对应关系也可说明,不管源域和目标域转速是否相同,所提方法同样能够取得不错的诊断效果.这也在一定程度上验证所提方法能够适用于识别一定转速范围内的轴承剥落类故障,但是限于实验条件的有限性,还需要进一步验证.

为了进一步评估基于GAN-TCNN的方法对不同工况下目标域轴承各类故障进行识别的能力,将该模型在每个迁移阶段训练100个Epoch后,绘制了对目标域3种工况下轴承进行故障诊断的混淆矩阵,如图10所示.

图10

新窗口打开| 下载原图ZIP| 生成PPT

图10 不同工况下的混淆矩阵

Fig.10 Confusion matrix under different working conditions

图10结果表明,基于GAN-TCNN的方法在3种工况下对各故障类型进行故障诊断的准确率均在95%以上.其中当目标域轴承负载为2 HP时,其准确率最高,达到了99%以上.当目标域轴承负载为1 HP时,其准确率最低也达到了95%.这进一步说明所提出方法能够很好地对数据集不平衡的滚动轴承剥落类故障实现良好诊断效果.除此之外,从图中可以发现,造成故障诊断准确率低的原因可能是轴承的滚动体故障和外圈故障特征非常相似.

3.4 基于二次迁移的可视化分析

一般来说,深度学习的学习过程很难理解和解释,迁移学习过程更是如此.但是,通过可视化隐藏层的特征可以在一定程度上理解和解释迁移学习的故障诊断过程.为了直观地呈现GAN-TCNN迁移学习方法的学习能力和过程,在不同负载下对目标域的测试集使用t分布随机近邻嵌入(t-SNE)进行降维可视化,展示GAN-TCNN迁移学习方法在一次迁移、二次迁移和微调学习阶段提取的特征.

如图11所示,不同的颜色代表不同的故障类型.每组图从左到右依次为一次迁移、二次迁移和微调过程.从每组的一次迁移中可以发现,10种故障的特征混淆在一起,不能很好分开,这表明一次迁移后的模型进行故障诊断的效果很差,说明当训练集和测试集的分布不同时,基于深度学习的故障诊断方法无法取得很好的诊断结果.相比一次迁移,在二次迁移的图中可以看到10种故障已经很好地被区分开,但是仍有部分点混淆在一起,这说明通过构造过渡数据集作为源域和目标域的桥梁,可以对迁移学习起到积极的作用.同时,相比二次迁移,微调过程的图变化不大,但是从中可以发现,不同类型的故障特征点更加聚集,10种故障已经很好区分,只有非常少的点混淆在一起,这说明利用目标域数据对二次迁移后的模型进行微调可以提高迁移学习模型对目标域数据进行故障诊断的能力.综上所述,随着迁移学习过程的进行,相同故障类型数据的分布趋于聚集,使得分类器可以更好分类,将 GAN-TCNN 迁移学习方法用于不平衡数据集进行故障诊断是可行的.

图11

新窗口打开| 下载原图ZIP| 生成PPT

图11 不同负载下t-SNE的特征可视化结果

Fig.11 Feature visualization results of t-SNE at different loads

4 结语

针对基于深度学习的故障诊断模型对数据集不平衡的滚动轴承剥落类故障难以识别的问题,提出了一种二次迁移学习的故障诊断方法.该方法以轴承原始振动信号为研究对象,利用小波变换将其转换为时频图,再将其作为模型的输入,通过构建过渡数据集消除迁移学习中因源域和目标域数据集不相似而导致的负迁移和故障诊断准确率低的问题,同时在不同负载和不同转速的工况条件下也取得了较好的故障诊断效果.与不使用迁移学习以及只对源域模型进行微调的迁移学习方法相比,所提方法具有更好的泛化能力和鲁棒性,能够有效地对不平衡数据集的滚动轴承剥落类故障进行故障识别.但提出的方法依旧存在训练过程复杂、GAN训练时间长等不足之处.并且由于实验条件的限制,也未能在多个数据集上进行测试,有待进一步验证其通用性.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

张根保, 李浩, 冉琰,

等.

一种用于轴承故障诊断的迁移学习模型

[J]. 吉林大学学报(工学版), 2020, 50(5): 1617-1626.

[本文引用: 1]

ZHANG

Genbao

, LI

Hao

, RAN

Yan

et al.

A transfer learning model for bearing fault diagnosis

[J]. Journal of Jilin University (Engineering and Technology Edition), 2020, 50(5): 1617-1626.

[本文引用: 1]

[2]

周生通, 朱经纬, 周新建,

等.

组合载荷作用下动车牵引电机转子系统弯扭耦合振动特性

[J]. 交通运输工程学报, 2020, 20(1): 159-170.

[本文引用: 1]

ZHOU

Shengtong

, ZHU

Jingwei

, ZHOU

Xinjian

et al.

Bending-torsional coupling vibration characteristics of EMU traction motor rotor system under combined loads

[J]. Journal of Traffic and Transportation Engineering, 2020, 20(1): 159-170.

[本文引用: 1]

[3]

韩毅.

地铁车辆滚动轴承振动信号的时域分析

[J]. 城市轨道交通研究, 2021, 24 (Sup.1): 57-62.

[本文引用: 1]

HAN

Time domain analysis of vibration signal for metro vehicle rolling bearing

[J]. Urban Mass Transit, 2021, 24 (Sup.1): 57-62.

[本文引用: 1]

[4]

李舜酩, 侯钰哲, 李香莲.

滚动轴承振动故障时频域分析方法综述

[J]. 重庆理工大学学报(自然科学), 2021, 35(10): 85-93.

[本文引用: 1]

Shunming

, HOU

Yuzhe

, LI

Xianglian

Review on time-frequency-domain analysis methods for vibration faults of rolling bearings

[J]. Journal of Chongqing University of Technology (Natural Science), 2021, 35(10): 85-93.

[本文引用: 1]

[5]

张士强.

基于深度学习的故障诊断技术研究[D]. 哈尔滨: 哈尔滨工业大学, 2018.

[本文引用: 1]

ZHANG

Shiqiang

Research on fault diagnosis technology based on deep learning[D]. Harbin:Harbin Institute of Technology, 2018.

[本文引用: 1]

[6]

ZHAO

, YAN

R Q

, CHEN

Z H

et al.

Deep learning and its applications to machine health monitoring

[J]. Mechanical Systems and Signal Processing, 2019, 115: 213-237.

DOI:10.1016/j.ymssp.2018.05.050 [本文引用: 1]

Since 2006, deep learning (DL) has become a rapidly growing research direction, redefining state-of-the-art performances in a wide range of areas such as object recognition, image segmentation, speech recognition and machine translation. In modern manufacturing systems, data-driven machine health monitoring is gaining in popularity due to the widespread deployment of low-cost sensors and their connection to the Internet. Meanwhile, deep learning provides useful tools for processing and analyzing these big machinery data. The main purpose of this paper is to review and summarize the emerging research work of deep learning on machine health monitoring. After the brief introduction of deep learning techniques, the applications of deep learning in machine health monitoring systems are reviewed mainly from the following aspects: Auto-encoder (AE) and its variants, Restricted Boltzmann Machines and its variants including Deep Belief Network (DBN) and Deep Boltzmann Machines (DBM), Convolutional Neural Networks (CNN) and Recurrent Neural Networks (RNN). In addition, an experimental study on the performances of these approaches has been conducted, in which the data and code have been online. Finally, some new trends of DL-based machine health monitoring methods are discussed. (C) 2018 Elsevier Ltd.

[7]

TAMILSELVAN

, WANG

P F

Failure diagnosis using deep belief learning based health state classification

[J]. Reliability Engineering & System Safety, 2013, 115: 124-135.

DOI:10.1016/j.ress.2013.02.022 URL [本文引用: 1]

[8]

HOANG

D T

, KANG

H J

Rolling element bearing fault diagnosis using convolutional neural network and vibration image

[J]. Cognitive Systems Research, 2019, 53: 42-50.

DOI:10.1016/j.cogsys.2018.03.002 URL [本文引用: 1]

[9]

ZHAO

X L

, JIA

M P

, LIU

Fault diagnosis framework of rolling bearing using adaptive sparse contrative auto-encoder with optimized unsupervised extreme learning machine

[J]. IEEE Access, 2019, 8: 99154-99170.

DOI:10.1109/Access.6287639 URL [本文引用: 1]

[10]

ZHANG

, HUANG

, WU

et al.

Multi-model ensemble deep learning method for intelligent fault diagnosis with high-dimensional samples

[J]. Frontiers of Mechanical Engineering, 2021, 16(2): 340-352.

DOI:10.1007/s11465-021-0629-3 [本文引用: 1]

Deep learning has achieved much success in mechanical intelligent fault diagnosis in recent years. However, many deep learning methods cannot fully extract fault information to recognize mechanical health states when processing high-dimensional samples. Therefore, a multi-model ensemble deep learning method based on deep convolutional neural network (DCNN) is proposed in this study to accomplish fault recognition of high-dimensional samples. First, several 1D DCNN models with different activation functions are trained through dimension reduction learning to obtain different fault features from high-dimensional samples. Second, the obtained features are constructed into 2D images with multiple channels through a conversion method. The integrated 2D feature images can effectively represent the fault characteristic contained in raw high-dimension vibration signals. Lastly, a 2D DCNN model with multi-layer convolution and pooling is used to automatically learn features from the 2D images and identify the fault mode of the mechanical equipment by adopting a softmax classifier. The proposed method, which is validated using the bearing public dataset of Case Western Reserve University, USA and a one-stage reduction gearbox dataset, has high recognition accuracy. Compared with other classical deep learning methods, the proposed fault diagnosis method has considerable improvements.

[11]

SHAO

S Y

, WANG

, YAN

R Q

Generative adversarial networks for data augmentation in machine fault diagnosis

[J]. Computers in Industry, 2019, 106: 85-93.

DOI:10.1016/j.compind.2019.01.001 URL [本文引用: 1]

[12]

WANG

, HE

Q B

Wavelet packet envelope manifold for fault diagnosis of rolling element bearings

[J]. IEEE Transactions on Instrumentation and Measurement, 2016, 65(11): 2515-2526.

DOI:10.1109/TIM.2016.2566838 URL [本文引用: 1]

[13]

SOUALHI

, MEDJAHER

, ZERHOUNI

Bearing health monitoring based on Hilbert-Huang transform, support vector machine, and regression

[J]. IEEE Transactions on Instrumentation and Measurement, 2015, 64(1): 52-62.

DOI:10.1109/TIM.2014.2330494 URL [本文引用: 1]

[14]

CHEN

J L

, LI

Z P

, PAN

et al.

Wavelet transform based on inner product in fault diagnosis of rotating machinery: A review

[J]. Mechanical Systems and Signal Processing, 2016, 70/71: 1-35.

DOI:10.1016/j.ymssp.2015.08.023 URL [本文引用: 1]

[15]

GOODFELLOW

, POUGET-ABADIE

, MIRZA

et al.

Generative adversarial networks

[J]. Communications of the ACM, 2020, 63(11): 139-144.

DOI:10.1145/3422622 URL [本文引用: 1]

\n Generative adversarial networks are a kind of artificial intelligence algorithm designed to solve the\n generative modeling\n problem. The goal of a generative model is to study a collection of training examples and learn the probability distribution that generated them. Generative Adversarial Networks (GANs) are then able to generate more examples from the estimated probability distribution. Generative models based on deep learning are common, but GANs are among the most successful generative models (especially in terms of their ability to generate realistic high-resolution images). GANs have been successfully applied to a wide variety of tasks (mostly in research settings) but continue to present unique challenges and research opportunities because they are based on game theory while most other approaches to generative modeling are based on optimization.\n

[16]

ZHENG

, LI

, ZHU

et al.

Conditional Wasserstein generative adversarial network-gradient penalty-based approach to alleviating imbalanced data classification

[J]. Information Sciences, 2020, 512: 1009-1023.

DOI:10.1016/j.ins.2019.10.014 URL [本文引用: 1]

[17]

ARJOVSKY

, CHINTALA

, BOTTOU

Wasserstein gan

[EB/OL]. (2017-12-06)[2022-01-20]. https://arxiv.org/abs/1701.07875

URL [本文引用: 1]

[18]

ADDAGARLA

S K

Real time multi-scale facial mask detection and classification using deep transfer learning techniques

[J]. International Journal of Advanced Trends in Computer Science and Engineering, 2020, 9(4): 4402-4408.

DOI:10.30534/ijatcse/2020/33942020 URL [本文引用: 1]

[19]

PENG

, LI

L L

, CHEN

et al.

A fault diagnosis method for rolling bearings based on parameter transfer learning under imbalance data sets

[J]. Energies, 2021, 14(4): 944.

DOI:10.3390/en14040944 URL [本文引用: 1]

Fault diagnosis under the condition of data sets or samples with only a few fault labels has become a hot spot in the field of machinery fault diagnosis. To solve this problem, a fault diagnosis method based on deep transfer learning is proposed. Firstly, the discriminator of the generative adversarial network (GAN) is improved by enhancing its sparsity, and then adopts the adversarial mechanism to continuously optimize the recognition ability of the discriminator; finally, the parameter transfer learning (PTL) method is applied to transfer the trained discriminator to target domain to solve the fault diagnosis problem with only a small number of label samples. Experimental results show that this method has good fault diagnosis performance.

[20]

TAN

, ZHANG

, PAN

S J

et al.

Distant domain transfer learning

[C]// Proceedings of the Thirty-First AAAI Conference on Artificial Intelligence. San Francisco, California, USA: ACM, 2017: 2604-2610.

[本文引用: 1]

一种用于轴承故障诊断的迁移学习模型

2020

... 机械设备运行过程中的振动信号是进行故障诊断重要且可靠的依据 ^[1-2].传统的故障诊断方法是从原始振动信号中提取有用的故障特征信息,如时域分析方法^[3]、频域分析方法^[4]等,但其十分依赖于技术人员的工作经验,对于经验不足的工作人员来说,这些方法很难达到期望的诊断效果.而且现今机械设备的原始振动信号呈现出海量与复杂的特点,传统的故障诊断方法很难实现对大量复杂数据的精确分析与处理^[5]. ...

一种用于轴承故障诊断的迁移学习模型

2020

组合载荷作用下动车牵引电机转子系统弯扭耦合振动特性

2020

组合载荷作用下动车牵引电机转子系统弯扭耦合振动特性

2020

地铁车辆滚动轴承振动信号的时域分析

2021

地铁车辆滚动轴承振动信号的时域分析

2021

滚动轴承振动故障时频域分析方法综述

2021

滚动轴承振动故障时频域分析方法综述

2021

2018

Deep learning and its applications to machine health monitoring

2019

... 随着人工智能技术的深入发展,基于深度学习的诊断方法开始应用于机械设备的故障诊断^[6],这种方法可以从海量的振动数据中自动地学习提取故障特征信息,提取到的信息有助于实现准确的故障分类,减少人工经验对结果的影响,提高故障识别准确率.文献[7]中提出了一种基于深度信念网络的多传感器故障诊断方法,实现了飞机发动机的健康管理;文献[8]中提出了一种基于卷积神经网络结构的轴承故障诊断方法,在噪声环境下具有很高的准确性和鲁棒性;Zhao等^[9]提出了一种基于自适应稀疏算法和无监督极限学习机相结合的滚动轴承故障诊断方法,解决了故障诊断过程中的过拟合和效率低的问题;Zhang等^[10]提出了一种基于深度卷积神经网络的多模型集成深度学习方法,实现对高维数据的故障识别.对于基于深度学习的故障诊断方法而言,如果要实现准确的故障诊断,需要大量带有标签且平衡的训练数据^[11].实际应用中,机械设备在正常工作状态下,可以收集到足够多的正常数据,而故障数据很少,由于成本和时间的限制,机械设备不可能在长时间的故障工况下运行,这就造成了数据集的不平衡.除此之外,基于深度学习的故障诊断方法还存在以下问题:①深度学习模型只有在训练数据集和测试数据集均服从相同分布的情况下才能取得较好的诊断效果;②在转速、负载复杂多变的工况中,基于深度学习的故障诊断模型并不通用;③难以在不同工况下获得足够多带标签的样本训练深度学习模型. ...

Failure diagnosis using deep belief learning based health state classification

2013

Rolling element bearing fault diagnosis using convolutional neural network and vibration image

2019

Fault diagnosis framework of rolling bearing using adaptive sparse contrative auto-encoder with optimized unsupervised extreme learning machine

2019

Multi-model ensemble deep learning method for intelligent fault diagnosis with high-dimensional samples

2021

Generative adversarial networks for data augmentation in machine fault diagnosis

2019

Wavelet packet envelope manifold for fault diagnosis of rolling element bearings

2016

... 时频分析是一种将原始振动信号的时域频域信息转换到时频域的技术,它比单纯的时域或频域分析更具有优势.轴承振动信号具有非平稳的特性,而小波变换对非平稳信号具有很好的分析效果.虽然短时傅里叶变换也可以将振动信号转换为时频图像,但是其变换的窗口大小是固定的.因此利用小波变换将原始振动信号转换为时频图像,能使信号在低频段具有较高的频率分辨率和较低的时间分辨率,在高频段具有较低的频率分辨率和较高的时间分辨率,这非常符合信号的转换特性^[12-13].小波变换定义^[14]为 ...

Bearing health monitoring based on Hilbert-Huang transform, support vector machine, and regression

2015

Wavelet transform based on inner product in fault diagnosis of rotating machinery: A review

2016

Generative adversarial networks

2020

... GAN是一种深度生成模型,最初由Goodfellow等 ^[15]提出,用于图像生成,模型包括生成器和判别器两部分.该模型能够很好地学习数据的特征并生成与之非常相似的数据,其训练过程是一个零和博弈过程.它以简单的噪声作为输入,通过生成器G将其映射到与真实数据相同的数据空间,判别器D则用来判断生成数据和真实数据,并且在判断过程中提高不被生成数据欺骗的能力.当判别器无法判断时,就说明生成数据的分布与真实数据的分布非常接近.GAN的目标函数如下式所示: ...

Conditional Wasserstein generative adversarial network-gradient penalty-based approach to alleviating imbalanced data classification

2020

... 但是GAN在训练过程中存在梯度消失、模式崩溃、训练困难、生成数据没有指向性以及生成数据质量差的问题.为了解决GAN存在的上述问题,CWGAN-GP^[16]被提出,该模型将衡量两个分布距离的Jensen-Shannon(JS)散度改为Earth-Mover(EM)距离,也被称为Wasserstein-1距离.同时该模型用梯度惩罚解决了Wasserstein GAN(WGAN)^[17]权重裁剪的问题,并且在模型训练过程中加入标签信息y用于指导模型的训练过程,这些改进解决了GAN 的上述问题,并且在几乎不调节超参数的情况下,就可以生成高质量数据.结构示意图如图1所示. ...

Wasserstein gan

Real time multi-scale facial mask detection and classification using deep transfer learning techniques

2020

... 迁移学习是将某个领域或任务上学习到的知识或模式应用到不同但相关领域中的方法.根据特征、目标域和学习方法分类,迁移学习可分为基于样本的迁移学习、基于特征的迁移学习、基于参数的迁移学习和基于关系的迁移学习^[18].基于样本、特征、关系的迁移学习方法有特定的适用范围,很难达到理想的迁移效果.在实际应用中,基于参数的迁移学习方法可以共享源域和目标域的模型参数,只需对神经网络进行微调就可以很好地适应目标域,这使得基于参数的迁移学习方法具有通用性和普遍性^[19]. ...

A fault diagnosis method for rolling bearings based on parameter transfer learning under imbalance data sets

2021

Distant domain transfer learning

2017

... 在迁移学习中,如果源域和目标域差异较大,模型将无法很好地学习源域数据集的信息.本文利用CWGAN-GP构建源域向目标域迁移的过渡数据集,消除了因源域和目标域数据分布差异过大而导致的负迁移^[20]问题.过渡数据集的构造方法如下:首先利用小波变换将源域和目标域原始一维振动信号转变为时频图,然后在目标域与源域训练集中随机选取相等的数据混合形成融合数据集,最后使用融合的数据集训练CWGAN-GP模型,模型收敛后,取出CWGAN-GP的生成器生成过渡数据集. ...

〈

〉