上海交通大学学报, 2022, 56(10): 1368-1377 doi: 10.16183/j.cnki.jsjtu.2021.161

机械与动力工程

变工况下基于自适应深度置信网络的轴承智能故障诊断

马航宇1, 周笛1, 卫宇杰1, 吴伟2, 潘尔顺,1

1.上海交通大学 机械与动力工程学院, 上海 200240

2.上海电机学院 凯撒斯劳滕智能制造学院, 上海 201306

Intelligent Bearing Fault Diagnosis Based on Adaptive Deep Belief Network Under Variable Working Conditions

MA Hangyu1, ZHOU Di1, WEI Yujie1, WU Wei2, PAN Ershun,1

1. School of Mechanical Engineering, Shanghai Jiao Tong University, Shanghai 200240, China

2. School of Kaiserslautern Intelligent Manufacturing, Shanghai Dianji University, Shanghai 201306, China

通讯作者: 潘尔顺,男,教授,博士生导师;E-mail:pes@sjtu.edu.cn

责任编辑: 孙伟

收稿日期: 2021-05-18  

基金资助: 国家重点研发计划项目(2020YFB1711100)
国家自然科学基金(52005327)
国家自然科学基金(72001138)
国家自然科学基金(72071127)

Received: 2021-05-18  

作者简介 About authors

马航宇(1996-),男,浙江省台州市人,硕士生,从事设备智能故障诊断研究.

摘要

机械设备服役过程中,工作环境和运转状态的动态变化直接影响设备故障诊断正确率,导致时间成本和经济效益的损失.优化深度置信网络结构,结合固定学习步长的信号分解技术,保留传感器数据原始特征,逐层反复提取信号的深层关键信息,并集成数据丢失技术优化网络结构,可以规避过拟合问题.进一步,结合迁移学习中的领域自适应方法,固化不同层级深度置信网络的记忆特征,形成考虑平移不变特征的自适应深度置信网络,识别变工况下同类故障信号特征信息,提升轴承智能故障诊断的准确性和泛化性.基于滚动轴承公开数据集,不同工况下该方法平均正确率高达95.65%,与其他5种方法相比较,证实了本文方法的有效性与准确性.

关键词: 变工况; 故障诊断; 深度置信网络; 领域自适应; 数据丢失技术

Abstract

In engineering, working environment and operating state are constantly changing, which decreases the correct rate of equipment fault diagnosis, resulting in the loss of time and cost. The structure of the deep belief network is investigated for the time-varying factors in the mechanical system. In combination with the signal decomposition technology of fixed learning step size, the original characteristics of the sensor data are retained. In addition, the deep key information of the signal is repeatedly extracted layer by layer. The data loss technology is integrated to optimize the network structure to avoid over-fitting problems. Further, considering the domain adaptive method in transfer learning, the memory characteristics of different levels of deep belief networks are solidified. Therefore, a domain adaptive deep belief network with shift-invariant features (SIF-DADBN) is proposed for rolling bearing fault diagnosis. By identifying the characteristic information of similar fault signals with variable working conditions, the accuracy and generalization of bearing intelligent fault diagnosis are both improved. Based on the public data set of rolling bearings, the average correct rate of the fault diagnosis technology is found to be as high as 95.65%. Compared with five other methods, the effectiveness and accuracy of SIF-DADBN under variable working conditions are verified.

Keywords: variable working conditions; fault diagnosis; deep belief network; domain adaptation; dropout

PDF (7932KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

马航宇, 周笛, 卫宇杰, 吴伟, 潘尔顺. 变工况下基于自适应深度置信网络的轴承智能故障诊断[J]. 上海交通大学学报, 2022, 56(10): 1368-1377 doi:10.16183/j.cnki.jsjtu.2021.161

MA Hangyu, ZHOU Di, WEI Yujie, WU Wei, PAN Ershun. Intelligent Bearing Fault Diagnosis Based on Adaptive Deep Belief Network Under Variable Working Conditions[J]. Journal of Shanghai Jiaotong University, 2022, 56(10): 1368-1377 doi:10.16183/j.cnki.jsjtu.2021.161

故障诊断是对机械设备故障原因的追溯,通常包括特征信号采集、信号提取处理、故障类别判断3个环节.伴随互联网技术发展和以神经网络为代表的深度学习兴起,部分学者将神经网络融合多领域技术用于故障识别、分类和诊断[1-6].孙旺等[1]将蚁群算法和神经网络相结合,解决神经网络在关键设备性能检测时收敛速度慢、容易陷入最小值的问题;雷亚国等[2]利用频域信号训练深度神经网络,摆脱对信号处理技术与诊断经验的依赖,完成故障特征自适应提取与健康状况智能诊断;Wen等[3]将主成分分析法与神经网络相结合,通过降低数据特征冗余度以提高诊断准确性;Hashim等[4]将离散小波变换和神经网络相结合,有效提升故障状态聚类和分类的速度效果.随着统计分析、信号处理、启发式算法等各类方法的融入,神经网络在故障诊断领域的应用愈发普及且取得较好效果.

轴承是旋转机械的重要组成零件,也是故障高发零件之一.在旋转机械故障中,仅轴承故障就高达30%[7].同时,在工程实际过程中,由于生产环境和工况条件不断变化,设备服役工况并非恒定不变,定工况的神经网络故障诊断方法不足以有效识别所有故障类型,误诊率较高,所以需考虑变工况下系统运转过程与服役特征.结合部件服役的工况变化提取变工况特征信息和轴承故障信息,开展变工况下轴承故障诊断研究具有重要理论研究价值和工程应用意义.

变工况故障诊断主要难点之一在于如何提取保留故障深层特征,使其在不同工况下依然能被有效识别.围绕该问题的故障特征提取方法大致可分为信号处理、迁移学习(Transfer Learning, TL)和神经网络等.在信号处理过程中,通常采用多尺度熵从振动信号提取故障特征,以时间序列动态变化表征变工况.Minhas等[8]借助互补集成经验模态分解法处理原始信号,采用加权多尺度熵提取故障特征;Ma等[9]针对故障多元信号问题,提出多元多尺度模糊分布熵提取故障特征,并用支持向量机识别工作状态.两者均实现了对变工况振动信号的处理和故障诊断.在迁移学习方面,主要通过降低源域和目标域的故障提取特征差异,实现不同工况下故障特征迁移.沈飞等[10]针对变工况需要建立不同模型的问题,提出谱质心迁移学习模型,通过最小化源工况和目标工况领域质心均值距离实现特征迁移,减少后者的建模代价并增强模型通用性;Li等[11]提出基于知识映射的对抗域适应法,将知识从目标域泛化到源域,提取领域不变特征.而神经网络则是凭借其优秀的自学习能力完成深层故障特征提取.Zhao等[12]针对设备频繁改变工况的问题,设计了归一化卷积神经网络,通过批量归一化消除特征分布差异,并结合卷积神经网络提取故障特征;赵小强等[13]针对轴承多工况下时域信号时变性较强等问题设计改进残差神经网络,采用小卷积层串联和堆叠以及加入残差连接方式构建数据池化层,有效提取深层特征信息.基于所提取深层特征,结合深度学习等各类方法进一步完成变工况智能故障诊断.

在提取数据特征方面,作为典型神经网络之一的深度置信网络(Deep Belief Network, DBN)[14],基于贝叶斯思想,通过找出数据的联合概率分布,自动获取潜藏在数据中难以解读的深层信息.当样本数量较多时,DBN拥有强大的故障深层特征信息提取能力,是变工况智能故障诊断的有力工具.李艳峰等[15]将奇异值分解和DBN结合,通过把高维相关变量压缩为低维独立特征矢量完成故障特征提取;Ma等[16]将卷积残差网络、深层自动编码器和DBN进行加权集成,提出多目标多工况的整体深度学习诊断方法;Wang等[17]提出基于半监督受限玻尔兹曼机的DBN以缩减不同工况间的分类差距,提高故障分类准确性;Che等[18]将时频域特征输入DBN,通过迁移学习将不同工况间数据差异最小化,实现变工况轴承故障诊断.通过融合各领域相关技术,DBN提取深层故障特征的优势得到进一步增强,在变工况故障诊断中具有更优越的泛化性和更高的准确率.

上述对于DBN故障诊断的相关研究主要通过统计分析或信号处理等方法对输入参数进行降噪优化预处理,特征提取过程均基于预处理数据进行,虽在一定程度上提高了故障诊断正确率,但也导致原始数据深层特征和信息并未被完全保留.为更好发挥DBN在变工况下特征提取和故障诊断的优势,考虑系统运转的变工况特征,以滚动轴承为分析案例,通过有机融合DBN、迁移学习、数据丢失技术等提出考虑平移不变特征的自适应深度置信网络(Domain Adaptive Deep Belief Network with Shift-Invariant Features, SIF-DADBN),实现变工况智能故障诊断,具体如下:①针对变工况故障特征提取困难,设计固定学习步长的特征提取方法,结合DBN优势充分提取原始数据的平移不变特征,是变工况故障诊断的基础;②针对变工况同类故障难以被有效识别并分类,引入领域自适应方法并加以改进,增强提取特征的普适性,是变工况故障诊断的关键;③针对本文特征提取方法导致的参数维度过高问题,结合数据丢失技术简化网络结构的同时避免过拟合现象,最终提升变工况智能故障诊断的泛化性和准确性.

1 深度置信网络

1.1 DBN算法基本架构

DBN是由多个受限玻尔兹曼机(Restricted Boltzmann Machine, RBM)堆叠而成.如图1所示,RBM是由显层和隐层组成的随机神经网络[19],显层表征输入数据,通过训练完成权重计算形成隐层并作为第2个RBM的显层,依次进行堆叠,形成完整DBN网络.

图1

图1   DBN结构示意图

Fig.1   Schematic diagram of DBN structure


为实现进一步判别,需在DBN顶层加入数据标签和Softmax函数等进行分类.在此基础上,Hinton等[14]在Softmax之前添加多层前馈神经网络,通过反向微调优化网络权值以提高判别准确率,这就是经典的DBN-深度神经网络(Deep Neural Network,DNN)模型,也是DBN改进的重要基础.

1.2 DBN的训练和微调技术

DBN-DNN运行主要包含两个关键步骤:基于RBM和对比散度(Contrastive Divergence, CD)算法的无监督训练;基于反向传播(Back Propagation,BP)算法的有监督微调.

1.2.1 基于RBM和CD算法的无监督训练

在训练过程中,需对RBM逐层训练最终完成对DBN整体的无监督训练.考虑最底层RBM(记为第1层),显层节点v1=(v1,v2,,vi)(i=1,2,,I)h1=(h1,h2,,hj)(j=1,2,,J)的联合状态能量函数表示为[20]

E(v1,h1)=-i=1Iaivi-j=1Jbjhj-j=1Ji=1Iwijvihj

式中:aibj为显、隐层的偏置;I和J为显、隐层的节点数;wij为显隐层的连接权重.第j个隐层节点激活函数为

p'(hj=1|v1)=sigmoid(bj+i=1Iviwij)

i个显层节点激活函数为

 p'(vi=1|h1)=sigmoid(ai+j=1Jhjwij)

考虑轴承振动信号作为显层向量v1输入,利用式(2)可对隐层状态函数求解,利用式(3)重构显层状态函数.因此,RBM通过调节参数w1a1=(a1, a2, …, ai)和b1=(b1, b2, …, bj),使重构误差达到最小值实现信号特征提取和降维.其中

w1=w11w1jwi1wij

基于Hinton[21]提出的CD算法,权重和偏置变化量如下:

Δwij=ε(<vihj>0-<vihj>γ)Δbj=ε(<hj>0-<hj>γ)Δai=ε(<vi>0-<vi>γ)

式中: ε为学习率;γ为采样阶次;<>0为原始数据期望值;<>γ为经过γ次采样并重构后的数据期望值.基于式(4)进一步可得权重和偏置更新公式为

wijη+1=wijη+Δwijbjη+1=bjη+Δbjaiη+1=aiη+Δai

式中:η为迭代次数.

结合式(4)和(5),迭代计算各层RBM的参数,用于下一步有监督微调.

1.2.2 基于反向传播算法的有监督微调

在此之前,基于CD算法训练好的[w1Tw2TwTlwTL][b1Tb2TbTlbTL]正向计算所有隐层状态,其中L表示输出层层数,结合DBN顶层数据标签得到最终输出值X^L.基于最小均方误差原则的BP算法微调所有层,代价函数为

EDBN=1Ll=1L(X^l(wl,bl)-Xl)

式中:Xll;wlbl为该层待更新的权重和隐层偏置.采用梯度下降法进行微调和更新,通过有监督反向微调提高DBN分类准确率,完成DBN训练和调优过程.

2 变工况下自适应深度置信网络设计

针对变工况轴承故障特征提取和诊断困难的问题,有机融合DBN、迁移学习、数据丢失技术等方法,实现变工况下轴承智能故障诊断.

2.1 考虑固定学习步长的平移不变特征提取方法

在DBN轴承故障诊断相关研究中,为提升诊断正确率,通常对信号数据进行预处理从而导致原始信号一定程度特征损失.因此,本文从尽可能保留原始数据特征的角度出发,按固定学习步长(S)将原始信号进行分解后充分学习.

考虑包含M个数据的轴承振动信号,基于固定学习步长S将其分解成N段,每段表示为yn(t),n=1, 2, …,$ N=\lfloor M / S\rfloor$,其中“$\lfloor\rfloor$”表示向下取整.将分解后各段信号输入到RBM网络中进行训练,结合式(1),得到此时RBM的能量函数如下:

E1=n=1Ni=1I1(vin-ai)2-n=1Nj=1J1bjhjn-n=1Ni=1I1j=1J1wijvinhjn

式中:vinhjn为第n段信号的第i个显元和第j个隐元;I1和J_1J1为分解后信号的显、隐层节点数.为将式(7)最小化,基于CD算法对各段信号进行无监督预训练,通过式(4)和(5)进行网络参数更新,最终实现数据特征提取.在本步骤中,以每段信号原始数据作为显层输入,计算各段信号特征向量为

 fn=sigmoid(wnyn(t)+bn), fnR1×J1

式中:wnbnn段信号的权重和偏置.将每段信号均做训练计算并进行堆叠,得到原始信号特征向量矩阵,进一步获得该RBM层的输出特征,表示为

F1=colmax([fT1fT2fTN]T)F1R1×J1

式中:colmax表示对矩阵每一列求取最大值.具体平移不变特征提取过程如图2所示.

图2

图2   基于固定学习步长的平移不变特征提取示意图

Fig.2   Schematic diagram of shift-invariant feature extraction based on fixed learning step size


2.2 基于领域自适应法的变工况特征迁移

基于提取并训练强化后的深层数据特征,进一步和变工况特征进行比对迁移,完成对同一故障不同工况特征的淡化.此处引入迁移学习中的领域自适应方法,以多核最大平均差异(Multi-Kernel Maximum Mean Discrepancies, MK-MMD)概念表征不同工况下两种数据样本差异:针对存在于再生核希尔伯特空间Hkpq之间的距离,其MK-MMD的平方公式[22]

 dk2(p,q)   Exs~p[Φ(xs)]-Ext~q[Φ(xt)]Hk2

式中:k为空间Hk中的特征核;xs~pxt~q分别表示数据来源为源域的概率分布p和目标域的q.在特征映射Φ当中,核映射表示为k(xs,xt)=<Φ(xs),Φ(xt)>,可进一步被定义为由m个内核组合成的凸组合K,具体[23]表示为

Kk=u=1mαuku/u=1mαu=1,αu0,u

式中:kuαuu个内核和对应的权重,且所有权重之和为1.相比传统单一核的最大平均差异,MK-MMD区别在于通过多核来构造总的大核,使其能够在运算过程中拥有更多内核选择,提高特征差异计算准确性.

考虑在变工况下进行智能故障诊断,需使不同工况特征差异最小化,将领域自适应和DBN相结合,采用MK-MMD计算不同工况间特征差异;另一方面,为保证故障诊断分类准确率,需使DBN损失函数最小化.结合式(6)和(10),得到新的最小化目标函数如下:

E=EDBN+EMK-MMD= 1Ll=1L(X^l(wl,bl)-Xl)+λl=l1l2dk2(Dsl,Dtl)

式中:λ;l1l2为DBN中MK-MMD的计算起始和结束层,且l1l2;DslDtll层计算MK-MMD的源域和目标域.

利用式(12)对目标函数进行调整,可使BP算法在更新网络参数过程中,兼顾故障分类准确率和变工况特征差异.如图3所示,在2.1节中采用固定学习步长的特征提取,已实现轴承原始数据的各类深层特征提取(特征A~C),此时如果将工况三的测试集样本直接输入到由工况一训练好的DBN中,不同工况差异可能导致相同故障难以正确归类,生成新故障种类(故障D~F);但若先将工况一和二的数据通过领域自适应进行学习调整,生成更具泛化性的训练集,在该情况下将工况三的测试集输入到训练好的DBN中,就能准确输出故障种类,完成变工况下智能故障诊断.

图3

图3   基于领域自适应法的特征迁移示意图

Fig.3   Schematic diagram of feature migration based on domain adaptive method


2.3 基于数据丢失技术的神经网络微调

基于固定学习步长的特征提取方法能够充分保留原始数据有效信息,虽更好地发挥了DBN优势,但同时也存在维数过高的弊端.结合神经网络运作模式不难发现,维度过高不仅会增加神经网络处理时间,也会增大网络过拟合可能性,严重影响故障诊断准确率.为保证所提方法有效性,在基于固定学习步长的特征提取上,引入数据丢失技术应对上述两个问题.

数据丢失技术是Hinton针对过拟合问题提出的有效技术之一[24].该技术核心在于训练过程中随机将部分隐层节点舍弃.其中,舍弃节点并非永久移除,只是暂时不参与本次迭代和权值更新,从而完成训练过程中的网络精简,提高各隐层节点独立性.集成数据丢失技术优化DBN结构,能够在提升运行效率的同时,一定程度上规避过拟合问题.

结合所设计的DBN网络,在无监督训练过程中,式(2)给出隐层节点激活函数,加入数据丢失技术二进制随机变量r后如下所示:

p(hj=1|v1)=sigmoid(bj+i=1Iriviwij)

式中:rP.r=1P,;r=01-P,表示该单元暂时失效.

在后续有监督微调中,计算节点误差项时也以随机概率将该节点舍弃并完成DBN训练.在测试阶段,需将隐层节点输出按照数据丢失技术设置的比例对应减少.集成数据丢失技术的本文DBN训练过程如图4所示.图中:“×”代表该单元暂时失效.

图4

图4   集成数据丢失技术的DBN示意图

Fig.4   Schematic diagram of DBN in combination with dropout


2.4 深度置信网络整体设计和诊断流程

融合DBN、迁移学习和数据丢失技术等方法,设计搭建DBN网络架构如图5所示.图中:w1~w5为第一轮训练时的权重;w1F~wF5为基于第1轮训练结果在第2轮训练时的权重.其中第1层(v0)为特征提取层,第2、3层(h1和h2)为训练优化层,第4、5层(h3和h4)为自适应训练层,第6层(Softmax)为分类输出层.

在故障诊断过程中,首先结合DBN优势充分且有效提取故障特征,在提升诊断准确率同时确保故障特征在变工况下依然能被有效识别;进一步结合领域自适应方法,通过变工况下的特征迁移学习减少特征差异,淡化工况特征,强化故障特征,最终实现变工况下智能故障诊断.具体诊断流程如图6所示.图中:η14为各工况最大迭代次数.

图5

图5   DBN整体设计架构示意图

Fig.5   Schematic diagram of DBN overall design architecture


图6

图6   变工况诊断流程图

Fig.6   Diagnosis flow chart under variable working conditions


3 实例验证与分析

作为故障高发零件,轴承在工程实际中受变化服役工况的影响,故障诊断困难程度大大增加.对于变工况下轴承智能故障诊断,确保诊断方法正确率和泛化性尤为重要.

3.1 数据集简介和样本划分

为验证所设计方法在变工况下故障诊断的有效性,采用凯斯西储大学驱动端轴承公开数据集作为样本.基于电机转速建立4个不同工况样本数据集A、B、C、D,如表1所示,其中空白表示无此项.轴承故障位置分别有内圈、外圈和滚动体3处,每处故障均包含3种损伤直径,组合后共计9种故障类型.每个数据集选取1组正常样本与9组不同类型故障样本的组合,共计400个样本,每个样本包含 2 000 数据点,且均从原始数据的随机位置开始提取,但在48 kHz采样频率下需保证提取至少1个周期的信号数据.在此基础上,进一步划分训练和测试集.其中,训练和测试集分别包含500和100个样本,具体选取规则如下:训练集应包括至少两种工况,例如将数据集A的400个样本作为源域进行训练,将数据集B的100个样本作为目标域协助迁移学习;测试集任取某一工况的100个样本(如数据集C),此时组合记为A-B~C,表1中训练集和测试集划分以A-B~C组合为例.

表1   数据集划分情况

Tab.1  Data set division

数据集电机转速/
(r·min-1)
样本数/个数据点/个训练集/个测试集/个
源域目标域
A1 73040+9×402 00040+9×40
B1 75040+9×402 00010+9×10
C1 77240+9×402 00010+9×10
D1 79740+9×402 000

新窗口打开| 下载CSV


3.2 网络参数设置

图5可知,所提网络共由6层组成,节点数设置依次为200、200、160、100、50、10.RBM训练、BP算法微调的学习率均设为0.1,迭代次数分别设为100和150,训练批次为20,初始动量为0.1,持续动量为0.5.参数设置与传统DBN无明显差异.

本文搭建的DBN增加了固定学习步长S、领域自适应法中的惩罚因子β和数据丢失概率P等3个参数.其中,S是对原始信号数据的分解程度,设置大小应适宜具体情况(本文设定为10).β在目标能量函数中直接影响诊断结果,需进行重点选择.以A-B~B为例,令P=1(保留所有节点),β∈[0, 6](步进0.3)且每组参数输入DBN后重复10次,取其平均值和标准偏差,得到β和诊断正确率(Q)的关系如图7所示.由图可知,初始阶段诊断正确率随β增大而提升,说明迁移学习在变工况故障诊断中逐渐发挥重要作用.当β=2.4,诊断正确率达到最高点并开始下降,说明β设置过高覆盖了故障分类差异的能量函数.

图7

图7   不同β取值下的诊断正确率

Fig.7   Diagnostic accuracy rate at different β values


为配合数据丢失技术寻找最佳组合参数,令β∈[1.6,3.2](步进0.2),与P∈[0.1,1.0](步进0.1)进行交叉组合实验,结果如图8所示.由图可知,β整体趋势无明显变化,诊断率最高点仍集中在2.4附近;P值较小时,由于舍弃网络单元过多,导致正确率明显下滑,随着P值增长至0.4并逐渐接近1时(所有单元几乎重新被激活),正确率逐渐提升.当0.6≤P≤0.8且β=2.2时,故障诊断正确率达到峰值且附近几乎为平面,说明此时正确率无明显差异.令P取最小值0.6,可有效简化网络结构(暂时舍弃尽可能多的单元).综上,参数选择β=2.2,P=0.6,可在有效提升诊断正确率的同时提升诊断速率.

图8

图8   βP的交叉组合实验曲面图

Fig.8   Curved surface diagram of cross combination experiment of β and P values


3.3 诊断结果分析

基于3.2节参数设置,仍以A-B~B组合为例得到重构误差,如图9所示(第1层RBM经分解后重构误差较复杂,未在图中表示).由图可知,随着迭代次数增加,每层重构误差逐渐减少,最后一层稳定后接近0.05,说明提取特征已得到充分训练强化.

图9

图9   各层RBM重构误差图

Fig.9   RBM reconstruction error of each layer


试验发现,集成数据丢失技术后损失函数能更快下降(见图10).当迭代次数约大于150时,损失函数便提前进入平稳低值,神经网络已得到充分训练,说明数据丢失技术能有效提升分类正确率和运算速率.

图10

图10   最终损失函数变化趋势图

Fig.10   Trend chart of final loss function


在此基础之上进一步探究所提网络运行过程的故障分类效果,借助t分布随机近邻嵌入算法(t-distributed Stochastic Neighbor Embedding, t-SNE)[24]将训练过程关键节点可视化,如图11所示.图中仅展示内圈故障(Inner race Fault, IF)、滚动体故障(Roller Fault, RF)、外圈故障(Outer race Fault, OF)和正常4类样本.如图11(a)所示,经过基于固定学习步长的信号特征提取,4种样本基本已相互分离,但各自并未完全聚集在一起,以IF为例就有多个聚集中心点.通过多层RBM反复强化训练,得到输出情况如图11(b)所示,各类故障逐渐围绕某一中心点开始聚拢,说明该DBN已经基本能够完成定工况下故障诊断.进一步结合迁移学习后,由图11(c)可知,此时DBN仍有较好的故障分类效果,且已具备变工况下故障诊断能力.图中:t1t2分别表示不同的t-SNE尺寸.

图11

图11   DBN训练过程的分类情况可视化

Fig.11   Visualization of classification of DBN training process


对A-B~B组合重复实验10次取均值,测得诊断正确率为97.8%,说明该方法已成功实现变工况故障诊断.为进一步探究该方法的准确性和泛化性,分别取数据集A-B和C-D作为训练集,并取数据集A~D作为测试集,获取变工况故障诊断正确率如图12所示.由图可见,测试集选择对故障诊断率有较大影响,正确率高低依次为源域>目标域>其他.然而从A-B~C、A-B~D、C-D~A和C-D~B也能发现,即便相较于其他4组诊断率较低,但正确率也均在90%以上.8个组合平均故障诊断正确率高达95.65%,说明所提网络能有效实现变工况的故障诊断.

图12

图12   不同工况组合下的故障诊断正确率

Fig.12   The diagnostic accuracy rate with different combinations of working conditions


4 故障诊断方法比较与分析

为进一步证明所提方法的准确性和泛化性,选取另外5种方法进行实验且相关参数设置如表2所示.其中,方法1为考虑平衡不变特性(Shift-Invariant Features, SIF)的自适应DBN(SIF-DADBN),采用本文所提出的DBN:方法2(Raw-DBN)采用传统DBN,以所有信号数据作为显层直接输入网络;方法3则参照文献[18]采用快速傅里叶变换(Fast Fourier Transform, FFT)对数据进行预处理,提取12个时频域特征输入DBN;方法4参照文献[25],将迁移学习和支持向量机(Support Vector Machine, SVM)相结合,通过迁移高相似度样本到源空间进行训练并以SVM识别和分类;方法5仅以传统SVM方法进行诊断;方法6为基于迁移学习的生长型DBN(TL-GDBN),参照文献[26]同样将迁移学习和DBN结合形成自适应DBN进行诊断.各方法相关参数(如学习率、迭代次数等)尽量与本文保持一致,同样集成数据丢失技术,且方法4~6采用本文固定学习步长的信号分解方法提取故障特征作为输入.

表2   不同方法的参数设置和比较

Tab.2  Parameter setting and comparison of different methods

序号方法节点设置数据点/个训练集+测试集/(个+个)
1SIF-DADBN200、200、160、100、50、102 000500+100
2Raw-DBN2 000、200、160、100、0、102 000500+100
3FFT-DBN[18]12、200、160、100、50、102 000500+100
4TL[25]200、102 000500+100
5SVM200、102 000500+100
6TL-GDBN[26]200、200、160、100、50、102 000500+100

新窗口打开| 下载CSV


通过实验,定工况下(测试集与源域相同,如A-B~A、B-C~B组合等)各方法故障诊断正确率如图13所示.由图可见,采用DBN的深度学习方法能更好提取数据特征并完成故障诊断,正确率稳定在90%以上;进一步对比方法1~3,发现本文所提方法的诊断正确率均相对较高,说明采用固定学习步长的特征提取方法更好地保留数据深层特点,具有更高准确率.

图13

图13   定工况下不同方法的故障诊断正确率

Fig.13   Comparison of diagnostic accuracy of different methods under invariable working conditions


变工况下(测试集和源域不同)各方法诊断正确率如图14所示.比较图1314发现,变工况下未结合迁移学习的方法2、3、5正确率下降较为严重,基本难以达到90%.而结合迁移学习的方法1、4、6正确率仅呈小幅度下降,说明迁移学习在变工况故障诊断中发挥重要作用.进一步观察方法1和6,发现将深度学习和迁移学习结合后,无论是定工况和变工况下均有良好的表现,诊断正确率均高于其他方法.

图14

图14   变工况下不同方法的故障诊断正确率

Fig.14   Comparison of diagnostic accuracy of different methods under variable working conditions


综合来看,SIF-DADBN在各类工况的故障诊断正确率均能稳定高达90%,平均正确率接近95%,说明该方法能有效实现变工况故障诊断.此外,相较其他5种方法,该方法在变工况下具有更高的故障诊断正确率和泛化水平.

5 结语

本文通过DBN、迁移学习和数据丢失技术等方法的有机融合,提出考虑平移不变特征的自适应深度置信网络,并用于轴承智能故障诊断,网络共由4部分组成.特征提取层考虑固定学习步长对原始信号进行分解,提取数据平移不变的深层特征,并集成数据丢失技术进行全网络结构优化以规避过拟合问题;强化训练层基于RBM逐层堆叠对提取特征进行反复强化;自适应学习层结合MK-MMD完成变工况特征差异计算并进行特征迁移,淡化工况特征,强化故障特征;分类输出层基于特征和工况差异对网络参数进行二次微调更新,输出变工况故障诊断结果.该方法对变工况故障识别率较高,实验样本诊断正确率能稳定在90%以上,平均诊断正确率高达95.65%;通过与其他方法的比较,进一步验证所提方法在变工况下具有更高的准确率和泛化性.未来,针对该方法样本需求量较大和诊断对象单一的局限性,将通过结合标记样本扩充方法研究小样本下智能故障诊断,并应用于齿轮等其他零部件故障诊断.

参考文献

孙旺, 李彦明, 杜文辽, .

基于蚁群神经网络的泵车主泵轴承性能评估

[J]. 上海交通大学学报, 2012, 46(4): 596-600.

[本文引用: 2]

SUN Wang, LI Yanming, DU Wenliao, et al.

State performance evaluation for the main pump bearing of pump truck based on ant colony optimization of neural network

[J]. Journal of Shanghai Jiao Tong University, 2012, 46(4): 596-600.

[本文引用: 2]

雷亚国, 贾峰, 周昕, .

基于深度学习理论的机械装备大数据健康监测方法

[J]. 机械工程学报, 2015, 51(21): 49-56.

DOI:10.3901/JME.2015.21.049      [本文引用: 2]

机械装备正在朝着高速、高精、高效方向发展,为了确保这些装备的健康运行,健康监测系统采集了海量数据来反映机械的健康状况,促使机械健康监测领域进入了&ldquo;大数据&rdquo;时代。机械大数据具有大容量、多样性与高速率的特点,研究和利用先进的理论与方法,从机械装备大数据中挖掘信息,高效、准确地识别装备的健康状况,成为机械装备健康监测领域面临的新问题。深度学习理论作为模式识别和机器学习领域最新的研究成果,以强大的建模和表征能力在图像和语音处理等领域的大数据处理方面取得了丰硕的成果。结合机械大数据的特点与深度学习的优势,提出了一种新的机械装备健康监测方法。该方法通过深度学习利用机械频域信号训练深度神经网络,其优势在于能够摆脱对大量信号处理技术与诊断经验的依赖,完成故障特征的自适应提取与健康状况的智能诊断,因此克服了传统智能诊断方法的两大缺陷:需要掌握大量的信号处理技术结合丰富的工程实践经验来提取故障特征;使用浅层模型难以表征大数据情况下信号与健康状况之间复杂的映射关系。试验结果表明,该方法实现了多种工况、大量样本下多级齿轮传动系统不同故障位置不同故障类型的故障特征自适应提取与健康状况准确识别。

LEI Yaguo, JIA Feng, ZHOU Xin, et al.

A deep learning-based method for machinery health monitoring with big data

[J]. Journal of Mechanical Engineering, 2015, 51(21): 49-56.

DOI:10.3901/JME.2015.21.049      [本文引用: 2]

<p style="line-height: 14pt; margin: 0cm 0cm 0pt; layout-grid-mode: char" class="MsoNormal"><font face="Times New Roman"><span style="color: black; font-size: 9pt" lang="EN-US">Mechanical equipment in modern industries becomes more automatic, precise and efficient. To fully inspect its health conditions<span style="background: white">,</span></span><span class="apple-converted-space"><span style="background: white; color: black; font-size: 9pt; mso-bidi-font-family: Arial" lang="EN-US"> </span></span><span style="color: black; font-size: 9pt" lang="EN-US">condition monitoring systems are used to collect real-time data from the equipment, and massive data are acquired after the long-time operation, which promotes </span><span style="color: black; font-size: 9pt; mso-bidi-font-size: 12.0pt" lang="EN-US">machinery health monitoring</span><span style="color: black; font-size: 9pt" lang="EN-US"> to enter the age of big data. Mechanical big data has the properties of large-volume, diversity and high-velocity. Effectively mining characteristics from such data and accurately identifying the machinery health conditions with advanced theories become new issues in </span><span style="color: black; font-size: 9pt; mso-bidi-font-size: 12.0pt" lang="EN-US">machinery health monitoring</span><span style="color: black; font-size: 9pt" lang="EN-US">. To harness the properties of mechanical big data and the advantages of deep learning </span><span style="color: black; font-size: 9pt; mso-bidi-font-size: 12.0pt" lang="EN-US">theory</span><span style="color: black; font-size: 9pt" lang="EN-US">, a health monitoring and fault diagnosis method for machinery is proposed. In the proposed method, deep neural networks with deep architectures are established to adaptively mine available fault characteristics and automatically identify machinery health conditions. Correspondingly, the proposed method overcomes two deficiencies of the traditional intelligent diagnosis methods: (1) the features are manually extracted relying on much prior knowledge about signal processing techniques and diagnostic expertise; (2) the used models have shallow architectures, limiting their capability in fault diagnosis issues. The proposed method is validated using datasets of multi-stage gear transmission systems, which contain massive data involving different health conditions under various operating conditions. The results show that the proposed method is able to not only adaptively mine available fault characteristics from the data, but also obtain higher identification accuracy than the existing methods.<o:p></o:p></span></font></p>

WEN X Q, XU Z A.

Wind turbine fault diagnosis based on ReliefF-PCA and DNN

[J]. Expert Systems with Applications, 2021, 178: 115016.

DOI:10.1016/j.eswa.2021.115016      URL     [本文引用: 2]

HASHIM M A, NASEF M H, KABEEL A E, et al.

Combustion fault detection technique of spark ignition engine based on wavelet packet transform and artificial neural network

[J]. Alexandria Engineering Journal, 2020, 59(5): 3687-3697.

DOI:10.1016/j.aej.2020.06.023      URL     [本文引用: 2]

逯程, 徐廷学, 王虹.

基于属性粒化聚类与回声状态网络的末制导雷达故障诊断

[J]. 上海交通大学学报, 2018, 52(9): 1112-1119.

[本文引用: 1]

LU Cheng, XU Tingxue, WANG Hong.

Fault diagnosis of terminal guidance radar based on attribute granulation clustering and echo state network

[J]. Journal of Shanghai Jiao Tong University, 2018, 52(9): 1112-1119.

[本文引用: 1]

王昊, 邱思琦, 王丽亚.

结合深度自编码与强化学习的轴承健康评估

[J]. 工业工程与管理, 2021, 26(3): 89-95.

[本文引用: 1]

WANG Hao,

QIU Siqi, WANG Liya. Health assessment of bearings based on deep auto-encoder and reinforcement learning

[J]. Industrial Engineering and Management, 2021, 26(3): 89-95.

[本文引用: 1]

马萍, 张宏立, 范文慧.

基于局部与全局结构保持算法的滚动轴承故障诊断

[J]. 机械工程学报, 2017, 53(2): 20-25.

DOI:10.3901/JME.2017.02.020      [本文引用: 1]

为了精准稳定地提取滚动轴承故障特征,提出一种基于局部与全局结构保持算法的低维敏感特征提取方法,采用K近邻(K-nearest neighbor algorithm, KNN)分类算法进行故障识别。对滚动轴承振动信号的时域和频域特征进行特征提取,组成初始特征集,采用该方法对初始特征集进行特征提取,提取过程中综合考虑初始特征集的局部结构特征和全局结构特征以避免其结构信息的丢失,同时引入正交约束减小主特征分量间的信息冗余,提取出最优表征初始特征集特征的敏感特征矢量,并通过K近邻分类算法对其进行分类。将该方法应用于滚动轴承故障诊断,通过与其他几种典型特征提取方法对比,该方法能更有效地提取滚动轴承四种状态的敏感特征矢量,在故障诊断中表现出更好的分类性能,整体故障识别率保持为100%。因此,该方法能有效提取敏感故障特征,为实际滚动轴承智能故障诊断提供参考。

MA Ping, ZHANG Hongli, FAN Wenhui.

Fault diagnosis of rolling bearings based on local and global preserving embedding algorithm

[J]. Chinese Journal of Mechanical Engineering, 2017, 53(2): 20-25.

[本文引用: 1]

MINHAS A S, KANKAR P K, KUMAR N, et al.

Bearing fault detection and recognition methodology based on weighted multiscale entropy approach

[J]. Mechanical Systems and Signal Processing, 2021, 147: 107073.

DOI:10.1016/j.ymssp.2020.107073      URL     [本文引用: 1]

MA Y L, CHENG J S, WANG P, et al.

Rotating machinery fault diagnosis based on multivariate multiscale fuzzy distribution entropy and Fisher score

[J]. Measurement, 2021, 179: 109495.

DOI:10.1016/j.measurement.2021.109495      URL     [本文引用: 1]

沈飞, 陈超, 徐佳文, .

谱质心迁移在变工况轴承故障诊断的应用

[J]. 仪器仪表学报, 2019, 40(5): 99-108.

[本文引用: 1]

SHEN Fei, CHEN Chao, XU Jiawen, et al.

Application of spectral centroid transfer inbearing fault diagnosis under varying working conditions

[J]. Chinese Journal of Scientific Instrument, 2019, 40(5): 99-108.

[本文引用: 1]

LI Q, SHEN C Q, CHEN L, et al.

Knowledge mapping-based adversarial domain adaptation: A novel fault diagnosis method with high generalizability under variable working conditions

[J]. Mechanical Systems and Signal Processing, 2021, 147: 107095.

DOI:10.1016/j.ymssp.2020.107095      URL     [本文引用: 1]

ZHAO B, ZHANG X M, LI H, et al.

Intelligent fault diagnosis of rolling bearings based on normalized CNN considering data imbalance and variable working conditions

[J]. Knowledge-Based Systems, 2020, 199: 105971.

DOI:10.1016/j.knosys.2020.105971      URL     [本文引用: 1]

赵小强, 梁浩鹏.

使用改进残差神经网络的滚动轴承变工况故障诊断方法

[J]. 西安交通大学学报, 2020, 54(9): 23-31.

[本文引用: 1]

ZHAO Xiaoqiang, LIANG Haopeng.

Fault diagnosis method for rolling bearing under variable working conditions using improved residual neural network

[J]. Journal of Xi’an Jiaotong University, 2020, 54(9): 23-31.

[本文引用: 1]

HINTON G E, SALAKHUTDINOV R R.

Reducing the dimensionality of data with neural networks

[J]. Science, 2006, 313(5786): 504-507.

DOI:10.1126/science.1127647      PMID:16873662      [本文引用: 2]

High-dimensional data can be converted to low-dimensional codes by training a multilayer neural network with a small central layer to reconstruct high-dimensional input vectors. Gradient descent can be used for fine-tuning the weights in such "autoencoder" networks, but this works well only if the initial weights are close to a good solution. We describe an effective way of initializing the weights that allows deep autoencoder networks to learn low-dimensional codes that work much better than principal components analysis as a tool to reduce the dimensionality of data.

李艳峰, 王新晴, 张梅军, .

基于奇异值分解和深度信度网络多分类器的滚动轴承故障诊断方法

[J]. 上海交通大学学报, 2015, 49(5): 681-686.

[本文引用: 1]

LI Yanfeng, WANG Xinqing, ZHANG Meijun, et al.

An approach to fault diagnosis of rolling bearing using SVD and multiple DBN classifiers

[J]. Journal of Shanghai Jiao Tong University, 2015, 49(5): 681-686.

[本文引用: 1]

MA S, CHU F L.

Ensemble deep learning-based fault diagnosis of rotor bearing systems

[J]. Computers in Industry, 2019, 105: 143-152.

DOI:10.1016/j.compind.2018.12.012      [本文引用: 1]

For rotating machinery, early and accurate diagnosis of rotor and bearing component fault is of great significance. The classic fault diagnosis model includes two key modules, feature extraction and fault classification. In order to enhance the practicability, the deep learning models realize the end-to-end fault diagnosis by integrating this two modules, thus avoids the problems caused by the inadequate adaptability of manual designed features. However, considering the wide application scenario of fault diagnosis technology, the application scope of single deep model may have corresponding limitations. Accordingly, in this paper, an ensemble deep learning diagnosis method based on multi-objective optimization is proposed. The multi-objective optimization algorithm is used as the ensemble strategy in this method, the Convolution Residual Network (CRN), Deep Belief Network (DBN) and Deep Auto-Encoder (DAE) are weighted and integrated to realize the effective diagnosis of rotor and bearing faults for rotating machinery. The experimental results demonstrate the better adaptability of the proposed method compared to other single and ensemble deep models. (C) 2018 Published by Elsevier B.V.

WANG G M, QIAO J F, LI X L, et al.

Improved classification with semi-supervised deep belief network

[J]. IFAC PapersOnLine, 2017, 50(1): 4174-4179.

DOI:10.1016/j.ifacol.2017.08.807      URL     [本文引用: 1]

CHE C C, WANG H W, NI X M, et al.

Domain adaptive deep belief network for rolling bearing fault diagnosis

[J]. Computers & Industrial Engineering, 2020, 143: 106427.

DOI:10.1016/j.cie.2020.106427      URL     [本文引用: 3]

JAITLY N, HINTON G.

Learning a better representation of speech soundwaves using restricted boltzmann machines

[C]//2011 IEEE International Conference on Acoustics, Speech and Signal Processing. Prague, Czech Republic: IEEE, 2011: 5884-5887.

[本文引用: 1]

HINTON G.E.

A practical guide to training restricted Boltzmann machines

[J]. Momentum, 2010, 9(1), 926-947.

[本文引用: 1]

HINTON G E.

Training products of experts by minimizing contrastive divergence

[J]. Neural Computation, 2002, 14(8): 1771-1800.

DOI:10.1162/089976602760128018      PMID:12180402      [本文引用: 1]

It is possible to combine multiple latent-variable models of the same data by multiplying their probability distributions together and then renormalizing. This way of combining individual "expert" models makes it hard to generate samples from the combined model but easy to infer the values of the latent variables of each expert, because the combination rule ensures that the latent variables of different experts are conditionally independent when given the data. A product of experts (PoE) is therefore an interesting candidate for a perceptual system in which rapid inference is vital and generation is unnecessary. Training a PoE by maximizing the likelihood of the data is difficult because it is hard even to approximate the derivatives of the renormalization term in the combination rule. Fortunately, a PoE can be trained using a different objective function called "contrastive divergence" whose derivatives with regard to the parameters can be approximated accurately and efficiently. Examples are presented of contrastive divergence learning using several types of expert on several types of data.

CHEN Y, YANG C L, ZHANG Y.

Deep domain similarity Adaptation Networks for across domain classification

[J]. Pattern Recognition Letters, 2018, 112: 270-276.

DOI:10.1016/j.patrec.2018.08.006      URL     [本文引用: 1]

GRETTON A, BORGWARDT K M, RASCH M J, et al.

A kernel two-sample test

[J]. Journal of Machine Learning Research, 2012, 13(1): 723-773

[本文引用: 1]

HINTON G E, SRIVASTAVA N, KRIZHEVSKY A, et al.

Improving neural networks by preventing co-adaptation of feature detectors

[J]. Computer Science, 2012, 3(4): 212-223.

[本文引用: 2]

张振良, 刘君强, 黄亮, .

基于半监督迁移学习的轴承故障诊断方法

[J]. 北京航空航天大学学报, 2019, 45(11): 2291-2300.

[本文引用: 2]

ZHANG Zhenliang, LIU Junqiang, HUANG Liang, et al.

A bearing fault diagnosis method based on semi-supervised and transfer learning

[J]. Journal of Beijing University of Aeronautics and Astronautics, 2019, 45(11): 2291-2300.

[本文引用: 2]

WANG G M, QIAO J F, BI J, et al.

TL-GDBN: Growing deep belief network with transfer learning

[J]. IEEE Transactions on Automation Science and Engineering, 2019, 16(2): 874-885.

DOI:10.1109/TASE.2018.2865663      URL     [本文引用: 2]

/