基于无监督迁移学习的电梯制动器剩余寿命预测
上海交通大学 机械与动力工程学院, 上海 200240
Unsupervised Transfer Learning for Remaining Useful Life Prediction of Elevator Brake
School of Mechanical Engineering, Shanghai Jiao Tong University, Shanghai 200240, China
通讯作者: 殷跃红,男,教授,电话(Tel.): 021-34206310; E-mail:yhyin@sjtu.edu.cn.
责任编辑: 孙伟
收稿日期: 2020-06-9
基金资助: |
|
Received: 2020-06-9
作者简介 About authors
姜宇迪(1995-),男,江苏省苏州市人,硕士生,主要从事机器人和智能制造方面的研究.
为了改善电梯制动器在真实工作环境下的寿命预测效果,提出一种基于长短期记忆网络自编码器(LSTM-ED)的无监督深度迁移学习方法,利用仿真数据实现制动器在工作时的健康状态分析.利用源领域数据初步训练LSTM-ED和全连接网络;以LSTM-ED为特征提取器,将仿真和实际数据映射到特征空间并利用最大平均差异实现数据对齐;利用全连接网络回归特征空间中的目标领域数据,从而实现对制动器在真实工作环境下的剩余生命周期预测.在训练阶段中,采用分步训练法替代传统的联合训练法,以保证单个模块的准确性.对比试验仿真数据与电梯塔中的实际工作数据,以验证方法的有效性.结果表明:通过引入迁移学习和分步训练法,所提方法可以将剩余生命周期预测的均方误差降低至 0.0016,能够实现电梯制动器在真实工作环境下的剩余生命周期精准预测.
关键词:
In order to improve the life prediction effect of elevator brake in the real working environment, an unsupervised deep transfer learning (UDTL) method based on long short-term memory encoder-decoder (LSTM-ED) was proposed. The simulation data were used to analyze the health status of brake when it was working. First, the LSTM-ED and the fully connected network were initially trained through the source domain data. Then, the LSTM-ED was used as a feature extractor to map the simulated and actual data to the feature space, and the maximum mean discrepancy was adopted to achieve data alignment. Finally, the target domain data in the feature space was regressed through the fully connected network to predict the remaining useful life (RUL) of the real brake. In the training phase, a step-by-step training method was used to ensure the accuracy of a single module. The validity was verified by comparing the experimental simulation data with the real working data in the elevator tower. The results show that by introducing the transfer learning and step-by-step training methods, the proposed method can reduce the mean square error of RUL prediction to 0.0016, and can achieve accurate RUL prediction of elevator brakes in real working environment.
Keywords:
本文引用格式
姜宇迪, 胡晖, 殷跃红.
JIANG Yudi, HU Hui, YIN Yuehong.
电梯制动器是电梯的重要安全装置,其性能衰减将直接影响电梯的运行安全[1,2,3,4].目前,电梯制动器寿命预测多采用传统的机器学习法[4,5],即根据全生命周期的标注数据学习回归算法并进行预测分析[6,7].然而,电梯制动器作为高可靠性设备,其衰退周期长,全生命周期下的大量标注数据不易被采集,从而严重限制了传统机器学习方法的寿命预测效果.因此,需要探索能够得到大量电梯制动器衰退数据并进行剩余生命周期(RUL)精确预测的新方法.利用实验室样机仿真加速电梯制动器衰变的方法可以采集到大量标注数据,但所得仿真数据与在真实工作环境中得到的数据存在明显分布差异,会影响预测算法的结果.因此,如何迁移运用不同类型的大数据是算法研究的关键.
迁移学习[8]是一种机器学习新方法,其将仿真数据集定义为源领域,将真实工作环境中的数据集定义为目标领域[8,9],以减少分布差异对预测结果的影响,从而提高算法的精度[10,11,12,13].在工业设备的应用方面,基于迁移学习的寿命预测和故障诊断算法尚不成熟.Sun等[14]利用稀疏自编码和Kullback-Leibler (KL)散度实现了对机器工具的寿命预测.Jia 等 [15]利用基于域自适应的深度卷积神经网络实现了在不同噪声环境下轴承的故障诊断.Zhang等[16]提出通过快速傅里叶变换的方法将频谱数据映射到子空间,并利用子空间对齐的方式实现不同工况下轴承的故障分析.以上方法利用迁移学习将源领域与目标领域的数据在特征空间进行对齐,可以实现不同工况下设备的高精度RUL预测.但以上算法针对不同型号设备的预测效果却不佳,且其中的特征提取器并未考虑传感器数据在时间序列上产生的异常情况.此外,在训练过程中,将特征提取器和回归网络联合训练导致了对同一型号设备的过拟合,从而直接影响最终预测结果.
针对上述问题,提出一种基于映射的无监督深度迁移学习(UDTL)法,利用仿真制动器的训练网络判定实际制动器的健康状态,从而对真实工作环境中电梯制动器的RUL进行精准预测.该方法借助长短期记忆网络自编码器(LSTM-ED)实现对原始数据的特征提取.其根据健康数据训练模型,将网络重构序列与原始序列的差方序列作为特征序列,因此特征领域实际是传感器数据在时间序列上异常值的数据表征,从而保证了不同设备在特征领域中均具有一定的相似性;结合最大平均差异实现仿真数据与实际制动器数据在特征领域的再次对齐,从而保证两者在特征序列上的一致性,提高预测精度.同时, 用分步训练法代替传统的联合训练法.在预测过程中,提出在线微调的方法,利用得到的新数据逐步更新特征提取器,从而实现对新设备的高精度寿命预测.
1 制动器失效成因分析
在电梯运行过程中,制动器的主要制动工作模式如下:当电梯轿厢到达需停站时,曳引机根据设定好的程序减速至极低的转速,同时电磁线圈断电.在弹簧压力作用下,闸瓦再次抱紧制动轮,并利用摩擦片的摩擦力制停曳引机.
根据电梯的工作模式进行制动器失效分析(见图1).可知,电梯在运行过程中出现制动衰退的原因主要为制动力矩过小、制动器气隙和制动距离过大以及摩擦片磨损.在设计过程中,本文选用的电梯制动器符合设计指标,即初始条件下制动器气隙、制动距离、摩擦噪声和制动力均为正常值.但在长期运行过程中,制动瓦片磨损会增大制动器气隙,摩擦噪声会随摩擦系数减小而增大,制动力减小,制动距离随之增大.根据具体失效原因,将制动器间隙、编码器读数、摩擦噪声和制动加速度作为原始数据,进行制动器寿命预测算法分析与试验.
图1
2 基于LSTM-ED的剩余生命周期预测算法
根据电梯制动器制动衰退的成因,提出一种基于LSTM-ED的剩余生命周期预测算法.利用长短期记忆(LSTM)网络对数据进行重构处理,将重构误差作为数据的特征序列,通过非线性的全连接层将特征序列映射成剩余生命周期,并利用真实剩余生命周期对回归模型进行训练.不同于典型的迁移学习方法,以 LSTM-ED为特征提取器可以直接将传感器数据在时间轴上的异常反映在特征领域上,LSTM-ED可以根据不同设备的初始状态进行微调,因此特征领域具备对不同型号设备的泛化性.
2.1 LSTM 网络单元
LSTM网络单元是一种循环单元,其通过输入层、上一时刻的隐藏层和记忆细胞层计算当前时刻的隐藏层.该单元结合了记忆细胞层、输入门、忘记门和输出门,能够决定是否需要使用输入门记住输入,何时需要使用忘记门保留记忆,以及何时需要使用输出门输出记忆.为便于表示,将Tn1, n2: Rn1→ Rn2表示为矩阵W和适当维度的矢量b做运算z→Wz+b.在t时刻的输入门(it)、忘记门(ft)、输出门(ot)、隐藏层(at)和记忆细胞层(ct),由输入层(xt)和上一时刻的隐藏层(at-1)以及记忆细胞值(ct-1)计算得到:
式中:gt为新的记忆细胞候选值;m为输入维度;n为隐藏层维度;σ(x)和tanh(x)可以表示为
σ(x)=
其中:x为任意变量.4个变量的推导公式可以由以上简化矩阵符号得到,如
it=σ(W1xt+W2at-1+bi)
不再赘述.
2.2 重构模型
自编码(ED)重构模型可以通过网络输出与输入向量维度相同的向量,因此可以检测输入数据中的异常值.利用自编码的异常值检测特性,将健康状态下的数据重构误差最小化以提取传感器数据中的异常值特征,从而提高预测精度.
假设模型的输入数据为时间序列Xu=[
图2
在解码过程中,解码器以相反的顺序重建时间序列,同时将t时刻LSTM单元的参数输入到t-1时刻,解码单元结合上一时刻参数和当前中间量重构得到与
各个时刻的重构误差为
Et=‖xut−x′tu‖
其中:||·||表示向量的二范数.重构模型能够将制动器运行初期(th)过程中的工作状态定义为健康数据代入,并将该时间内的时间序列(
将损失函数优化至规定的阈值以下得到更新后的LSTM-ED网络,则新网络可以重构出健康状态下的传感器数据.当设备制动衰减时,传感器数据会随机产生异常值,导致重构序列与原始序列之间会存在较大差异,因此需要将 X'u与Xu的各元素进行方差处理:
得到重构特征值Hu=[
2.3 基于全连接神经网络的回归算法
利用全连接神经网络对Hu=[
式中:Winput和binput分别为连接特征输入和隐藏层的权重矩阵和偏置向量;Whid和bhid分别为连接隐藏层和输出层的权重矩阵和偏置向量.隐藏层激活函数为Relu函数,即f(x)=max{0, x},则模型预测得到的剩余生命周期时间为
式中:Rt为真实寿命.
3 无监督的深度迁移学习
在实际预测过程中,通常仅有少量初始状态为有标注的数据和无标定的数据,因此将训练好的网络运用到新设备上并对其进行预测具有一定挑战性.对此,提出一种无监督的深度迁移学习法.
3.1 相关概念
在UDTL中,假设在源领域内均为有标注的数据,则源领域为
式中:
此外,假设在目标领域内标签是不可得的,则目标领域为
式中:
源领域和目标领域分别遵循概率分布P和Q.由于源领域和目标领域的传感器数据分别于不同的电梯制动器设备中采集得到,所以这些数据存在严重的分布差异,导致2.2节中的智能诊断模型不再适用.对此,利用UDTL减少源领域和目标领域之间的特征分布误差,从而在目标领域内实现准确的寿命预测.
3.2 最大平均差异
最大平均差异(MMD)是一种用于测量两个数据集之间分布差异的非参数距离度量,当两个样本的MMD距离足够小时,可以认为分布相同.当Xs和Xt分别遵循概率分布P和Q时,两个数据集之间的MMD距离为
式中:sup(·)为输入聚合的上确界;H表示再生核Hilbert空间(RKHS);ϕ(·)为从原始特征空间到RKHS的非线性映射;E(·)为数学期望.通过对RKHS的非线性映射,评估两个数据集分布之间的相似程度.由式(9)进一步运算得到
k(x, x')=
式中:σ为速度参数,σ越大,则高斯核函数的局部影响范围越大.本文选取σ=5.
3.3 深度迁移学习
3.3.1 权重迁移 在源领域内的LSTM-ED深度特征提取网络中提取训练好的权重和偏置,并直接迁移至目标领域中的新LSTM-ED网络中,将其作为新深度特征提取网络的初始权重和偏置:
式中: i =1, 2, …, n; n为LSTM-ED的层数;
3.3.2 特征迁移 经权重迁移后,Xt 可以通过新的LSTM-ED提取特征
Ht=L(Xt)
其中:L(·)为LSTM-ED的处理函数;Ht为目标领域的特征序列.因此,源领域的特征序列(Hs)与Ht的迁移误差(LMDD)可由MMD标量表示为
减小该误差可以保持目标领域在新网络下的特征与源领域的特征在分布上的相似性.在实际操作中,将LMMD=
特征迁移使得目标领域与源领域的特征序列分布一致,因此由源领域数据的先验知识训练得到的回归预测全连接网络可以直接作用于新目标特征序列上,从而得到高精度的预测结果.
4 算法训练和预测过程
迁移学习算法的整体框图如图3所示.算法的损失函数为
式中:α、β和γ为3个损失函数的修正系数.
图3
典型的迁移学习多采用将目标领域和源领域的数据整合在一起训练,即将α、β和γ均设为非零值进行联合训练.该训练模式未考虑各损失函数的实际意义,易导致对源领域数据的过拟合,而对目标领域数据的预测结果不理想[9].此外,该方法需要完整的目标领域数据,因此在实际运用中无法对目标领域设备进行在线预测.对此,提出一种分步训练方法,其通过保证各模块的准确性实现RUL精准预测,具体步骤如下:
步骤1 令β=γ=0,将源领域中前10%的数据作为健康状态数据输入,从而更新LSTM-ED网络的权重和偏置.根据训练得到的重构网络,将输入序列转化为与输入等长的特征序列,并将这一过程定义为特征提取.
步骤2 在进行回归预测训练时,令α=β=0,即将源领域数据的回归误差作为更新权重的损失函数,同时固定LSTM-ED的权重不变,仅更新全连接层的权重和偏置.
步骤3 权重迁移利用源领域学习得到的LSTM-ED网络和全连接网络,初始化目标领域网络.通过特征提取模块,将新得到的目标领域序列转化为Ht,并将Ht与Hs进行领域适应,即令α=γ=0,利用损失函数更新LSTM-ED,从而减小Ht与Hs的分布误差.
步骤4 LSTM-ED网络能够针对目标领域数据进行传感器异常监测,因此利用由步骤3更新后的LSTM-ED参数得到新特征序列,并将其输入到全连接网络中得到当前预测的RUL.本文预测的RUL值均小于1,其含义为剩余生命周期占总生命周期的比例.若预测值小于90%,则直接将其作为该点的RUL值;若预测值大于90%,则说明该时间段内的数据为电梯制动器前10%的健康生命周期数据,需要根据LSTM-ED的异常值检测特性,令β=γ=0、α=1,再次训练更新LSTM-ED参数,并利用新LSTM-ED得到新特征序列,将其作为全连接网络的输入值,重新预测该点的RUL.
其中,步骤1和2为利用源领域数据进行训练网络,完成之后即可得到针对源领域数据的高精度RUL预测算法.步骤3和4为借助目标领域数据进行在线微调训练并得到预测结果.
5 实例分析
5.1 数据介绍
图4
图5
5.2 算法结果
利用传感器网络连续采集制动器间隙、编码器读数、摩擦噪声和制动加速度等相关物理参数,并将数据预处理为多个长度l=50的子序列作为网络输入,即输入为5×50个节点(两个制动间隙).LSTM-ED网络分为输入层、隐藏层和输出层,分别输出30×50个节点、20×50个节点和5×50个节点.截取仿真数据中前10%的数据作为健康数据,对LSTM-ED进行训练,并利用训练好的网络将传感器数据投射到如图6所示的特征区域中,其中F为经学习得到的特征值,ε为运行进度(运行时间占总寿命的比例).可知,5个特征值(F1~F5)随时间的增加而增大,且增大趋势相似,表明LSTM-ED可以作为特征提取器并有效地反映制动器衰退现象.
图6
利用全连接网络(输入层为提取特征,隐藏层包括20个节点,输出层为一维)对LSTM-ED提取的特征进行回归预测,并利用仿真数据中的真实寿命训练全连接网络.经训练后,仿真数据的损失函数降低至小于0.015,即得到针对源领域数据的高精度RUL预测算法.
利用在线微调方法(步骤3和4),进一步训练LSTM-ED的特征提取器参数,并基于新的特征提取器将电梯塔中的数据转化为如图7所示的特征数据.可知,该提取器同样可以作为特征提取器并有效地反映制动器衰退现象.
图7
图7
电梯塔数据通过UDTL学习得到的特征
Fig.7
Features of elevator tower data learned through UDTL
在预测过程中,利用全连接层预测回归得到的特征,预测结果如图8所示.可知,RUL的预测曲线与真实曲线的吻合度较高.为量化UDTL的预测结果,引入平均绝对值误差(MAE)、均方误差(MSE)和均方根误差(RMSE):
根据上式计算得到:MAE=0.03、MSE=0.0016、RMSE=0.04.可知,利用UDTL预测的误差均很小,表明本文提出的UDTL可以有效预测真实工况下的电梯制动器剩余生命周期.
图8
5.3 对比分析
图9
利用上节所述量化方法,计算不同方法下电梯塔的RUL预测误差,结果如表1所示.可知,在MSE方面,本文所提UDTL方法较无迁移学习的情况降低了59%,较传统训练法降低了54%,证明该方法能够有效提高电梯制动器寿命预测的准确度.
表1 不同方法下电梯塔的剩余生命周期预测误差
Tab.1
方法 | MAE | MSE | RMSE |
---|---|---|---|
无迁移学习 | 0.053 | 0.0039 | 0.063 |
传统训练法 | 0.045 | 0.0035 | 0.059 |
UDTL(本文) | 0.030 | 0.0016 | 0.040 |
为验证所提方法的优越性,将其他迁移学习方法作为对比,利用源领域数据对网络进行训练,并在真实情况下对电梯制动器进行RUL预测.引入迁移损失作为迁移学习效果的判断指标,其值为源领域与目标领域的MSE之差,结果如表2所示.
表2 各迁移方法对比结果
Tab.2
方法 | MSE | 迁移损失 | |
---|---|---|---|
源领域 | 目标领域 | ||
卷积神经网络 | 0.0015 | 0.0084 | 0.0069 |
快速傅里叶法 | 0.0013 | 0.0104 | 0.0091 |
稀疏自编码器+KL散度 | 0.0012 | 0.0034 | 0.0022 |
UDTL(本文方法) | 0.0010 | 0.0016 | 0.0006 |
可知,在保证源领域内的高精度RUL预测的情况下,本文所提UDTL方法的迁移损失值最小,说明其对目标领域电梯制动器的RUL预测结果优于其他方法,迁移过程中的精度损失较低.
5.4 试验结果讨论
分别利用无迁移和经迁移更新后的LSTM-ED对真实工作情况下的电梯制动器进行特征提取,计算特征值总和(Fs)并与仿真制动器提取的特征值总和进行对比,结果如图10所示.其中,仿真制动器的特征标注为制动器1;在真实工作情况下,无迁移和经UDTL迁移更新后的的LSTM-ED提取的特征分别标注为制动器2和制动器3.
图10
可知,在Fs值在大小方面,制动器3与制动器1更接近;在Fs值的变化趋势方面,制动器3与制动器2更接近,即UDTL通过寻找两个制动器的共有特征进行特征的迁移.利用相关度系数(r)量化各特征之间的相关性,其绝对值越大,则相关度越高.
利用式(18),得到相关度系数结果,如表3所示.可知,制动器3与制动器1的特征值总和的相关度最高,这表明制动器1通过迁移将特征保留在了制动器2的特征中,从而进一步证明所提方法可以有效提高电梯制动器在真实工作情况下的RUL预测准确度.
表3 相关度系数结果
Tab.3
名称 | r | ||
---|---|---|---|
制动器1 | 制动器2 | 制动器3 | |
制动器1 | 1 | 0.975 | 0.997 |
制动器2 | - | 1 | 0.993 |
制动器3 | - | - | 1 |
6 结语
为改善电梯制动器在真实工作情况下的寿命预测效果,提出一种基于无监督深度迁移学习的制动器RUL预测方法.该方法利用LSTM-ED将原始数据映射到特征空间中,通过MMD实现真实数据与仿真数据的对齐,最终利用全连接网络进行回归并完成预测.试验和量化数据表明:该算法RUL预测值的均方误差仅为 0.0016,比无迁移学习的情况降低了59%;其可以对真实工作情况下的电梯制动器进行高精度寿命预测,有助于提升电梯等同类特种设备的安全性.
参考文献
Robust optimization and uncertainty quantification in the nonlinear mechanics of an elevator brake system
[J].DOI:10.1007/s11012-019-00992-7 URL [本文引用: 1]
电梯曳引机电磁制动系统故障检测及系统测试
[J].
Fault detection and system test of electromagnetic braking system of elevator traction machine
[J].
电梯曳引机制动器故障检测方法研究
[J].
Research for detection method of elevator tractor brake fault
[J].
基于支持向量机的电梯制动器智能监测预警系统
[J].
The elevator brake intelligent monitoring and fault early warning system based on SVM
[J].
基于LS-SVM的电梯制动器故障诊断
[J].
Fault diagnosis of elevator brake based on LS-SVM
[J].
Investigating computational geometry for failure prognostics
[J].
Remaining useful life estimation—A review on the statistical data driven approaches
[J].DOI:10.1016/j.ejor.2010.11.018 URL [本文引用: 1]
An intelligent fault diagnosis approach based on transfer learning from laboratory bearings to locomotive bearings
[J].DOI:10.1016/j.ymssp.2018.12.051 URL [本文引用: 1]
Unsupervised deep transfer feature learning for medical image classification
[C]//
Visual domain adaptation via transfer feature learning
[J].DOI:10.1007/s10115-016-0944-x URL [本文引用: 1]
基于特征迁移学习方法的跨库语音情感识别
[J].
Cross-corpus speech emotion recognition based on a feature transfer learning method
[J].
Deep transfer learning based on sparse autoencoder for remaining useful life prediction of tool in manufacturing
[J].DOI:10.1109/TII.9424 URL [本文引用: 1]
A neural network constructed by deep learning technique and its application to intelligent fault diagnosis of machines
[J].DOI:10.1016/j.neucom.2017.07.032 URL [本文引用: 1]
/
〈 |
|
〉 |
