上海交通大学学报, 2022, 56(5): 564-575 doi: 10.16183/j.cnki.jsjtu.2021.024

机械与动力工程

面向多故障模式的多尺度相似性集成寿命预测

舒俊清, 许昱晖, 夏唐斌,, 潘尔顺, 奚立峰

上海交通大学 机械系统与振动国家重点实验室;机械与动力工程学院,上海 200240

A Multiscale Similarity Ensemble Methodology for Remaining Useful Life Prediction in Multiple Fault Modes

SHU Junqing, XU Yuhui, XIA Tangbin,, PAN Ershun, XI Lifeng

State Key Laboratory of Mechanical System and Vibration;School of Mechanical Engineering, Shanghai Jiao Tong University, Shanghai 200240, China

通讯作者: 夏唐斌,男,副教授,博士生导师,电话(Tel.):021-34208589;E-mail:xtbxtb@sjtu.edu.cn.

责任编辑: 石易文

收稿日期: 2021-01-25  

基金资助: 国家自然科学基金(51875359)
上海市自然科学基金(20ZR1428600)
教育部-中国移动科研基金研发项目(CMHQ-JS-201900003)
临港地区智能制造专项(ZN2017020102)
上海商用飞机系统工程科创中心联合研究基金(FASE-2021-M7)

Received: 2021-01-25  

作者简介 About authors

舒俊清(1999-),女,安徽省安庆市人,硕士生,主要研究方向为智能预测与健康管理.

摘要

针对传统相似性方法忽略设备故障模式、退化速度以及监测数据长度间差异性的问题,提出多故障模式下多尺度相似性集成(MFM-MSEN)方法,以提高寿命预测精度并表征预测不确定性.通过训练故障分类模型,设计时序加权预测策略,识别设备故障模式,实现训练与测试设备间的分类匹配并降低匹配复杂度.在此基础上提出多尺度集成策略,可克服单尺度方法的数据利用率限制,并增强预测泛化性能,在多个尺度上匹配健康指标间的相似性,进一步采用核密度估计集成多尺度预测结果,以高精度拟合剩余寿命概率分布.实验结果证明, MFM-MSEN方法具有应对设备退化差异的优越性.

关键词: 剩余使用寿命; 故障模式识别; 多尺度集成策略; 核密度估计; 相似性方法

Abstract

Traditional similarity-based methods generally ignore the diversity of equipment fault modes, the difference in degradation rates, and the inconsistency among monitoring data lengths. Thus, a similarity-based multi-scale ensemble method in multiple fault modes (MFM-MSEN) is proposed to improve remaining useful life (RUL) prediction accuracy and characterize prediction uncertainty. By training the fault mode classification model, designing the time-series weighted prediction strategy, and recognizing the fault mode of equipment, the test equipment is matched with the training equipment with the same fault mode to reduce matching complexity, based on which, a multi-scale ensemble strategy is proposed to overcome the data utilization limitation caused by single-scale matching methods and enhance the generalization ability of the proposed MFM-MSEN method. This strategy matches the similarities between test equipment and training equipment at multiple time scales, and then multiscale prediction results are integrated to fit accurate RUL probability distribution by employing kernel density estimation. Experimental results demonstrate the superiority of the proposed MFM-MSEN method in dealing with the differences in equipment degradation.

Keywords: remaining useful life (RUL); fault mode identification; multiscale ensemble strategy; kernel density estimation; similarity-based method

PDF (4306KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

舒俊清, 许昱晖, 夏唐斌, 潘尔顺, 奚立峰. 面向多故障模式的多尺度相似性集成寿命预测[J]. 上海交通大学学报, 2022, 56(5): 564-575 doi:10.16183/j.cnki.jsjtu.2021.024

SHU Junqing, XU Yuhui, XIA Tangbin, PAN Ershun, XI Lifeng. A Multiscale Similarity Ensemble Methodology for Remaining Useful Life Prediction in Multiple Fault Modes[J]. Journal of Shanghai Jiaotong University, 2022, 56(5): 564-575 doi:10.16183/j.cnki.jsjtu.2021.024

设备剩余使用寿命(RUL)预测对于提高设备可靠性和预警故障失效具有重要意义.随着传感器和在线采集技术的发展,海量数据驱动的预测方法已成为RUL预测领域的主流方法,可大致分为统计与机器学习方法两类.在工业界,相较于统计方法使用的一些假设限制,机器学习方法应用相对较为广泛[1-2].

按照预测步骤的不同,当今主流机器学习方法主要包含RUL直接映射法与基于相似性的方法两类[3].前者借助机器学习算法直接建立状态监测数据特征与RUL间的映射关系[4],常用的算法有支持向量机(SVM)[4]、隐马尔科夫模型[5]与人工神经网络[6-10]等.但是由于设备的寿命长度间可能存在较大差异,在历史数据不足时,这类方法的准确性相对较低.而基于相似性的方法通过构建并匹配退化曲线获得的相似度来预测RUL[11],可有效避免上述问题.

自从基于相似性的方法[11]被提出以来,大量研究已证明其在RUL预测领域的有效性.文献[12]将基于相似性的回归与证据理论相结合,无需运行至失效的退化数据用于参考,即可实现RUL预测.文献[13]引入核方法双样本检验(KTST)来评估多维传感信号的相似度,并采用威布尔分布来提供RUL置信区间.此外,一些学者直接将多维状态监测数据转化为一维健康指标(HI)曲线,相较于使用多维退化曲线进行相似性匹配,可有效减小相似度测量的计算规模以提高预测速度.目前,线性回归模型[11]、主成分分析[14]、深度神经网络等算法已被学者们用于HI的建立.文献[3]和[15]将双向长短期记忆(LSTM)结构嵌入自编码器中以构建准确性更高的HI,并提出了一种零中心化规则,应对设备初始退化水平间的差异.文献[16]采用受限玻尔兹曼机构建设备HI,并综合利用相似性方法与双向LSTM模型,以提高RUL预测精度.

上述基于相似性的研究已取得较好成果,但仍存在一些可改进之处:一是不同设备退化时会出现多种失效模式,失效模式不同的设备退化过程往往也存在差异,现有研究通常并未考虑失效模式,而是将所有退化轨迹一起进行相似性匹配,计算量大且影响匹配准确度[3].二是为确保每条退化轨迹都能参与匹配,现有研究通常将匹配时间尺度设置为某个小于所有轨迹长度的常数.在实际中,某些测试设备可提供的退化轨迹可能很短,这种单尺度设置方法将导致其他测试设备退化数据无法被充分利用,从而造成较高的预测误差[17].此外,各测试设备的退化速度也不一致,难以确定适合所有设备的最优匹配尺度.三是现有基于一维健康指标相似性的研究,通常仅进行RUL的单点预测,而无法表征预测不确定度[15-16].在实际工程应用中,以概率形式表达预测结果,描述设备RUL预测的不确定性,对制定合理的维护方案、实现预知维护具有重要意义[18].

针对上述问题,本文提出多故障模式下多尺度相似性集成(MFM-MSEN)方法.该方法通过故障模式识别,实现分类相似性匹配,并降低匹配复杂度,在此基础上提出多尺度集成策略,提高预测精度与泛化性能,最终拟合出RUL概率分布以提供预测置信区间.将MFM-MSEN方法在数据集中应用,证明了其在多故障模式下应对退化差异的优越性.

1 问题描述

以涡扇发动机为研究对象,分析美国国家航空航天局(NASA)的民用模块化航空推进系统仿真(CMAPSS)数据集[19],旨在提出一种多尺度相似性方法,以提高涡扇发动机在多故障模式下的RUL预测精度.CMAPSS数据集通过模拟涡扇发动机的退化过程所得,由故障模式与工况种类数不同的4个子集组成,记录了21个由传感器实时采集的状态信号及3个运行工况参数,其中数据集采用的时间单位为运行周期.

选择包含两种故障模式的子集FD003与FD004用于分析,具体信息如表1所示.由表1可知,训练集与测试集可提供的运行周期数间存在较大差异.训练集记录了训练发动机单元从开始运行至失效的全寿命周期状态监测数据,测试集则只包含测试发动机单元运行至失效前某个时刻的状态监测数据,需要对该时刻设备的 RUL进行预测.此外,CMAPSS数据集提供了各测试发动机的RUL实际值,以验证预测方法的性能.在子集FD003与FD004中,发动机单元既可能因为高压压气机出现故障而失效,也可能由于涡扇故障而失效,本文中以“故障1”和“故障2”来区分两类故障.故障模式不同的发动机单元,退化数据的变化趋势也会存在差异.因此,在进行相似性匹配时,若将测试发动机退化轨迹与所有的训练发动机退化轨迹进行匹配,则会影响匹配的准确度,并且匹配规模的增大会进一步导致匹配计算量与时间消耗的增加.此外,子集FD004包含6种运行工况,这意味着同一个发动机单元在其运行过程中,工况可能会发生变化,而不同工况下其状态信号的波动范围也不一致,从而造成了预测难度的增加.

表1   数据集描述

Tab.1  Descriptions of datasets

数据集子集发动机
数量
发动机最大
运行周期
发动机最小
运行周期
运行工
况种类
故障
模式
FD003训练集10052514512
测试集10047538
FD004训练集24954312862
测试集24848619

新窗口打开| 下载CSV


2 基础理论方法

2.1 自编码神经网络

自编码神经网络(AE)作为一种无监督学习算法,由于具有特殊的结构及训练方式,目前在数据降维、异常检测等领域展现了其独特的优势.网络拓扑结构如图1所示,其中:xdx'd (d=1,2,3,4)分别为网络的输入与输出;zd(d=1,2)为隐含层的输出.由图1可知,网络拓扑结构包括编码与解码两个部分,二者具有对称的结构.

图1

图1   一种自编码神经网络拓扑结构

Fig.1   Structure of an autoencoder neural network


编码器对输入网络的高维数据x进行编码,压缩为低维特征向量,即隐含层输出z,而解码器则将其解码为x',期望还原成输入数据x.AE的训练目标即最小化重构误差L,则有

L=xx22
(1)

在此种无监督训练方式下,只使用正常状态数据训练AE,重构误差的大小则可有效反映设备异常程度.此外,通过采用合适的非线性激励函数,编码器可将高维输入数据非线性映射至低维特征数据,且该低维数据可通过解码器进行还原,据此有效克服线性降维方法造成的信息损失问题.因此,本研究将自编码网络用于健康指标建立以及故障特征提取之中.

2.2 支持向量机

支持向量机是一种有监督的二分类模型,其核心思想是找到一个合适的超平面能在最大限度上将不同类别样本分开.单个SVM模型只能处理二分类问题,但通过设计多个SVM模型,并采用投票法综合多个模型的结果可实现多分类功能.本文采用“一对一”SVM多分类方法,其思想是在任意两类样本之间设计一个SVM模型, 对于包含M'类样本的训练集χ,则需设计M'(M'-1)/2个SVM模型.假定训练集χ样本总数为N,即χ={(x1, Y1), (x2, Y2), ···, (xN, YN)},其中O维向量xk∈RO,类标签Yk∈{1, 2, ···, M'},k=1, 2, ···, N,那么第p类与第q类样本间SVM模型的优化问题可表示为

minωpq,bpq,ξpqγ12pq)Tωpq+C γξpqγ
(2)
s.t. (ωpq)Tϕ(xγ)+bpq≥1- ξpqγ,
Yγ=p (ypqγ=1)
pq)Tϕ(xγ)+bpq≤-1+ ξpqγ,
Yγ=q (ypqγ=-1)
ξpqγ≥0

式中:ωpqbpq分别为划分超平面的法向量和截距;Cξpqγ分别为惩罚系数和损失函数;ϕ(xγ)为从输入空间到特征空间的非线性映射;γ为训练集中类标签为pq的样本索引.通过求解该规划问题的对偶问题,可得第p类与第q类样本间的划分超平面.针对测试样本xtest,单个SVM模型对其所属类别ypqtest的判断为

ypqtest=sign[(ωpq)Tϕ(xtest)+bpq]
(3)

式中:ypqtest值为1,表示样本xtest被判断为第p类,否则判断为第q.最后,采用投票策略综合M'(M'-1)/2个SVM模型的分类结果,得票最多的类别即为该测试样本的预测结果.不同于神经网络需要大量数据进行训练学习,SVM的数学原理使其在少样本量的情况下仍能达到良好的分类效果,考虑到故障特征样本量较小,本研究将设计基于SVM的故障分类模型.

2.3 核密度估计

核密度估计(KDE)是一种用于估计未知概率密度函数的非参数方法,其在研究数据分布特征时,不做任何先验假定,目前在理论和应用领域都受到了高度重视.假定r1, r2, ···, rU为独立同分布FU个样本点,其在KDE下的概率密度函数(PDF)为

ˆfθ(r)= 1Ui=1UKθ(r-ri)= 1Uθi=1K (r-riθ)
(4)

式中:K(·)为符合概率密度性质且均值为0的核函数;θ为平滑参数带宽;Kθ(·)为缩放核函数,且有Kθ(r)=1θK(rθ).通过选择合适的核函数与带宽值,KDE方法可准确估计各种具有不同分布特征数据样本的PDF,因此,本研究借助KDE技术来估计RUL的概率分布.

3 MFM-MSEN预测方法

本研究提出的MFM-MSEN预测方法,具体流程如图2所示.其中:Ri,jτv为测试样本j在时间尺度τv上基于参考样本i的RUL预测值;wi,jτv/uRi,jτv对应的权重;u为采用时间尺度的数量;Sv为时间尺度τv上符合要求的参考样本集合.所提方法主要包含健康指标建立、故障模式识别、相似性匹配以及RUL概率分布预测4个模块.

图2

图2   MFM-MSEN预测方法流程图

Fig.2   Framework of MFM-MSEN prediction method


3.1 基于AE重构误差的健康指标建立

作为相似性方法的基础,HI的构建能简化退化模型,进而提升相似性匹配的效率.考虑到在实际工业环境中,往往存在一些未监控因素会造成设备间的差异.若直接使用多维监测数据的压缩表示作为HI,则鲁棒性较差.因此,本文基于AE重构误差来建立健康指标.

在构建过程中,只使用设备在正常运行期采集的数据来训练AE,使其在重构正常状态数据时具有良好的性能,而在重构异常数据时会出现较大误差.设备状态监测数据的重构误差越大,则代表该设备的衰退程度越高.假设多维时间序列Xi={xi1,xi2, ···,xin} 包含训练单元i从开始运行直至失效的所有数据,则只有正常周期的数据{xi1,xi2, ···,xim}被用来训练AE以最小化目标函数L.训练单元i在时刻t的HI可表示为εit=‖xit-x'it2.

此外,采用移动平均法对AE生成的HI进行平滑化处理.待处理序列εi={εi1,εi2, ···,εin}的平滑过程为

hit={1ρk=max(1,t-(ρ-1)/2)min(n,t+(ρ-1)/2)εik,ρ1ρk=max(1,t-ρ/2)min(n,t+ρ/2)εik,ρ
(5)

式中:ρ为平滑因子;hit为对应的平滑后HI.平滑后的时间序列Hi={hi1,hi2, ···,hin}被称作单元i的退化轨迹,能更准确地表示设备的退化趋势,以用于相似性匹配.

3.2 基于AE-SVM的故障模式识别

为提升多故障模式下相似性匹配的速度与准确度,将AE-SVM与时序加权预测相结合,对设备故障模式进行识别与分类.为提取更多故障模式信息,减小非线性信息损失,以AE编码器输出的低维特征向量,即原始状态监测数据的压缩表示为故障特征.考虑到设备运行初期的故障特征往往并不明显,使用K-means对故障模式进行聚类时,只选用其即将失效时的特征.假设存在M类设备故障,聚类后第m类故障的特征矩阵为

Zm=[Zm1Zm2···Zml]T (m=1, 2, ···, M)

其中:ZmNm×l矩阵,Nm为第m类故障的故障特征样本数量,l为故障特征的维度,即AE隐含层神经元的数量.Zm对应的类标签可表示为Nm×1矩阵 Ym=[m m ··· m]T.

各类故障的特征与标签构成训练集,用以训练SVM模型,从而建立故障模式分类模型.对于在线测试样本单元j,考虑到其可能处于退化初期,故障特征并不明显,若只利用单一时刻采集的状态数据来判断其故障模式,可能会存在较大误差.对此,本文设计了一种加权预测法综合考虑多个时刻的故障特征来确定测试单元的故障模式.故障分类模型根据测试单元j在时刻t的故障特征做出的判断可表示为Y'j, t=argmaxm=1,2,···,M(y'mj,t),其中y'mj,t为0-1变量:

y 'mj,t= {1,jtm0,
(6)
m=1, 2, ···, M

测试单元j在时刻t所处的故障状态则可表示为 Yj,t=argmaxm=1,2,···,M(ymj,t).其中ymj,t的值可由下式计算所得:

ymj,t=(1-α)β-1y 'mj,t-(n-1)+ k=0β-2α(1-α)ky 'mj,t-k
(7)
m=1, 2, ···, M

式中:α(0<α<1)为加权系数,α越大,则近期数据所占权重越大;β (βt)为识别t时刻故障模式时综合考虑的时刻数量.通过比较各类故障概率值ymj,t的大小,可识别出测试单元j在时刻t的故障模式Yj,t.在本文采用的数据集FD003与FD004中,故障种类M为2,通过比较故障概率值,可确定测试发动机单元的故障模式.将测试发动机单元与同种故障模式的训练单元进行相似性匹配,可有效减小匹配时的计算量并节约匹配时间.此外,故障模式相同的涡扇发动机退化过程也较为相似,因此分类匹配可提高匹配精度.

3.3 多时间尺度相似性匹配

相似性匹配的核心思想是根据退化轨迹间的距离,从退化模型库中匹配与测试单元具有相似退化趋势的参考样本.在本研究中,测试单元仅与具有相同故障模式的参考样本进行匹配,以实现多故障模式下的分类匹配,提高匹配效率与精度.参考样本i的退化轨迹可表示为Hi={hi1,hi2, ···,hiti},其中ti为样本i的失效时间,在CMAPSS数据集中,参考样本即训练发动机单元.测试单元j的退化轨迹可表示为˜Hj={˜hj1,˜hj2, ···,˜hjtj},tj为设备j当前已服役的时间.为比较退化轨迹间的相似性,需将轨迹截取为相同长度的片段.设片段长度即匹配时间尺度为τ.对于参考样本i,可截取ti-τ+1个长度为τ的轨迹片段,表示为Hiτ_k={hik,hik+1, ···,hik+τ-1},其中k=1, 2, ···, ti-τ+1.而对于测试样本j,由于需要估计的是其在当前时刻tj的RUL,所以相似性匹配时只需选择最后一个轨迹片段,表示为˜Hjτ={˜hjtj-τ+1,˜hjtj-τ+2, ···,˜hjtj}.通过轨迹片段Hiτ_k˜Hjτ间的欧氏距离来衡量二者间相似性:

Di,jτ_k=(Hiτ_k-˜Hjτ)2
(8)
k=1, 2, ···, t i-τ+1

由此可见,时间尺度τ是影响相似性匹配准确性的关键因素.由于各测试轨迹长度间差异较大,若采用单个时间尺度,将无法充分利用所有测试样本的数据信息.此外,退化速率不同的测试样本适合的匹配尺度也不同.例如对于正在加速衰退的测试样本,由于其HI值变化十分迅速,采用较短的轨迹片段即可准确匹配.

针对上述问题,本研究提出了多尺度集成(MSEN)策略,将退化轨迹截取为多个不同长度的轨迹片段.假定匹配时间尺度集合为{τ1, τ2, ···, τη},其中η为尺度数量,且有0<τ1<τ2<···<τη,则尺度τ需满足以下条件:

τ1≤min(Ttesmin, Ttramin)
(9)
τη≤min(Ttesmax, Ttramin)
(10)

式中:TtesminTtesmax分别为测试样本最小与最大轨迹长度(运行周期);Ttramin为参考样本最短轨迹长度.考虑到匹配尺度的多样性与泛化能力,{τ1, τ2, ···, τη}设置为具有相同间隔的等差数列.

经处理,η种长度的参考轨迹片段构成退化模型库.针对测试样本j的退化轨迹,则截取尺度分别为{τ1, τ2, ···, τu}的片段,其中τu需小于设备j的服役时间tj且{τ1, τ2, ···, τu}⊆{τ1, τ2, ···, τη}.紧接着,将不同长度的测试轨迹片段与模型库中故障模式相同的每条参考轨迹的片段进行匹配.在各时间尺度下,通过计算并比较欧氏距离的大小,选出每条参考轨迹中与测试轨迹最相似的片段,如图3所示.其中:H为健康指标值;T为设备运行周期数;ti,jτv为在时间尺度τv下,参考样本i中与测试样本j最相似的轨迹片段的起始时刻.测试样本j与参考样本i进行多尺度匹配时,其相似度可由测试轨迹片段与最相似参考轨迹片段间的欧氏距离表示:

Di,jτv=mink=1,2,···,ti-τv+1Di,jτv_k
(11)
v=1, 2, ···, u

在每个时间尺度下,选择与测试样本j相似度较高的参考样本用于预测RUL概率分布.

图3

图3   多尺度相似性匹配与RUL预测示意图

Fig.3   Schematic diagram of multiscale similarity matching and RUL prediction


3.4 基于MSEN策略的RUL分布预测

由于难以选择使预测误差最小的最优时间尺度,本文提出了MSEN策略集成多尺度RUL预测结果,从而提高预测的准确性与泛化性能.由图3可知,测试样本的预测结果根据与其相似的多尺度参考轨迹片段得到.假设在时间尺度τv下,参考样本i中与测试样本j最相似的轨迹片段的起始时刻可以表示为

ti,jτv=arg mink=1,2,···,ti-τv+1Di,jτv_k
(12)
v=1, 2, ···, u

基于参考样本i,测试样本j的RUL预测值可表示为

Ri,jτv=ti-(ti,jτvv-1)
(13)
v=1, 2, ···, u
Di,jτv≤λ minsI(Ds,jτv), i∈Sv
(14)

式中:λ为控制相似度的松弛因子;I为退化模型库中与设备j具有相同故障模式的参考样本集合.在各时间尺度下,根据退化模型中相似度满足式(14)的参考样本,可得到一系列RUL预测值{Rijτv|iSv},以用于估计RUL的概率分布.根据对应轨迹片段的欧氏距离,可计算出在尺度τv上预测值Ri,jτv对应的权重:

wi,jτv= 1Di,jτvsSv1Ds,jτv,
i∈Sv, v=1, 2, ···, u
(15)

最后,赋予各时间尺度τv (v=1, 2, ···, u)预测结果相同的权重1/u,以确定预测测试样本j RUL时Ri,jτv最终所占权重,即wi,jτv/u.通过MSEN策略,可将各单尺度预测值的误差相互抵消,并且在总体上提高预测的泛化能力.为表征预测不确定性,本文采用高斯核密度估计器,集成一系列RUL预测值和权重{(wi,jτv/u,Ri,jτv)|iSv, v=1, 2, ···, u},以拟合样本j 剩余使用寿命的PDF:

ˆf(Rj)= v=1uiSvwi,jτv/u2πθexp (-(Rj-Ri,jτv)22θ2)
(16)

式中:Rj为测试样本j的RUL.

基于KDE的RUL概率分布拟合如图4所示,其中:ϑ为核密度值;R为剩余寿命预测值.依据预测值和对应的权重,基于KDE的RUL概率分布预测可提供不同水平的置信区间.此外,通过计算所拟合分布的均值,可得到最终的RUL点估计值为

ˆRj= v=1uiSvRi,jτvwi,jτv/u
(17)

通过集成多个尺度的预测值,具有不确定性的RUL最终预测结果可以为预知维护提供更准确和可靠的支持.

图4

图4   基于KDE的RUL概率分布拟合

Fig.4   PDF approximation of RUL based on KDE


4 案例研究

4.1 数据预处理

由于不同工况下传感信号的波动范围不同,所以对于包含6种工况的FD004,在归一化处理前需根据工况参数,对传感信号进行K-means聚类.对子集中属于同种工况的信号数据,本文采用最小-最大值规范化方法来消除量纲的影响,公式如下:

ζc,gnor=ζc,g-ζcminζcmax-ζcmin
(18)

式中:ζc, g为第c个传感信号的第g个数据;ζc,gnorxi,j归一化后的数据;ζcminζcmax分别为第c个信号的最小值与最大值.

考虑到一些状态信号与退化特征无关,其数值仅在几个常数上波动,为了使HI更好地表征退化过程,最终选用了传感器编号为2、3、4、 7、8、9、 11、12、 13、 14、15、 17、 20与21的14个信号.此外,涡扇发动机在运行初期几乎不会衰退,本文引入了分段线性函数[6]来对RUL标签进行修正.根据文献[13],将临界值设置为125,RUL标签中大于125的部分将被修正为125.

4.2 预测实现

(1) 健康指标建立.

在保证发动机正常运行的情况下尽量增加训练数据样本,本文选择各训练单元总寿命周期中前20%的状态监测数据用于训练HI建立模型.模型参数如表2所示.输入层与输出层神经元数量均设置为所选信号的数量.为增强模型的非线性映射能力,采用3个全连接层为隐含层.其中,隐含层1与隐含层3均采用 ReLU激励函数,有助于实现网络的稀疏连接.考虑到归一化的信号数据范围是 [0, 1],输出层采用tanh激励函数对数据进行规范化处理.模型训练时批尺寸设为128,最大训练周期数设为30,采用自适应矩估计算法作为优化器.设定平滑因子为20,对AE模型的重构误差进行平滑化处理,以生成最终的HI.

表2   HI建立模型参数设置

Tab.2  Parameter setting of HI construction model

编号结构名称网络层神经元数量激励函数
1编码器输入层14ReLU
2隐含层 17ReLU
3隐含层 21Linear
4解码器隐含层 37ReLU
5输出层14tanh

新窗口打开| 下载CSV


子集FD003部分训练单元的HI曲线如图5所示.在运行初期,轨迹的斜率接近于0,在即将失效时,HI值迅速上升.这表明退化轨迹可较好地表征发动机的退化过程.此外,可发现图5中处于两种不同故障模式的训练单元最大健康指标值间存在一定差异,侧面证明了多故障模式识别以及分类相似性匹配的必要性.

图5

图5   FD003训练集部分退化轨迹

Fig.5   Several training degradation trajectories of FD003


(2) 多故障模式识别.

在多故障模式识别中,首先需确定提取故障特征的维数.通过AE对训练数据的重构误差大小来判断特征向量是否包含足够的故障信息,同时考虑重构误差值与故障特征聚类复杂度,设定特征维数为2.因此,AE编码器与解码器之间的隐含层2神经元数目设置为2,网络其他参数与HI建立模型相同,使用训练单元全寿命周期的数据对网络进行训练.为确保发动机已出现明显故障,仅选择每个训练单元最后10个运行周期的特征用于聚类分析,训练集的聚类效果如图6所示, 其中:Γ1Γ2分别为提取的故障特征1与故障特征2.由图6可知,在FD003与FD004中两类故障均有显著差异,表明故障特征提取与聚类方法具有较好的泛化性.

图6

图6   练集故障特征聚类

Fig.6   Fault clustering of training sets


使用聚类后的故障特征训练故障分类模型,模型采用高斯核函数,惩罚系数C设为1.最终,综合考虑10个时刻的故障特征,加权系数α设为0.4,识别测试单元的故障模式.

(3) 多尺度匹配.

数据集运行周期数分布如图7所示,其中:κ为概率密度.由图7表1可知,训练集与测试集退化轨迹长度间均存在较大差异,这也意味着涡扇发动机的退化速度各不相同.因此,本文针对FD003与FD004分别设计了一个时间尺度集合.为充分利用退化数据信息,将最小尺度设置为测试发动机的最小运行周期数.此外,考虑到过长的轨迹片段将包含过多无用信息干扰匹配,最大尺度应小于100.为避免尺度过多导致匹配时间过长,最终选择间隔为20的4个时间尺度构成集合.将测试单元按轨迹长度分成四个组别,使用不同数量的时间尺度进行匹配,具体信息如表3所示.

图7

图7   数据集运行周期数分布

Fig.7   Running cycle distribution of datasets


表3   匹配时间尺度设置

Tab.3  Time scales for similarity matching

数据集时间尺度集合
{τ1,τ2,τ3,τ4}
组别 1({τ1})
发动机数量
组别 2({τ1,τ2})
发动机数量
组别 3({τ1,τ2,τ3})
发动机数量
组别 4({τ1,τ2,τ3,τ4})
发动机数量
FD003{38, 58, 78, 98}66979
FD004{19, 39, 59, 79}151017206

新窗口打开| 下载CSV


(4) RUL分布预测.

完成多尺度匹配后,设定松弛因子λ为1.5来选择用于RUL预测的相似参考轨迹.最终,采用带宽为0.7的高斯核密度估计器,集成多尺度预测结果,拟合RUL的概率分布,如图8所示.由图8可知,随着运行周期的增加,RUL预测值越来越接近于真实值,且置信区间在逐渐缩小,证明了MFM-MSEN方法的有效性.

图8

图8   FD004测试单元#158预测结果

Fig.8   Prediction results of test unit No.158 in FD004


5 结果分析与讨论

为消除自编码神经网络随机性的影响,本文取10次重复实验的结果,用于MFM-MSEN方法的效果验证.

5.1 预测结果

为更全面地评价预测性能,采用两个度量标准:均方根误差(RMSE) Φ以及Score函数Δ.Score函数针对RUL预测中高估RUL会带来更严重的损失这一特性,给予高估RUL更高的惩罚,Score函数及RMSE的计算公式如下:

Δ= {j=1nexp[-(dj13)]-1,dj<0j=1nexp(dj10)-1,dj0
(19)
Φ= 1Ntesj=1Ntes(dj)2
(20)

式中:Ntes为测试单元的数量;dj=ˆRj-Rjtru;ˆRjRjtru分别为测试单元j的RUL预测值和真实值.度量标准的数值越低则代表预测效果越好.

按照RUL标签从小到大的顺序,FD003测试单元的预测结果如图9所示,其中:Ω为测试发动机按RUL标签从小到大顺序的编号.由图9可知,总体预测效果较好,RMSE值达到15.07.将MFM-MSEN方法与现有先进研究方法对比,结果如表4所示.由表4可知,MFM-MSEN方法的总计RMSE和Score值达到了所有预测方法中的最低.对于预测难度较高的子集FD004,可发现所提方法的RMSE值接近于所有预测方法中最优值,且Score值达到了所有方法中的最优,证明了MFM-MSEN方法在复杂工况数据集上的优越性.其次,MFM-MSEN方法在FD003上也取得了不错效果,RMSE值优于其他相似性方法,表明该方法具有较好的泛化能力.

图9

图9   FD003测试集预测结果

Fig.9   Prediction results of test units in FD003


表4   与现有先进方法比较结果

Tab.4  Comparison of existing state-of-the-art methods

方法种类方法名称RMSEScore
FD003FD004总计FD003FD004总计
基于相似性的方法MFM-MSEN 方法15.0722.2220.42609.972641.053251.02
传统单尺度方法16.8924.6222.671280.435009.316289.74
EN[3]19.1622.1521.33172729014628
BiLSTM-ED[15]17.4823.4921.9357432023776
RULCLIPPER[20]16.0024.3322.2631731323449
RUL直接映射法DCNN[6]12.6423.3120.81284.11246612750.1
D-LSTM[7]16.1828.1725.3185255506402
MODBNE[8]12.5128.6625.11421.916557.626979.53

新窗口打开| 下载CSV


此外,将传统单尺度方法与所提方法进行比较,传统方法中采用测试单元最小运行周期数作为匹配时间尺度.由表4可发现,MFM-MSEN方法显著提升了预测精度,进一步证明了故障模式识别与MSEN策略的有效性.

5.2 故障识别效应分析

为探究故障识别对预测效果的影响,将MFM-MSEN方法与未经故障分类的MSEN方法进行比较,结果如表5所示.其中,提升比率:

Λ= EMSEN-EMFM-MSENEMSEN
(21)

式中:EMFM-MSENEMSEN分别为对应方法的评价指标值.由表5可知,在两个子集上,MFM-MSEN的RMSE与Score值均显著低于MSEN方法,尤其对于FD003,Score值降低高达51.1%.这是由于故障模式相同的发动机单元退化过程通常更为相似,按照故障模式进行分类匹配有助于提高匹配准确性.此外,分类匹配可有效缩小匹配规模与计算量,并且发动机数量越多,匹配规模缩小量越大.因此,MFM-MSEN方法显著缩短了匹配时间,特别是对于发动机数量较多的FD004,时间缩短接近6 min.

表5   故障识别效应分析

Tab.5  Effects of fault mode identification

指标FD003FD004
RMSEScore匹配时间/sRMSEScore匹配时间/s
EMSEN15.771247.4910623.683808.86718
EMFM-MSEN15.07609.974922.222641.05374
Λ/%4.4351.153.86.1730.747.9

新窗口打开| 下载CSV


5.3 多尺度集成策略效应分析

设定测试单元最小运行周期数作为单一匹配尺度,面向多故障模式的单尺度(MFM)方法与MFM-MSEN方法的对比结果如图10所示.在两个子集上,MFM-MSEN方法的RMSE值均低于MFM方法.这证明了MSEN策略的优越性,可有效解决单尺度方法造成的退化数据利用率低的问题.

图10

图10   与单尺度MFM方法比较结果

Fig.10   Results of comparison with MFM method


为进一步探究集成策略的必要性,将测试单元按轨迹长度分成4个组别,各组别在不同匹配尺度下的预测结果如图11所示.可发现各组别最优尺度并不一定是最大或最小尺度,这意味着无法根据轨迹长度直接判断出最优尺度.而通过集成策略将多个尺度的预测结果结合,可有效避免最优尺度选择困难的问题.并且在所有测试组别上,多尺度预测的RMSE值均低于或接近最优单尺度.综上,MSEN策略有效提高了预测泛化性能与精度.

图11

图11   各测试组别MSEN策略效应分析

Fig.11   Effects of MSEN strategy on test groups


6 结语

考虑到设备故障模式多样性、退化速度差异性以及可提供数据长度的不一致性,本文提出了MFM-MSEN寿命预测方法.在该方法中,通过故障特征提取与故障聚类等实现故障分类模型的训练,并设计时序加权预测策略来识别测试设备故障模式,以进行分类匹配,提高预测精度的同时降低了匹配的计算复杂度.此外,该方法提出MSEN策略实现了多尺度相似性匹配,并采用KDE法集成多尺度结果拟合概率分布,有效提高了数据利用率与预测泛化性能,且能提供RUL置信区间.在CMAPSS数据集上验证方法的效果,相较于现有其他先进方法,MFM-MSEN方法总体上取得了最高的精度,效应分析也进一步证明了故障识别与MSEN策略的优越性.未来将采用更多复杂数据集验证预测方法的泛化性,并设计相关实验以量化其鲁棒性.此外,可优化多尺度预测结果集成时权重的设置机制,以进一步提升预测性能.

参考文献

XIA T B, DONG Y F, XIAO L, et al.

Recent advances in prognostics and health management for advanced manufacturing paradigms

[J]. Reliability Engineering & System Safety, 2018, 178: 255-268.

DOI:10.1016/j.ress.2018.06.021      URL     [本文引用: 1]

ZHUO P C, ZHU Y, WU W X, et al.

Real-time fault diagnosis for gas turbine blade based on output-hidden feedback Elman neural network

[J]. Journal of Shanghai Jiao Tong University (Science), 2018, 23(Sup. 1): 95-102.

[本文引用: 1]

YU W N, KIM I Y, MECHEFSKE C.

Remaining useful life estimation using a bidirectional recurrent neural network based autoencoder scheme

[J]. Mechanical Systems and Signal Processing, 2019, 129: 764-780.

DOI:10.1016/j.ymssp.2019.05.005      URL     [本文引用: 4]

KHELIF R, CHEBEL-MORELLO B, MALINOWSKI S, et al.

Direct remaining useful life estimation based on support vector regression

[J]. IEEE Transactions on Industrial Electronics, 2017, 64(3): 2276-2285.

DOI:10.1109/TIE.2016.2623260      URL     [本文引用: 2]

LIU Q M, DONG M, LV W, et al.

A novel method using adaptive hidden semi-Markov model for multi-sensor monitoring equipment health prognosis

[J]. Mechanical Systems and Signal Processing, 2015, 64/65: 217-232.

DOI:10.1016/j.ymssp.2015.03.029      URL     [本文引用: 1]

LI X, DING Q, SUN J Q.

Remaining useful life estimation in prognostics using deep convolution neural networks

[J]. Reliability Engineering & System Safety, 2018, 172: 1-11.

DOI:10.1016/j.ress.2017.11.021      URL     [本文引用: 3]

ZHENG S, RISTOVSKI K, FARAHAT A, et al.

Long short-term memory network for remaining useful life estimation

[C]// 2017 IEEE International Conference on Prognostics and Health Management. Dallas, TX, USA: IEEE, 2017: 88-95.

[本文引用: 2]

ZHANG C, LIM P, QIN A K, et al.

Multiobjective deep belief networks ensemble for remaining useful life estimation in prognostics

[J]. IEEE Transactions on Neural Networks and Learning Systems, 2017, 28(10): 2306-2318.

DOI:10.1109/TNNLS.2016.2582798      URL     [本文引用: 2]

SONG Y, SHI G, CHEN L Y, et al.

Remaining useful life prediction of turbofan engine using hybrid model based on autoencoder and bidirectional long short-term memory

[J]. Journal of Shanghai Jiao Tong University (Science), 2018, 23(Sup.1): 85-94.

[本文引用: 1]

宋亚, 夏唐斌, 郑宇, .

基于Autoencoder-BLSTM的涡扇发动机剩余寿命预测

[J]. 计算机集成制造系统, 2019, 25(7): 1611-1619.

[本文引用: 1]

SONG Y, XIA T B, ZHENG Y, et al.

Remaining useful life prediction of turbofan engine based on Autoencoder-BLSTM

[J]. Computer Integrated Manufacturing Systems, 2019, 25(7): 1611-1619.

[本文引用: 1]

WANG T Y, YU J B, SIEGEL D, et al.

A similarity-based prognostics approach for remaining useful life estimation of engineered systems

[C]// 2008 International Conference on Prognostics and Health Management. Denver, CO, USA: IEEE, 2008: 1-6.

[本文引用: 3]

CANNARILE F, BARALDI P, ZIO E.

An evidential similarity-based regression method for the prediction of equipment remaining useful life in presence of incomplete degradation trajectories

[J]. Fuzzy Sets and Systems, 2019, 367: 36-50.

DOI:10.1016/j.fss.2018.10.008      URL     [本文引用: 1]

CAI H S, JIA X D, FENG J S, et al.

A similarity based methodology for machine prognostics by using kernel two sample test

[J]. ISA Transactions, 2020, 103: 112-121.

DOI:10.1016/j.isatra.2020.03.007      URL     [本文引用: 2]

LIU Y C, HU X F, ZHANG W J.

Remaining useful life prediction based on health index similarity

[J]. Reliability Engineering & System Safety, 2019, 185: 502-510.

DOI:10.1016/j.ress.2019.02.002      URL     [本文引用: 1]

YU W N, KIM I Y, MECHEFSKE C.

An improved similarity-based prognostic algorithm for RUL estimation using an RNN autoencoder scheme

[J]. Reliability Engineering & System Safety, 2020, 199: 106926.

DOI:10.1016/j.ress.2020.106926      URL     [本文引用: 3]

HOU M R, PI D C, LI B R.

Similarity-based deep learning approach for remaining useful life prediction

[J]. Measurement, 2020, 159: 107788.

DOI:10.1016/j.measurement.2020.107788      URL     [本文引用: 2]

XIA T B, SONG Y, ZHENG Y, et al.

An ensemble framework based on convolutional bi-directional LSTM with multiple time windows for remaining useful life estimation

[J]. Computers in Industry, 2020, 115: 103182.

DOI:10.1016/j.compind.2019.103182      URL     [本文引用: 1]

PENG W W, YE Z S, CHEN N.

Bayesian deep-learning-based health prognostics toward prognostics uncertainty

[J]. IEEE Transactions on Industrial Electronics, 2020, 67(3): 2283-2293.

DOI:10.1109/TIE.2019.2907440      URL     [本文引用: 1]

SAXENA A, GOEBEL K, SIMON D, et al.

Damage propagation modeling for aircraft engine Run-to-failure simulation

[C]// 2008 International Conference on Prognostics and Health Management. Denver, CO, USA: IEEE, 2008: 1-9.

[本文引用: 1]

RAMASSO E.

Investigating computational geometry for failure prognostics in presence of imprecise health indicator: Results and comparisons on C-MAPSS datasets

[C]// Second European Conference of the Prognostics and Health Management Society 2014. Nantes, France: CCSD, 2014: 1-13.

[本文引用: 1]

/