上海交通大学学报, 2022, 56(10): 1397-1408 doi: 10.16183/j.cnki.jsjtu.2021.084

机械与动力工程

在线压缩核主元分析的自适应过程监控

郭金玉, 李文涛, 李元,

沈阳化工大学 信息工程学院,沈阳 110142

Adaptive Process Monitoring of Online Reduced Kernel Principal Component Analysis

GUO Jinyu, LI Wentao, LI Yuan,

College of Information Engineering, Shenyang University of Chemical Technology, Shenyang 110142, China

通讯作者: 李 元,女,教授,博士生导师,电话(Tel.):13082424115; E-mail:li-yuan@mail.tsinghua.edu.cn.

责任编辑: 王一凡

收稿日期: 2021-03-18  

基金资助: 国家自然科学基金重大项目(61490701)
国家自然科学基金项目(61673279)
辽宁省教育厅项目(LJ2019007)

Received: 2021-03-18  

作者简介 About authors

郭金玉(1975-),女,山东省聊城市人,博士,从事工业过程的故障检测与诊断研究.

摘要

对于动态系统,传统的核主元分析(KPCA)方法处理的效果不理想.滑动窗口核主元分析方法能适应动态系统的正常参数漂移,但是该方法处理大量的样本时需要较长的运算时间.因此,提出一种在线压缩核主元分析的自适应过程监控方法.该方法在大量的样本中选定较小的训练集作为初始压缩集进行建模,对在线实时采集的数据进行分析,判断新的样本是否正常.若为正常样本,判断该样本是否加入压缩集中,在加入压缩集的同时自动更新在线KPCA模型.将该方法应用到数值例子和田纳西-伊斯曼(TE)过程,仿真结果验证了该方法的有效性.

关键词: 核主元分析; 在线压缩核主元分析; 滑动窗口; 过程监控

Abstract

In the case of dynamic systems, the traditional kernel principal component analysis (KPCA) method does not perform well. The moving window kernel principal component analysis method can adapt to the normal parameter drift of dynamic systems, but it needs a longer computation time when processing large number of samples. Therefore, an adaptive process monitoring method for online reduced kernel principal component analysis is proposed. In this method, a small training set is selected as the initial reduced set in a large number of samples for modeling, and the online real-time collected data are analyzed to judge whether the new sample is normal or not. If it is a normal sample, the method judges whether the sample is added to the reduced set, and updates the online KPCA model automatically when adding to the reduced set. The proposed method is applied to a numerical example and the Tennessee-Eastman (TE) process. The simulation results show that the proposed method is effective and feasible.

Keywords: kernel principal component analysis (KPCA); online reduced kernel principal component analysis (ORKPCA); moving window; process monitoring

PDF (1945KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

郭金玉, 李文涛, 李元. 在线压缩核主元分析的自适应过程监控[J]. 上海交通大学学报, 2022, 56(10): 1397-1408 doi:10.16183/j.cnki.jsjtu.2021.084

GUO Jinyu, LI Wentao, LI Yuan. Adaptive Process Monitoring of Online Reduced Kernel Principal Component Analysis[J]. Journal of Shanghai Jiaotong University, 2022, 56(10): 1397-1408 doi:10.16183/j.cnki.jsjtu.2021.084

在实际工业生产过程中,倘若某个部件发生异常,就可能给整个工业过程带来难以估量的损害,从而造成巨大的财产损失.工程监控系统和故障诊断技术的结合能够很好地提前对隐藏的风险进行排除,保证系统正常运行.于是,基于数据驱动的故障诊断方法应时而生.该方法仅需要对工业生产过程中的历史数据进行建模,可以在大量过程数据中提取有价值的信息[1-3]并用于故障检测与诊断中,因此广受关注.

主元分析(PCA)[4-8]是一种广泛应用于工业过程监控的多元统计工具.然而,在实际的工业生产过程中存在复杂的动态特性,这使其不适用于实际工业生产过程的故障检测.Ku 等[9]提出基于动态主元分析 (DPCA)的故障检测方法,该方法将变量延迟加入数据矩阵中构造时间滞后增广矩阵,从而达到检测动态过程的目的.Li等[10]提出递归主元分析(RPCA),该方法通过不断将新数据加入矩阵来更新协方差矩阵,从而适应动态过程提高诊断效率.由于该方法运行时间较长,Xiao等[11]提出滑动窗口PCA方法,该方法通过不断更新滑动窗口中的数据达到故障监控目的,从而适应动态工业过程提高实时检测的性能.上述方法可以有效地提高动态过程的检测效率,但是这些方法对非线性动态过程的检测效果并不是很理想.于是,核主元分析(KPCA)[12-13]、核局部保持投影(KLPP)[14-15]、核熵成分分析(KECA)[16-17]等处理非线性的方法相继出现.在这些引入核函数的方法中,KPCA方法是对PCA方法的非线性扩展,以其容易理解和计算而广受关注.Sang等[18]在DPCA方法的基础上,提出动态核主元分析(DKPCA)方法,解决DPCA方法对非线性动态过程进行故障监控的局限性,能够很好地提高在动态的非线性过程中对异常数据的检测能力.谢磊等[19]提出递归KPCA 的思想,通过更新KPCA模型达到提升检测效果的目的,以适应工业过程中的动态变化特性,提高检测效果.但是,每当出现一个新的样本时,核矩阵就会增加,导致该方法在对规模较大的工业系统进行故障检测时存在较大的计算难度.为了解决这种问题,Liu等[20]提出一种运用滑动窗口KPCA (MWKPCA)的故障检测方法,该方法通过给滑动窗口添加新的样本和抛弃旧的样本达到更新KPCA模型的目的,从而解决由于递归方法带来的核矩阵不断加大的问题.后来,Chouaib等[21]结合递归和滑动窗口的思想,提出基于自适应核主元分析的动态过程监控方法,进一步提高滑动窗口KPCA方法在动态系统中的检测性能.然而在滑动窗口方法中,当测试数据中包括足够多的新样本时,就会存在更新的模型难以检测出实际样本的异常,原因是该方法缺乏有效地更新核矩阵特征值和特征向量的方式.为了克服该方法的局限性,Fazai等[22]提出可变滑动窗口KPCA (VMWKPCA)方法,运用可变滑动窗口方法来更新KPCA模型.该方法的思想是根据正常过程的变化改变滑动窗口的大小,能够有效地提高KPCA在工业过程中的监控性能.上述的改进方法提高了KPCA的工业过程故障检测效果,但是,当训练样本过大时,这些方法不仅运算时间过长,而且内存占用较大.

为了提高KPCA方法在具有动态特性的工业过程中的监控性能,减少建模过程中冗余的信息量,提高在线故障检测效率,降低运行内存,优化检测时间,本文提出一种在线压缩KPCA(ORKPCA)的自适应过程监控方法.该方法在大量的样本中选定较小的训练集作为初始压缩集进行建模,该压缩集中的样本同原始KPCA建模时的主元方差方向一致,样本个数等于保留的主元个数,这样可以有效地剔除原始训练样本中的冗余信息,然后对在线实时采集的样本进行监控,判断新的样本是否正常;若为正常样本则根据一种近似准则确定该样本与压缩集样本之间的相关性,判断该样本是否加入压缩集中,在该样本加入压缩集的同时自动更新在线KPCA模型.这样能够使监控模型更好地适应动态的系统,有效提高KPCA方法在动态工业过程中的检测性能.

1 核主元分析方法

1.1 KPCA

KPCA方法用于表示建模数据之间的非线性关系,可以有效地将线性不可分的输入数据投影到可以线性分离的高维空间中,然后在特征空间H中执行线性PCA.假设样本集为x1,x2,,xNRm,其中:N为样本个数,m为变量个数.这些样本通过一个非线性映射ϕ投影到特征空间H中,可表示为

ϕ:xiRmϕ(xi)Rh

式中:h为特征空间的维数.

在特征空间H中向量ϕ(xi)ϕ(xj)(i,j=1,2,,N)的点积为

ϕ(xi)Tϕ(xj)=<ϕ(xi),ϕ(xj)>=k(xi,xj)

式中:k为内核函数.

高维特征空间H中样本的协方差矩阵为

Q=1N-1j=1Nϕ(xj)ϕ(xj)T

类似线性PCA,特征空间中的KPCA等效于解决特征值问题.设特征向量为Vk, 特征值为μk, 其特征方程为

μkVk=QVk=1N-1j=1Nϕ(xj)ϕ(xj)TVk=1N-1j=1N<ϕ(xj),Vk>ϕ(xj)

在式(4)中,对于协方差矩阵Q中的每个特征向量Vk,都可以视为ϕ(x1), ϕ(x2), …, ϕ(xN)的线性组合[23],即

Vk=i=1Nvk,iϕ(xi), k=1,2,,N

式中:vk,i为线性相关系数.

结合式(2)和(4),可以得到:

μki=1Nvk,iKk,i=1N-1i=1Nvk,ij=1NKkjKji

进一步化简可得:

λkvk=Kvk

式中:λk=(N-1)μk;KRN×N为核矩阵,其特征值为λ1λ2λN,对应的特征向量为v1,v2,,vN.在特征空间H中,式(4)中协方差矩阵Q的特征向量Vk构成一个矩阵Vf=[V1V2VlVl+1VN].选择l个主元(PC),在主元空间中得到V^f=[V1V2Vl]RN×l.由于特征向量Vk在特征空间H中应该满足正态约束,即<Vk,Vk>=1.由此核矩阵K的特征向量v1,v2,,vN可以表示为

<vk,vk>=<Vk,Vk>λk

特征向量取其1λk的范数,那么有:

vk=1λkvk

在特征空间H中的V^f表示为

V^f=1λ1XTv11λlXTvl=XTV^Λ-1/2

式中:Λ=diag(λ1,λ2,,λl);V^=[v1v2vl];X=[ϕ(x1)ϕ(x2)ϕ(xN)]T.

1.2 故障检测

为了验证提出方法的有效性,使用统计量T2进行验证分析.根据式(10)计算测试数据x在主元空间上的投影,即主元为

t^=V^Tfϕ(x)=Λ-1/2V^TXϕ(x)=Λ-1/2V^Tk(x)k(x)=Xϕ(x)=[ϕ(x1)ϕ(x2)ϕ(xN)]Tϕ(x)=[ϕ(x1)Tϕ(x)ϕ(x2)Tϕ(x)ϕ(xN)Tϕ(x)]T=
[k(x1,x)k(x2,x)k(xN,x)]T

由此可以得到

T2=t^TΛ-1t^=k(x)TV^Λ-2V^Tk(x)=k(x)TC'k(x)

式中:C'=V^Λ-2V^T.

运用F分布得到统计量T2的控制限[24]

Tlim,α2={l(N2-1)/[N(N-l)]}×Fα(l,N-l)(14)

式中:α为置信水平.

2 在线压缩KPCA的基本原理

2.1 构建压缩集的原理

在规模较大的训练样本中,若用传统的KPCA方法进行建模,将在线数据向KPCA模型上投影,通过监控统计量T2进行过程监控会带来极大的运算量.尤其在动态的工业过程中,许多DKPCA方法都不能很好地解决在训练样本过大时带来的计算时间过长和内存消耗的问题,而用压缩数据建模的核心目的就是解决检测过程中计算时间过长和内存消耗过大的问题[25-26].

在传统的KPCA方法中,一般认为选定的主元近似包含训练数据集中的全局信息.于是,本文认为在训练集{xi}(i=1, 2, …, N)中存在代表主元信息的观测值,可以用来表示训练数据集的全局信息, 该方法的原理是用一组观测向量逼近由KPCA方法保留的主元,这些观测向量与选择的主元方差方向一致.选取的主元数根据累计方差贡献率(CPV)来确定:

CPV(l)=i=1lλi/i=1Nλi
l=arg(CPV0.99)

根据特征值降序选择前l个特征值与特征向量构造一个信息矩阵,在原始训练集寻找满足这个信息矩阵要求的数据样本{xi}(i=1, 2, …, l),此时,可以定义构建压缩数据建模模型中有代表性的观测值数等于l.根据式(9)与(10),信息矩阵可以表示为

h(xi)j= λj-1/2ϕ(xi)T[ϕ(x1)ϕ(x2)ϕ(xN)]vj= λj-1/2k(xi)vj

为了在式(17)中找到数据样本{ϕ(xaj)}(j=1,2,,l),将所有的ϕ(xi)(i=1,2,,N)投影到主元空间V^f=[V^1V^2V^l]RN×l中,满足如下条件,保留xaj{xi}:

ϕ(xaj)jmaxh(xi)j, ϕ(xaj)ij<ε

式中:ε.ε,,{xaj}被确定,就可以得到一个新的压缩数据矩阵:

Y=[xa1xa2xal]T

2.2 近似准则原理

在本文中实时检测的数据与前一时刻检测的数据有着密切的关系,通过压缩训练集的方法在训练样本中构建压缩集.假设得到的压缩集为:Y=[xa1xa2xal]T,计算该压缩集的控制限Ta,α2.在更新数据模型时,首先判断新的数据是否产生异常,因此需要计算该新样本的统计量tnew2,并用该值与压缩集的控制限作比较.若比较结果大于压缩集的控制限,则称该样本为异常样本,那么这个样本将不加入压缩集中,同时,进入下一采样时刻.若比较结果为正常样本,根据文献[27]提出的一种线性逼近准则可以确定在压缩集Y中,在时间q处丢弃或接受测量xq的核函数ϕ(xq)的相关性来评估和决定压缩集是否保持不变或应该更新.只有当压缩集发生变化时,方法的参数才会更新.近似判定系数的具体计算如下:

 ξq=minτϕ(xq)-j=1lτjϕ(xaj)H2η

式中:η为控制稀疏程度的参数,该判定参数为预设值;ξq为根据近似准则原理比较ϕ(xq)与压缩集中的l个样本在主元空间上的相关性;τj为最优系数.对式(20)进一步化简得到:

 ξq=minτ(j,i=1lτjτik(xaj,xai)-2j=1lτjk(xaj,xq)+k(xq,xq))=minτ(τTKlτ-2τTkl(xq)+k(xq,xq))

式中:Kl∈Rl×l为压缩集Y的核矩阵,

Kl=k(xa1,xa1)k(xa1,xal)k(xal,xa1)k(xal,xal)

τ为式(21)对τ1, τ2, …, τl取偏导数的最优系数向量.令偏导数为0,得到:

τ=Kl-1kl(xq)(q=1,2,,N)
kl(xq)= [k(xa1,xq)k(xa2,xq)k(xal,xq)]T

式中:kl(xq)为核向量.

将式(23)代入式(21)得到:

ξq=k(xq,xq)-kl(xq)Tτ

2.3 模型更新准则

当在线测试的样本检测为正常时,此时可以分两种情况,即根据该样本所包含的信息在训练集中是否存在进行两种不同方式的处理.当ξq<η时,表明新的样本包含的信息在压缩集中存在,即该样本与压缩集中样本相关性较大.为了保证压缩集投影在特征空间中样本的线性独立性,这个新的正常样本将不添加到压缩集中,压缩集的模型不发生改变.如果ξqη,则定义该样本所包含的信息在压缩集中并不存在,那么这个新的样本需要添加到正常的压缩集中.由于压缩集发生了改变,此时需要更新方法的参数,包括核矩阵、其逆矩阵、主元的数量、T2指标及其控制限.此时需要更新的压缩集定义为

Y=[xa1xa2xal+1]T

在压缩集Y中第l+1个特征向量可以表示为

Vkl+1=i=1l+1vk,ilϕ(xai)

压缩集得到新的核矩阵Kl+1∈R(l+1)×(l+1),其更新模型如下:

Kl+1=Klkl(xq)kl(xq)Tk(xq,xq)

这种情况下的核向量为

kl(xq)= [k(xa1,xq)k(xa2,xq)k(xal+1,xq)]T

根据式(13),新压缩集的统计量为

Tl2=kl(xq)TC'lkl(xq)  
C'l=V^l(Λl)-2(V^l)TΛl=diag(λa1,λa2,,λal+1)V^l=[va1lva2lval+1l]

式中:al+1为压缩集中的样本映射到特征空间中的主元个数.除了需要更新压缩集的统计量Tl2外,同时也需要更新核矩阵Kl+1-1.为了节约时间,使检测结果更快,本文引用Woodbury矩阵恒等式,根据已知Kl的逆矩阵求产生变化后矩阵的逆,其更新准则如下:

Kl+1-1=Kl-1000+1ξq-Kl-1kl(xq)1-kl(xq)TKl-11=Kl-1000+1ξq-τ1[-τT1]
τl+1=Kl+1-1kl(xq)

式中:τl+1为更新的最优系数向量.

2.4 ORKPCA方法的主要步骤

步骤1 给定初始的较大训练集:

X=[x1x2xN]TRN×m

(1) 对训练集X进行预处理,计算其核矩阵.

(2) 将核矩阵标准化后,进行特征提取,保留合适的主元.

(3) 根据式(18)在原始训练集中选择与主元的方差方向一致的样本,样本的个数与主元个数相同.

(4) 运用挑选的样本构建压缩集:

Y=[xa1xa2xal]TRl×ml<N

(5) 选择合适的核函数,设定合理的参数η.

(6) 计算压缩集的核矩阵,并对其进行标准化处理.

(7) 对标准化后的核矩阵进行特征提取,建立KPCA模型.

(8) 根据式(11)~(14)计算统计量Tl2及其控制限Ta,α2.

步骤2 对于一个新的测试样本xnew:

(1) 利用压缩集建模数据的均值和方差对测试样本xnew进行预处理.

(2) 计算该样本的核矩阵,并对其进行标准化处理.

(3) 根据式(11)~(13)计算新的监控统计量tnew2.

(4) 比较统计量tnew2是否超过压缩集的控制限Ta,α2.

步骤3 自适应更新条件:

(1) 如果统计指标tnew2大于当前压缩集的控制限,那么返回步骤2.

(2) 如果统计指标小于当前压缩集的控制限,根据式(22)~(25),计算判定系数值ξq,若ξq<η,则返回步骤2.

(3) 若ξqη 时,将xnew加入Y中,更新KPCA模型、控制限$T_{a, \alpha}^{2}$、系数ξq 和τ,然后返回步骤2,用更新后的模型对下一个样本继续检测,直到测试样本集检测完毕.基于ORKPCA方法的故障检测流程图如图1所示.

图1

图1   基于ORKPCA的故障检测流程图

Fig.1   Flow chart of fault detection based on ORKPCA


3 仿真研究

使用3个指标评估ORKPCA方法的故障检测性能:误报率(FAR)、故障检测率(FDR)和运行时间(ET),并和传统KPCA、压缩KPCA、递归KPCA[19]、MWKPCA[20]、VMWKPCA[22]方法进行故障检测比较,证明所提方法的有效性.

3.1 数值仿真

为了评估方法的性能,本示例中的数据从如下的非线性过程产生[28]:

y1y2y3=0.5t2-2t+0.5t2+t+sinπt2t2-t-2cosπt+ζζζ

式中:变量

ζ为服从正态分布N(0,0.01)的白噪声;数据源t为[0.01,2]之间的随机变量.根据上述的数值例子随机产生两组500个样本数据,一组用于建模,而另一组对变量y2从150个采样时刻时加入0.05(t-150)形式的斜坡干扰作为在线测试数据.

式(2)中的核函数选择为

k(xi,xj)=exp-xi-xj22δ2

本文采用经验法选取δ=5m[29].对于参数η,若选择过大,会导致添加到压缩集中的样本丢失,达不到自适应更新的目的,从而丢失大量的有用信息,造成检测结果异常;若选择过小,会导致过多相似的信息样本加入到压缩集中,极大地增加检测时间和运行内存,达不到优化检测时间的效果.因此,为了达到最佳检测效果,计算压缩样本取足够多状态下的ξq值,其中η在满足小于ξq的情况下,根据被监测系统运行的实际情况,通过不断调整以达到比较理想的效果.

KPCA、压缩KPCA、递归KPCA、MWKPCA、VMWKPCA 和ORKPCA采用T2统计量分别对该数值例子进行检测,检测效果图如图2所示.图中:T2为单样本统计量.在KPCA中,根据式(15)和(16)保留的主元为26个.在压缩KPCA中,根据建立KPCA模型中的26个主元结合式(17)建立信息矩阵,根据式(18)挑选满足条件的样本构成压缩集,并用该压缩集建立KPCA模型对在线数据进行检测.在递归KPCA中,根据奇异值分解更新核矩阵,从而进行在线检测.在MWKPCA与VMWKPCA中,初始窗宽为80.根据文献[20],MWKPCA的权重参数λ=0.25.在构建的压缩集的基础上,ORKPCA 根据在线样本的过程状态进行自适应更新KPCA模型,达到在线检测目的.由图2可以看出,KPCA与压缩KPCA的检测效果极为相似,说明在检测要求不高的情况下,压缩KPCA方法可以有效替代传统KPCA方法,且更具优越性;但是可以明显看出这两种方法对动态非线性过程的故障检测效果较差.递归KPCA、MWKPCA、VMWKPCA 和ORKPCA这4种动态方法均有较好的检测效果.

图2

图2   数值例子的在线故障检测效果对比

Fig.2   Comparisons of online fault detection of numerical example


为了进一步比较6种方法的故障检测性能,分别计算KPCA、压缩KPCA、递归KPCA、MWKPCA、VMWKPCA 和ORKPCA方法的FAR、FDR和ET指标,检测结果如表1所示.从表1中可以得到,对于非线性动态过程的故障检测,静态KPCA与压缩KPCA方法的检测结果相似,而静态KPCA方法却占用更多的检测时间,因此压缩KPCA方法相比传统KPCA方法有着较高的优越性.但是,与动态检测方法相比,两种静态方法的检测结果较差,说明静态检测方法在对动态过程进行故障检测时存在极大的局限性.对比4种动态方法的检测结果,可以看出不仅ORKPCA方法的检测结果最好,而且误报率比较低,占用的时间也较少,说明本文提出的方法具有一定的有效性.

表1   6种方法对数值例子的检测结果对比

Tab.1  Detection results of six methods of numerical examples

检测指标KPCA压缩KPCA递归KPCAMWKPCAVMWKPCAORKPCA
FAR/%9.2511.674.636.383.253.25
FDR/%76.5782.0591.0088.7195.00100.00
ET/s3.350.279.355.0412.132.97

新窗口打开| 下载CSV


3.2 TE 过程仿真研究

田纳西-伊斯曼(Tennessee-Eastman,TE)过程是由Eastman公司创建的一种复杂工业化学过程的基准仿真模型.TE过程考虑到工业原料反应的整个过程,包括在反应釜中反应物发生化学反应、在冷凝器中降温冷却、分离器分离反应物和汽提塔分离提纯并再反应等过程,其工艺流程[30]图3所示,具体反应过程如下:

A(g)+C(g)+D(g)→G(liq)
A(g)+C(g)+E(g)→H(liq)
A(g)+ E(g)→F(liq)
3D(g) →2F(liq)

式中:液体和气体分别由liq,g表示.TE数据来源http://depts.washington.edu/control/LARRY/TE/download.html.

图3

图3   TE过程流程图[30]

Fig.3   Flow chart of TE process[30]


TE过程的各种具体变量如表2所示.TE过程常被用来作为仿真的例子用在过程监控和故障诊断中[31-33].TE过程总共有21种不同类型的故障数据.本文选取TE过程中较为经典的故障2与故障20为例进行分析, 详细描述如表3所示.训练数据包含500个正常样本,而测试数据为960个样本,从第161个样本开始加入故障.

表2   TE 过程的测量变量和控制变量

Tab.2  Measured variables and manipulated variables in TE process

变量变量描述变量变量描述变量变量描述
1A进料19汽提器上部蒸汽流量37流11中D
2D进料20压缩机功率38流11中E
3E进料21反应器冷却水出口温度39流11中F
4总进料22分离器冷却水出口温度40流11中G
5再循环流量23流6中A41流11中H
6反应器进料速度24流6中B42D进料量
7反应器压力25流6中C43E进料量
8反应器等级26流6中D44A进料量
9反应器温度27流6中E45总进料量
10排放速度28流6中F46压缩机再循环阀
11产品分离器温度29流9中A47排放阀
12产品分离器液位30流9中B48分离器灌液流量
13产品分离器压力31流9中C49汽提器液体产品流量
14产品分离器塔底流量32流9中D50汽提器蒸汽阀
15汽提器等级33流9中E51反应器冷却水流量
16汽提器压力34流9中F52冷凝器冷却水流量
17汽提器塔底流量35流9中G53搅拌速度
18汽提器温度36流9中H

新窗口打开| 下载CSV


表3   TE过程故障描述

Tab.3  Fault descriptions of TE process

故障编号故障描述故障类型
2组分B含量发生变化, A/C进料流量比保持不变阶跃
20未知未知

新窗口打开| 下载CSV


KPCA、压缩KPCA、递归KPCA、MWKPCA、VMWKPCA 和ORKPCA方法采用T2统计量进行监控,对故障2与故障20的检测结果分别如图4图5所示.图4(a)、图5 (a) 为KPCA方法的故障检测效果图.在KPCA方法中建模样本提取的特征值为35个,因此,在所有的样本中挑选35个符合条件的样本构成压缩集,该压缩集的样本满足与原始建模KPCA的主元方差方向一致.运用该压缩集建立KPCA模型对在线数据进行检测,其检测效果如图4(b)、图5(b)所示.图4(c)、图5(c)为递归KPCA方法的故障检测效果图;图4(d)、图5(d)与图4(e)、图5(e)分别为MWKPCA和VMWKPCA方法的故障检测效果图,其中MWKPCA和VMWKPCA方法的初始窗宽均为85;图4(f)、图5(f)为在压缩集的基础上,ORKPCA方法根据在线样本的过程状态进行自适应更新KPCA模型,达到最优的在线检测效果图.

图4

图4   故障2的检测结果

Fig.4   Detection results of Fault 2


图45可以看出,对故障2与故障20进行检测时,静态方法中KPCA与压缩KPCA方法的检测效果区别并不是太大.压缩KPCA方法相比KPCA用了较少的建模样本,而检测效果的差别较小,说明压缩KPCA方法比KPCA更具优越性.动态方法中递归KPCA、MWKPCA、VMWKPCA 和ORKPCA的检测效果比静态方法均有明显的优势,具有较高的检测率和较低的误报率.说明对具有动态特性的工业过程,递归KPCA、MWKPCA、VMWKPCA 和ORKPCA方法均能够适应动态系统,有着优越的检测效果.

图5

图5   故障20的检测结果

Fig.5   Detection results of Fault 20


为了进一步比较6种方法的故障检测性能,分别计算各种方法的FAR、FDR和ET指标,检测结果如表4所示.从表4中可以看出,各种方法对故障2的检测效果差别不大,但是ORKPCA方法的检测率最高,误报率最低.对比各种方法的检测时间,压缩KPCA和ORKPCA方法的检测时间较短.因为两种方法都运用较少的样本建模,减少了运行内存,优化了计算时间.在对故障20进行检测时(见图5),KPCA与压缩KPCA方法的检测效果较差,而递归KPCA、MWKPCA、VMWKPCA 和ORKPCA方法的检测效果有较大程度的提高,其中ORKPCA方法的检测率最高.每次有一个新的正常样本可用时,递归KPCA方法的核矩阵都会增大,导致检测时间最长.MWKPCA方法通过添加一个新的样本和抛弃一个最老的样本保持核矩阵大小不变,检测时间明显比递归KPCA方法少.VMWKPCA方法为了保证滑动窗口最佳大小,改变在线窗宽大小,比MWKPCA方法提高了检测效果,比递归KPCA方法降低了运行时间.与3种动态故障检测方法相比,ORKPCA方法依据在线样本的相关性,保证压缩集线性无关.由于满足这样条件的在线样本比较少,导致压缩集变化不大,使得该方法不仅能够很好地更新核矩阵的特征值和特征向量适应动态系统,而且有着较高的检测率和较低的检测时间.综上所述,ORKPCA方法在对两种故障进行检测时,不仅检测效果最好,而且误报率比较低,运行时间也较短.因此,本文提出的方法在检测大规模的非线性动态工业过程中的故障时极具优越性.

表4   6种方法对TE过程的检测结果对比

Tab.4  Detection results of six methods of TE process

检测
指标
KPCA压缩KPCA递归KPCAMWKPCAVMWKPCAORKPCA
故障2故障20故障2故障20故障2故障20故障2故障20故障2故障20故障2故障20
FAR/%3.7508.250.630.632.501.254.381.883.7503.75
FDR/%98.3838.6395.8839.3898.7588.0097.6585.1398.7596.3898.7597.13
ET/s2.342.290.170.135.517.133.094.744.183.050.910.56

新窗口打开| 下载CSV


4 结语

针对化工过程复杂非线性的特点, 提出在线压缩KPCA的自适应方法用于过程监控,通过自适应更新模型来处理系统的动态行为.使用TE过程对KPCA、压缩KPCA、递归KPCA、MWKPCA和VMWKPCA方法进行仿真对比,评估本文提出方法的性能.故障检测的仿真结果表明,ORKPCA方法不仅极大地优化了运算时间,减小了运行内存,而且整体上提高了非线性动态系统故障监测的性能.

参考文献

CHO J H, LEE J M, CHOI S W, et al.

Fault identification for process monitoring using kernel principal component analysis

[J]. Chemical Engineering Science, 2005, 60(1): 279-288.

DOI:10.1016/j.ces.2004.08.007      URL     [本文引用: 1]

WANG G, YIN S.

Quality-related fault detection approach based on orthogonal signal correction and modified PLS

[J]. IEEE Transactions on Industrial Informatics, 2017, 11 (2): 398-405.

[本文引用: 1]

CHENG C Y, HSU C C, CHEN M C.

Adaptive kernel principal component analysis (KPCA) for monitoring small disturbances of nonlinear processes

[J]. Industrial & Engineering Chemistry Research, 2011, 49(5): 2254-2262.

DOI:10.1021/ie900521b      URL     [本文引用: 1]

AMAR M, GONDAL I, WILSON C.

Vibration spectrum imaging: A novel bearing fault classification approach

[J]. IEEE Transactions on Industrial Electronics, 2015, 62(1): 494-502.

DOI:10.1109/TIE.2014.2327555      URL     [本文引用: 1]

COSTA J A, HERO A O.

Geodesic entropic graphs for dimension and entropy estimation in manifold learning

[J]. IEEE Transactions on Signal Processing, 2004, 52(8): 2210-2221.

DOI:10.1109/TSP.2004.831130      URL     [本文引用: 1]

ZHU J L, GE Z Q, SONG Z H.

Distributed parallel PCA for modeling and monitoring of large-scale plant-wide processes with big data

[J]. IEEE Transactions on Industrial Informatics, 2017, 13(4): 1877-1885.

DOI:10.1109/TII.2017.2658732      URL     [本文引用: 1]

PENG K, ZHANG K, LI G.

Online contribution rate based fault diagnosis for nonlinear industrial processes

[J]. Acta Automatica Sinica, 2014, 40 (3): 423-430.

DOI:10.1016/S1874-1029(14)60005-7      URL     [本文引用: 1]

张成, 郭青秀, 李元, .

基于主元分析得分重构差分的故障检测策略

[J]. 控制理论与应用, 2019, 36(5): 774-782.

[本文引用: 1]

ZHANG Cheng, GUO Qingxiu, LI Yuan, et al.

Fault detection strategy based on difference of score reconstruction associated with principal component analysis

[J]. Control Theory & Applications, 2019, 36(5): 774-782.

[本文引用: 1]

KU W, STORER R H, GEORGAKIS C.

Disturbance detection and isolation by dynamic principal component analysis

[J]. Chemometrics and Intelligent Laboratory Systems, 1995, 30(1): 179-196.

DOI:10.1016/0169-7439(95)00076-3      URL     [本文引用: 1]

LI W, YUE H H, VALLE C S, et al.

Recursive PCA for adaptive process monitoring

[J]. Journal of Process Control, 2000, 10(5): 471-486.

DOI:10.1016/S0959-1524(00)00022-6      URL     [本文引用: 1]

XIAO W, HUANG X, HE F, et al.

Online robust principal component analysis with change point detection

[J]. IEEE Transactions on Multimedia, 2020, 22(1): 59-68.

DOI:10.1109/TMM.2019.2923097      URL     [本文引用: 1]

CHOI S W, LEE C, LEE J M, et al.

Fault detection and identification of nonlinear processes based on kernel PCA

[J]. Chemometrics & Intelligent Laboratory Systems, 2005, 75(1): 55-67.

[本文引用: 1]

刘春燕, 于春梅.

基于改进核主元分析的TE故障诊断

[J]. 计算机测量与控制, 2016, 24 (10): 36-41.

[本文引用: 1]

LIU Chunyan, YU Chunmei.

TE fault diagnosis based on improved kernel principal component analysis

[J]. Computer Measurement & Control, 2016, 24 (10): 36-41.

[本文引用: 1]

GUO J, QI L, LI Y.

Fault detection of batch process using dynamic multi-way orthogonal locality preserving projections

[J]. Journal of Computational Information Systems, 2015, 11(2): 577-586.

[本文引用: 1]

HE F, WANG C, FAN S K S.

Nonlinear fault detection of batch processes based on functional kernel locality preserving projections

[J]. Chemometrics and Intelligent Laboratory Systems, 2018, 183: 79-89.

DOI:10.1016/j.chemolab.2018.10.010      URL     [本文引用: 1]

CHANG P, WANG P, GAO X J.

Batch process monitoring for microbial fermentation based on multi-way kernel entropy component analysis

[J]. Journal of Chemical Engineering of Chinese Universities, 2015, 29(2): 395-399.

[本文引用: 1]

YANG Y H, LI X L, LIU X Z, et al.

Wavelet kernel entropy component analysis with application to industrial process monitoring

[J]. Neurocomputing, 2015, 147(5): 395-402.

DOI:10.1016/j.neucom.2014.06.045      URL     [本文引用: 1]

SANG W C, LEE I B.

Nonlinear dynamic process monitoring based on dynamic kernel PCA

[J]. Chemical Engineering Science, 2004, 59(24): 5897-5908.

DOI:10.1016/j.ces.2004.07.019      URL     [本文引用: 1]

谢磊, 王树青.

递归核PCA及其在非线性过程自适应监控中的应用

[J]. 化工学报, 2007, 58(7): 1776-1782.

[本文引用: 2]

XIE Lei, WANG Shuqing.

Recursive kernel PCA and its application in adaptive monitoring of nonlinear processes

[J]. CIESC Journal, 2007, 58(7): 1776-1782.

[本文引用: 2]

LIU X, KRUGER U, LITTLER T, et al.

Moving window kernel PCA for adaptive monitoring of nonlinear processes

[J]. Chemometrics & Intelligent Laboratory Systems, 2009, 96(2): 132-143.

[本文引用: 3]

CHOUAIB C, MOHAMED-FAOUZI H, MESSAOUD D.

New adaptive kernel principal component analysis for nonlinear dynamic process monitoring

[J]. Applied Mathematics & Information Sciences, 2015, 9(4): 1833-1845.

[本文引用: 1]

FAZAI R, TAOUALI O, HARKAT M F, et al.

A new fault detection method for nonlinear process monitoring

[J]. International Journal of Advanced Manufacturing Technology, 2016, 87(9/10/11/12): 3425-3436.

DOI:10.1007/s00170-016-8745-7      URL     [本文引用: 2]

YANG G, GU X.

Fault diagnosis of complex chemical processes based on enhanced naive bayesian method

[J]. IEEE Transactions on Instrumentation and Measurement, 2020, 69(7): 4649-4658.

DOI:10.1109/TIM.2019.2954151      URL     [本文引用: 1]

LEE J M, LEE I B, YOO C K.

Fault detection of batch processes using multiway kernel principal component analysis

[J]. Computers & Chemical Engineering, 2004, 28 (9): 1837-1840.

DOI:10.1016/j.compchemeng.2004.02.036      URL     [本文引用: 1]

JAFFEL I, TAOUALI O, HARKAT M F, et al.

Kernel principal component analysis with reduced complexity for nonlinear dynamic process monitoring

[J]. International Journal of Advanced Manufacturing Technology, 2017, 88(9/10/11/12): 3265-3279.

DOI:10.1007/s00170-016-8987-4      URL     [本文引用: 1]

HAMROUNI I, LAHDHIRI H, ABDELLAFOU K B, et al.

Fault detection of uncertain nonlinear process using reduced interval kernel principal component analysis (RIKPCA)

[J]. International Journal of Advanced Manufacturing Technology, 2020, 106(9/10): 4567-4576.

DOI:10.1007/s00170-019-04889-3      URL     [本文引用: 1]

HONEINE P.

Approximation errors of online sparsification criteria

[J]. IEEE Transactions on Signal Process, 2015, 63 (17): 4700-4709.

DOI:10.1109/TSP.2015.2442960      URL    

ISSAM B K, MOHAMED L, CLAUS W.

Variable window adaptive kernel principal component analysis for nonlinear nonstationary process monitoring

[J]. Computers & Industrial Engineering, 2011, 61(3): 437-446.

DOI:10.1016/j.cie.2011.02.014      URL     [本文引用: 1]

DOWNS J, VOGEL A.

A plant wide industrial process control problem

[J]. Computers & Chemical Engineering, 1993, 17(3): 245-255.

DOI:10.1016/0098-1354(93)80018-I      URL    

郭金玉, 王哲, 李元.

基于核熵独立成分分析的故障检测方法

[J]. 化工学报, 2022, 73(8): 3647-3658.

[本文引用: 3]

GUO Jinyu, WANG Zhe, LI Yuan.

Fault detection method based on kernel entropy independent component analysis

[J]. CIESC Journal, 2022, 73(8): 3647-3658.

[本文引用: 3]

ZHONG K, HAN M, QIU T, et al.

Fault diagnosis of complex processes using sparse kernel local fisher discriminant analysis

[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020, 31(5): 1581-1591.

DOI:10.1109/TNNLS.2019.2920903      PMID:31265419      [本文引用: 1]

As an outstanding discriminant analysis technique, Fisher discriminant analysis (FDA) gained extensive attention in supervised dimensionality reduction and fault diagnosis fields. However, it typically ignores the multimodality within the measured data, which may cause infeasibility in practice. In addition, it generally incorporates all process variables without emphasizing the key faulty ones when modeling the complex process, thus leading to degraded fault classification capability and poor model interpretability. To ease the above two drawbacks of conventional FDA, this brief presents an advantageously sparse local FDA (SLFDA) model, it first preserves the within-class multimodality by introducing local weighting factors into scatter matrix. Then, the responsible faulty variables are identified automatically through the elastic net algorithm, and the current optimization problem is subsequently settled through the feasible gradient direction method. Since then, the local data structure characteristics are exploited from both the sample dimension and variable dimension so that the fault diagnosis performance and model interpretability are significantly enhanced. In addition, we naturally extend SLFDA model to nonlinear variant (i.e., sparse kernel local FDA) by the kernel trick, which is substantially more resistant to strong nonlinearity. The simulation studies on Tennessee Eastman (TE) benchmark process and real-world diesel engine working process both validate that the novel diagnosis strategy is more accurate and reliable than the existing state-of-the-art methods.

DENG X, TIAN X, CHEN S, et al.

Nonlinear process fault diagnosis based on serial principal component analysis

[J]. IEEE Transactions on Neural Networks & Learning Systems, 2018, 29(3): 560-572.

[本文引用: 1]

林茂, 李颖晖, 朱喜华, .

基于改进核主元分析法的三电平逆变器故障检测

[J]. 电网技术, 2016, 40(3): 972-977.

[本文引用: 1]

LIN Mao, LI Yinghui, ZHU Xihua, et al.

Fault detection for three-level inverter based on improved kernel principal component analysis method

[J]. Power System Technology, 2016, 40(3): 972-977.

[本文引用: 1]

/