上海交通大学学报(自然版), 2021, 55(11): 1417-1428 doi: 10.16183/j.cnki.jsjtu.2020.290

基于GSFA-GNPE的动态-静态联合指标间歇过程监控

赵小强,a,b,c, 牟淼a

a.电气工程与信息工程学院, 兰州理工大学, 兰州 730050

b.甘肃省工业过程先进控制重点实验室, 兰州理工大学, 兰州 730050

c.电气与控制工程国家级实验教学示范中心, 兰州理工大学, 兰州 730050

Batch Process Monitoring with Dynamic-Static Joint Indicator Based on GSFA-GNPE

ZHAO Xiaoqiang,a,b,c, MOU Miaoa

a. College of Electrical and Information Engineering, Lanzhou University of Technology, Lanzhou 730050, China

b. Key Laboratory of Advanced Control for Industrial Processes of Gansu Province, Lanzhou University of Technology, Lanzhou 730050, China

c. National Demonstration Center for Experimental Electrical and Control Engineering Education, Lanzhou University of Technology, Lanzhou 730050, China

责任编辑: 石易文

收稿日期: 2020-09-14  

基金资助: 国家自然科学基金(61763029)
国防基础科研(JCKY2018427C002)
甘肃省高等学校产业支撑引导(2019C-05)
甘肃省工业过程先进控制重点实验室开放基金资助项目(2019KFJJ01)

Received: 2020-09-14  

作者简介 About authors

赵小强(1969-),男,陕西省宝鸡市人,教授,博士生导师,研究方向为过程监控和故障诊断、生产调度及数据挖掘.E-mail:xqzhao@lut.edu.cn.

摘要

传统的过程监控方法忽略了变量间的时序相关性,且没有区分变量间的动态关系与静态关系,从而导致监控效果不佳.针对此问题,本文提出一种基于全局慢特征分析(GSFA)-全局邻域保持嵌入(GNPE)的动态-静态联合指标间歇过程监控方法,该方法可以有效提取动态全局特征和静态全局特征.首先,对过程变量的动态特性和静态特性进行评估,把自相关和互相关性较弱的变量视为静态变量,剩余变量视为动态变量;其次,分别对动态子空间和静态子空间构建GSFA和GNPE模型;然后,对来自每个子空间的统计信息使用贝叶斯推理进行组合,以得出混合模型的联合指标实现过程监控;最后,将所提算法应用于数值算例和青霉素发酵仿真过程进行仿真验证.结果表明,GSFA-GNPE算法相较于其他算法的故障检测效果更好.

关键词: 间歇过程; 过程监控; 慢特征分析; 邻域保持嵌入; 全局-局部; 贝叶斯推断

Abstract

Traditional process monitoring methods ignore the time-series correlation between variables, and do not distinguish the dynamic relationship and static relationship between variables, resulting in poor monitoring effect. To solve these problems, a dynamic-static joint indicator monitoring method of batch process based on global slow feature analysis(GSFA)-global neighborhood preserving embedding (GNPE) is proposed in this paper, which can effectively extract dynamic global features and static global features. First, the dynamic and static characteristics of the process variables are evaluated. Variables with weak autocorrelation and cross-correlation are regarded as static variables, and the remaining variables are regarded as dynamic ones. Next, the GSFA and GNPE models are constructed for dynamic and static subspaces, respectively. Finally, the statistical information from each subspace is combined by using Bayesian inference to obtain the joint indicator of the mixed model to realize process monitoring. Finally, the proposed algorithm is applied to a numerical example and the penicillin fermentation simulation process for simulation verification. The results show that the proposed GSFA-GNPE algorithm has better fault detection effects than other algorithms.

Keywords: batch process; process monitoring; slow feature analysis; neighborhood preserving embedding; globality-locality; Bayesian inference

PDF (2334KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

赵小强, 牟淼. 基于GSFA-GNPE的动态-静态联合指标间歇过程监控[J]. 上海交通大学学报(自然版), 2021, 55(11): 1417-1428 doi:10.16183/j.cnki.jsjtu.2020.290

ZHAO Xiaoqiang, MOU Miao. Batch Process Monitoring with Dynamic-Static Joint Indicator Based on GSFA-GNPE[J]. Journal of shanghai Jiaotong University, 2021, 55(11): 1417-1428 doi:10.16183/j.cnki.jsjtu.2020.290

随着对生产过程安全性和产品质量要求的日益增长,过程监控受到越来越多的关注[1,2].近年来,多元统计过程监控(MSPM)方法被广泛应用于过程监控,其主要思想是将高维数据投影到低维空间,并保留原始数据的主要信息[3,4,5].

传统的MSPM方法, 如主成分分析(PCA)和邻域保持嵌入(NPE)等[6,7,8,9], 假定在不同时间的样本是独立的,即过程当前时刻的状态不受之前时刻的影响,然而在现代工业中这种假设是不成立的,因此传统的监控模型无法准确表达过程数据的动态特性.为解决这一问题,文献[10]利用包含当前和过去时刻采样值的增广矩阵进行建模,提出了动态主元分析(DPCA)方法.然而,DPCA方法本质是一种全局结构保持方法,忽略了局部信息的提取,为此,NPE等局部流形算法被用于过程监控.NPE通过保持数据的局部邻域结构来实现数据降维,其假设数据样本满足独立分布,主要关注数据的空间结构特征,能有效提取数据的静态信息,但NPE算法忽视了数据随时间变化的特征信息,可能会造成检测效果不佳.为了有效提取过程数据的动态信息和局部信息,文献[11]在邻域保持嵌入算法保持数据局部结构的基础上引入时序扩展,提出一种基于时序扩展的邻域保持嵌入(TNPE)算法用于动态过程建模,一定程度上提高了动态过程的故障检测效果.但是,上述方法假设生产过程的所有变量均具有动态特性,并没有综合考虑生产过程中的静态变量.同时,NPE作为流形算法,其降维时主要考虑数据的局部结构特征会造成全局信息的丢失.因此,有必要为NPE算法加入全局目标函数加以约束,使其能充分提取过程信息.

近年来,慢特征分析(SFA)被用于过程监控[12,13,14,15],SFA的主要思想是从时间序列中提取缓慢变化的特征[16],能够有效提取表征过程数据动态变化的慢特征.文献[17]将SFA方法扩展到质量相关的故障检测领域,提出了一种基于SFA的工业过程质量相关故障检测算法.文献[18]将核方法应用于慢特征分析,提出了一种核慢特征判别分析(KSFDA)和支持向量数据描述(SVDD)的故障检测方法,对于非线性过程具有较好的检测效果.然而在实际工业过程中,一些过程变量可能是动态的,而另外一些则是静态的.尽管基于SFA的故障检测算法在动态工程监控中取得了长足的进步,但SFA未能同时考虑过程的动态特性和静态特性.对于动态变量,动态特征能够通过变量的动态变化准确地进行提取;而对于静态变量,动态信息则是由随机噪声引起的,提取的动态特征是与噪声相关的特征,与过程数据无关.此外,随机噪声可能会随着基准数据集的不同而变化,因此不需要在静态变量中进行动态特征提取.同时,将SFA应用于间歇过程监控时,由于间歇过程在进行数据展开时会破坏其原始时间结构信息,需要根据最近邻准则构造伪时间序列以提供时间结构信息,这就使得SFA等价于一种局部近邻数据关系保持算法,而忽略了全局结构信息.因而,需要将全局结构分析融入SFA,使其能充分提取过程信息.

将所有过程变量都视为静态变量用静态方法,或都视为动态变量用动态方法进行监控,都会导致故障监控效果不佳,且单一考虑全局信息或局部信息都会造成过程信息丢失.鉴于SFA和NPE在处理动态数据和静态数据方面各自的优势,提出一种基于全局慢特征分析(GSFA)-全局邻域保持嵌入(GNPE)的动态-静态联合指标间歇过程监控方法.首先,计算每个变量的自相关系数和互相关系数,分别求得当前时间和过去时间的变量之间的相关性以及当前时间的变量和过去的另一个变量之间的相关性.在此基础上,将过程变量分为动态子空间和静态子空间.在动态子空间中建立GSFA模型,提取动态全局信息;在静态子空间中建立GNPE模型,提取静态全局信息.最后,将两个子空间得出的监视统计信息进行贝叶斯推断,得出联合指标以进行故障检测.本文方法通过将过程变量区分为动态变量和静态变量,在不同的变量空间中采用不同的方法进行建模,可以充分提取过程信息,有效提高对于间歇过程的监控效果.

1 基础算法

1.1 慢特征分析算法

给定一个在时间t∈ t0,t1上连续变化的m维输入x(t)= x1(t)x2(t)xm(t)T,SFA的目标函数是找到一个映射函数g(x),使得其输出信号si(t)=gi(x(t))(i=1,2,…,m)具有最慢的时间变化,其中g(x)= g1(x)g2(x)gm(x)Ts(t)= s1(t)s2(t)sm(t)T分别为映射函数和慢特征.

SFA算法的优化问题可用如下形式表示:

mingi(x)< s·i2>t
s.t. <si>t=0
< si2>t=1
ij:<sisj>t=0

i,j=1,2,…,m

式中: si2为由当前样本计算得到的第i个慢特征统计量; s·i为慢特征的1阶导数;<·>为时间平均,其定义表达式如下:

<f>t= 1t1-t0t0t1f(t)dt

SFA算法通过将正常数据中提取出的慢特征进行线性转化,该过程可表示如下:

si=gi(x)= wTix

i=1,2,…,m

式中:wi为负载向量.慢特征可表示为

s=Wx

式中:W= w1w2wmT为负载矩阵.

在进行SFA算法计算时,首先利用奇异值分解进行白化操作以消除变量之间的相关关系,令R=<x(t)x(t)T>tx(t)的协方差矩阵,R的奇异值分解可写为

R=UΛUT

式中:Λ为特征对角阵;U为特征矩阵.白化矩阵可以表示为Q=Λ-1/2UTx,则白化过程可用如下形式表示:

z=Λ-1/2UTx=Qx

由式(7)和(9)可得:

s=Wx=WQ-1z=Pz

式中:P=WQ-1.显然<zzT>t=Q<xxT>QT=I,I为单位矩阵且<z>t=0,又由于约束式(2)和(3)的存在,可以得到如下表达式:

<ssT>t=I

则式(11)可写为

<ssT>t=P<zzT>PT=PPT=I

由式(12)可知,矩阵P为正交矩阵,则SFA算法的目标是寻找正交矩阵P使得 <s·i2>t最小化, <s·i2>t可写为

< s·i2>t= pTi< z·z·T>tpi

i=1,2,…,m

式中:pi为特征向量.在实际过程中,样本数据是在离散的时间状态下采集到的,基于时间的导数可以由差分近似计算如下:

z·i(t)≈ zi(t)-zi(t-Δt)Δt

i=1,2,…,m

式中:Δt为时间间隔.通过使用协方差矩阵的奇异值分解来解决优化问题,在这种情况下,奇异值分解可以表示为

< z·z·T>t=PTΩP

式中:Ω=diag λ1λ2λm为特征值矩阵,且λi升序排列.可以推断出< s·i2>= pTi< z·z·T>tpi=λi,SFA算法的优化问题是通过选择< s·12>t作为最小值,< s·22>t作为第二最小值来实现的,以此类推.

SFA负载矩阵的计算可由下式表示:

W=PQ=-1/2UT

1.2 邻域保持嵌入算法

对于原始数据矩阵X∈Rn×m,n为样本个数,NPE通过计算投影矩阵AX投影到低维空间 Y∈Rn×d,其中,d<m,即Y=ATX.NPE先用k近邻(KNN)准则为每个数据点寻找其k近邻并为其赋权值,定义重构误差为

φ(M)= i=1nxi- jMijxij2

s.t. jMij=1

j=1,2,…,k

式中:xi为原始样本点;Mij为样本点xi与其近邻xj间的权值;M为权值矩阵;k为近邻个数.

NPE算法的思想是若在高维空间中Mij可以重构样本xi,则在低维空间中可通过相同的权值来重构对应低维空间样本点yi,特征映射可通过最小化目标函数求解:

ΦNPE= iyi-jMijyij2

s.t. yTy= aNTXXTaN=I

i=1,2,…,n;j=1,2,…,k

式中:yi为原始样本投影到低维空间的样本点,aN为NPE的投影矩阵A的列向量.aN可以通过求解下式的广义特征值获得:

XZXTaN=λXXTaN

式中:Z=(I-M)T(I-M).求解获得最小的d个特征值(λ1λ2≤…≤λd)所对应的特征向量[aN1aN2aNd]T组成的投影矩阵A.

2 基于GSFA-GNPE动态与静态变量的间歇过程故障检测

2.1 动态变量与静态变量的区分

动态变量是指随时间快速变化的变量,静态变量是指在一段时间内相对恒定的变量.对于原始数据矩阵X= x1x2xn∈Rn×m,变量xixj的互相关系数可以表示为

ρijγ= 1n-γt=1n-γ[xi(t)-μi][xj(t+γ)-μj]σi2σj2

i,j=1,2,…,m

式中:μi和μjxixj的平均值; σi2σj2xixj的方差;γ为变量间的时间延迟.显然, ρij-γ= ρjiγ[19].互相关系数 ρijγ反映了变量ij的相对方向,一个正的系数表示两个变量以相同的方式发生变化,负相关则表示两个变量以相反的方式发生变化.互相关系数 ρijγ的绝对值反映了变量之间相关性的强弱,绝对值越大,变量间的相关性越强.具有时间延迟γxi顺序相关矩阵 Riγ可以表示为

Riγ= ρi1-γρij-γρim-γρi1-γ+1ρij-λ+1ρim-γ+1ρ-i11ρ-ij1ρ-im1ρi11ρij1ρim1ρi1γρijγρimγ

顺序相关矩阵表示变量和所有变量在不同时滞之间的顺序相关,如果一个变量是静态的,顺序相关矩阵中的所有元素接近于0, Riγ中的最大绝对值表示为 ρimax,选择一个小的阈值η判断一个变量是否是静态变量,如果 ρimax小于η,则变量i是静态变量,否则变量i是动态变量.

2.2 基于GSFA-GNPE动态与静态变量的间歇过程故障检测

2.2.1 全局慢特征分析算法 间歇过程三维数据展开示意图如图1所示,其中:Xi为某一批次的数据矩阵;N为批次数;J为变量数;K为采样时刻数.展开后的数据矩阵X(N×J×K)由一系列的时间切片矩阵Xk(N×J)(k=1,2,…,K)组成,这种展开方式破坏了矩阵X(NK×J)中蕴含的时间序列信息.在GSFA建模时,利用数据近邻点的结构信息构造伪时间序列提供时间序列结构信息.对于样本点xk,i的伪时间序列可表示为

tk,i= xk,ixk,i1xk,ixk,i2xk,ixk,ilT

式中:xk,i为时间切片矩阵Xk(N×J)中的第i个样本; xk,ic(k=1,2,…,K,c=1,2,…,l)为在对应的时间切片矩阵Xk(N×J)中xk,ic个近邻.

图1

图1   间歇过程三维数据展开示意图

Fig.1   Schematic diagram of 3D data expansion in batch process


更进一步地,可以用如下形式表示时间切片矩阵Xk(N×J)的伪时间序列矩阵:

Tk(2Nl×J)= tk,1tk,2tk,NT

在此基础上,X(NK×J)就被扩展成一个如下式所示的伪时间序列矩阵:

T(2NKl×J)= T1TT2TTKT

对于1≤j≤NKl,用τ2j-1τ2j表示伪时间序列T中的第2j-1和第2j个样本点,因此,在样本点τ2j-1τ2j之间可以认为存在时间变化.伪时间序列T的时间变化矩阵ΔT可以表示为

ΔT=Δτ1Δτ2ΔτNKlΔτj=τ2j-τ2j-1

SFA的目标函数可用如下形式表示:

ΦSFA=min 1NKl-1wTj× j=1NKl(τ2j-τ2j-1)×(τ2j-τ2j-1)Twj=min 1NKl-1wTjΔTΔTTwj

s.t. 1NK-1wTjj=1NKxjxTjwj=1

式(26)是最小化输出信号的时间变化,由KNN准则构造伪时间序列T(2NKl×J),当在间歇过程处理数据时,SFA 被认为是局部处理方法,因为其仅保留了本地邻域关系而忽略的数据全局结构.为此,提出一种全局慢特征分析算法,在保留邻域信息的基础上分析数据的全局结构.

数据矩阵X全局结构分析的目标是找到一个投影向量ωj最大化投影样本中的所有样本点yj= ωjTxj与其均值之间欧氏距离平方的均值.全局结构目标函数可以表示如下:

ΦG=max1NKj=1NK[yj- y-]2=max 1NKj=1NK[ωTjxj- ωTjx-]2=max 1NKj=1NKωTj[xj- x-][xj- x-]Tωj

式中: y-为低维空间中的样本均值; x-= 1NKj=1NKxj为原始数据矩阵中的样本均值.考虑到投影向量ωj能够写成训练样本的线性组合ωj=XTwj,且标准化后 x-=0,则全局目标函数可以写为

ΦG=max1NKj=1NKwTjxjxTjwj=  maxwTjCwjC=1NKj=1NKxjxTj.

为了保持局部邻域信息和全局结构,GSFA目标函数可以表示为

ΦGSFA=βΦSFA-(1-β)ΦG=min βwTjΔTΔTTwj-max(1-β) wTjCwj=min wTj[βL-(1-β)C]wj

j=1,2,…,J

式中:0≤β≤1为松弛因子,用于平衡全局函数和局部函数的比重;LTΔTT.考虑到正交约束在建立统计量中的优越性,施加以下正交约束:

wTjwj=1

等式中两个目标函数的尺度不同,需要进行标准化,标准化后的目标函数为

min wTj[β~L~-(1- β~) C~]wj

s.t. wTjwj=1

式中: L~=L/ξ(L), C~=C/ξ(C)分别为标准化后的LC;ξ(·)为矩阵的谱半径; β~为标准化后的松弛因子.

求解式(30)的最优化问题等价于求解下式的特征值问题:

[β~L~-(1- β~) C~]wj= λ~sjwj

式中: λ~sj为标准化后第j个慢特征的缓慢变化程度.求解式(31)可得到一系列特征值 λ~s1λ~s2≤…≤ λ~sJ及其对应的负载特征向量 W= w 1w 2w J,保留前p个广义特征值以构造GSFA负载矩阵 Wp= w 1w 2w p.

根据GSFA模型提取前p个慢特征信息后构建S2和平方预测误差(SPE)统计量进行监控,定义如下:

S2= sTpsp
SPE=(x- x^)T(x- x^)

式中: x^=-1/2PTPWPx;PpWP分别为包含p个慢特征的正交矩阵和负载矩阵.控制限通过核密度估计(KDE)确定[20].

本文采用的核密度函数表达式如下所示:

ϕ(u)= 1j=1NKΓ u-ujθ

式中:u为采样数据;uj为数据集中的观测值;θ为核宽度参数; Γ为核函数;选择高斯核函数Γ(j)= 12πexp-u22.设置信度α=0.95,S2SPE的控制限 Sα2SPEα计算如下:

-SPEαf(SPE)d(SPE)= -SPEα1n1θ2π× j=1NKexp-(SPE-SPEj)22θ2d(SPE)=α
-Sα2f(S2)d(S2)= -Sα21n1θ2π× j=1NKexp-(S2-Sj2)22θ2d(S2)=α

式中:SPEj、Sj为第j个SPE和S2统计量.

2.2.2 GNPE算法 NPE算法在降维过程中只考虑了数据的局部结构,忽略了数据的全局结构信息.为了同时考虑全局和邻域结构,在静态子空间中建立GNPE模型,充分表征故障信息,其中全局结构通过寻找方差最大来保持,其目标函数如下所示:

ΦG=maxjNKyj- y-2=max j=1NKaGT(xj- x-)(xj- x-)TaG=max aGTGaG

j=1,2,…,NK

式中:aG为全局目标函数的投影向量; x-= j=1NKxj/(NK);G=(X- X-)(X- X-)T.

GNPE算法的目标函数为

ΦGNPE=maxΦGΦNPE= maxjNKyj-y-2j=1NKyj-i=1kMijyi2

引入 yTj= aTjxj,式(38)可以转换为

ΦGNPE=maxaGTGaGaNTRaN

进一步转换为特征值分解问题:

Gdi=λiRdi

由最大的g个特征值(λ1λ2≤…≤λg)对应的特征向量[d1d2dg]构成投影矩阵D.

GNPE算法将静态空间分为特征空间和残差空间,构造T2和SPE统计量对过程进行监控,其表达式如下所示:

T2=ynewΛ¯L-1ynew
SPE=‖xnew-Dynew
ynew=DTXnew

式中:ΛL为低维数据矩阵X的协方差矩阵, Λ¯L-1= 1NK-1j=1NKyjyTj;xnew为测试数据.统计量的控制限根据核密度估计求得.

2.2.3 联合指标建立 通过计算相关矩阵,将过程变量分为ΩDΩS两个子空间,在动态子空间ΩD进行GSFA建模,计算S2和SPE统计量,在静态子空间ΩS进行GNPE建模,计算T2和SPE统计量.为了实现对静态子空间和动态子空间的联合监控,通过贝叶斯推断建立一个联合指标,以实现对整个间歇过程的监控.在动态子空间ΩD中,S2的故障条件概率定义为

PS2(F|ΩD)= PS2(ΩD|F)PS2FPS2(ΩD|N)PS2N+PS2(ΩD|F)PS2F
PS2(ΩD|N)=exp-SΩD2Slim2
PS2(XΩD|F)=exp-Slim2SΩD2

式中:N和F分别为正常条件和故障条件; PS2(ΩD|N)PS2(XΩD|F)为条件概率; PS2N为正常样本的先验概率, PS2N=α, PS2F=1-α; Slim2为S2的控制限; SΩD2为动态子空间的S2统计量.

同理,可计算求得 PSPE(F|ΩD)PSPE(F|ΩS)PT2(F|ΩS),其中: PSPE(F|ΩS)为动态子空间中SPE的故障概率; PSPE(F|ΩS)为静态子空间中SPE的故障概率; PT2(F|ΩS)为静态子空间中T2的故障概率.动态子空间中S2统计量和静态子空间中T2统计量可建立BIC-C2指标,动态子空间和静态子空间中的SPE统计量可建立BIC-SPE指标,则有:

BIC-C2= PS2(F|ΩD)2+PT2(F|ΩS)2PS2(F|ΩD)+PT2(F|ΩS)
BIC-SPE= PSPE(F|ΩD)2+PSPE(F|ΩS)2PSPE(F|ΩD)+PSPE(F|ΩS)

联合指标BIC由如下表达式建立:

BIC= PSPE(F|ΩD)2+PSPE(F|ΩS)2+PS2(F|ΩD)2+PT2(F|ΩS)2PSPE(F|ΩD)+PSPE(F|ΩS)+PS2(F|ΩD)+PT2(F|ΩS)

联合指标BIC-C2、BIC-SPE和BIC的控制限为1-α.

3 基于GSFA-GNPE的动态-静态联合指标间歇过程监控步骤

基于GSFA-GNPE的动态-静态联合指标间歇过程监控方法包括离线建模和在线监测两个阶段,如图2所示.

图2

图2   基于GSFA-GNPE的动态-静态联合指标间歇过程监控

Fig.2   Batch process monitoring of dynamic-static joint indicator based on GSFA-GNPE


(1) 离线建模步骤如下.

步骤1 将采集到的正常工况的三维数据矩阵X(N×K×J)展开为X(N×KJ),进行标准化处理后排列成X(NK×J);

步骤2 利用式(21)对每个变量计算顺序相关矩阵 Riγ;

步骤3 判断 Riγρimax是否大于阈值η,若大于η则划分为动态变量,若小于η则划分为静态变量;

步骤4 在划分完成的动态子空间中进行GSFA建模,在静态子空间中进行GNPE建模;

步骤5 计算动态子空间中的控制限 Slim2和SPElim,计算静态子空间中的控制限 Tlim2和SPElim.

(2) 在线监测步骤如下.

步骤1 对测试样本Xtest进行标准化处理;

步骤2 根据离线建模步骤3的结果将过程变量分为动态变量ΩDnew和静态变量ΩSnew;

步骤3 计算动态子空间中的统计量 Snew2和SPEnew,计算静态子空间中的统计量 Tnew2和SPEnew;

步骤4 计算联合指标BIC- Cnew2,BIC-SPEnew和BICnew,当联合指标超过其控制限BIClim时,表明过程发生故障,否则正常.

4 仿真实验

4.1 数值例子仿真

采用如下数值例子验证所提算法[21]:

z(i)=  0.118-0.191 0.27 0.847 0.264 0.943-0.333 0.514-0.217z(i-1)+ 123-4-21u(i-1)
y(i)=z(i)+v(i)
u(i)= 0.811-0.2260.4770.415u(i-1)+ 0.1930.689-0.320-0.749h(i-1)
k= 0.2330.3660.5880.105-0.4230.601-0.3070.2090.352n(i)+v(i)

式中:h为在 -2,2上均匀分布的输入向量;输入n= n1n2n3为一个随机向量,n1n2均匀分布在 -1,2上,n3均匀分布[0,3]上;v为均值为0、方差为0.1的噪声.输出yku是可测量的,使用8个变量(y1,y2,y3,u1,u2,k1,k2,k3)的400个样本进行模型训练.显然,前5个变量是动态的,而后3个变量是静态的,所监测的故障从第200个采样点引入至第400个采样点结束,故障描述如下:

故障1h2处引入值为2的阶跃故障;

故障2n1处引入值为3的阶跃故障.

对采集到的400个样本首先对每个变量计算顺序相关矩阵,选择时间延时γ为2[10].根据统计学理论[22],一旦两个变量的相关系数绝对值小于0.3,则两个变量不再相关,故本文选择阈值η为0.3.每个顺序相关矩阵中的最大值如表1所示,其中加粗的数据为大于0.3的数值.由表1可以看出,前5个变量顺序相关矩阵中的最大值均大于0.3,被划分为动态变量,其余变量被划分为静态变量,这与所提数值例子变量关系相符.将GSFA-GNPE算法与SFA算法和NPE算法用于数值例子故障检测,置信度 α=0.98.3种算法对故障1和故障2的检测率和误报率如表2所示.由表2可知,GSFA-GNPE算法的检测效果优于SFA算法和NPE算法.

表1   相关系数矩阵的最大值

Tab.1  Max values in cross-correlation matrix

变量ρimax变量ρimax
y10.798u20.798
y20.803k10.053
y30.600k20.093
u10.827k30.100

新窗口打开| 下载CSV


表2   3种算法对故障1和故障2的检测率和误报率

Tab.2  Detection rates and false alarm rates of three algorithms for Fault 1 and Fault 2

故障序号NPESFAGSFA-GNPE
T2SPES2SPEBIC-C2BIC-SPEBIC
10.905/0.1900.850/0.1100.795/0.1850.794/0.1600.985/0.0650.920/0.1050.995/0.095
20.75/0.160.925/0.0850.630/0.1450.63/0.120.835/0.1450.895/0.0600.945/0.065

新窗口打开| 下载CSV


3种算法对故障1的监控图如图3所示,其中:δ为采样时刻.NPE算法对故障1的T2和SPE监控图如图3(a)所示.从图3(a)中可以看出,NPE算法在采样时刻0~200之间存在大量报警,而0~200时刻为正常时刻,故NPE算法在该阶段存在大量误报警,误报率达19%,且在故障发生时刻200~400之间,有许多采样点统计量在控制限以下,没有及时全面的发出警报.图3(b)为SFA算法对故障1的S2和SPE监控图.从图3(b)中可以看出,在0~200采样点间,SFA算法存在较多的误报,有大量点超过了控制限,且在200~400采样点间有许多漏报.图3(c)为GSFA-GNPE算法的BIC-C2,BIC-SPE和BIC联合指标监控图.从图3(c)中可以看出, BIC-C2 和 BIC-SPE在 0~200 之间只存在少量误报,且在200~400采样点间其检测率均高于SFA算法和NPE算法,BIC联合指标的检测效果最好,不仅其误报率极低,且检测率也达到了99%.综合对比3种算法对于数值例子故障的检测效果,本文所提的GSFA-GNPE算法误报率极小且检测率最大,监控效果最优.

图3

图3   3种算法对故障1的监控图

Fig.3   Monitoring chart of Fault 1 by three algorithms


4.2 青霉素发酵过程

本文进一步采用美国伊利诺伊州立理工学院开发的Pensim2.0青霉素发酵过程标准仿真平台得到的过程数据进行仿真验证[23],该平台可以通过设定不同但都在正常范围内的初始条件,模拟青霉素发酵过程中各变量每个时刻的数据用于分析研究,设定时间为400 h,采样时间为1 h,生产30个批次生长工况数据,并从18个变量中选择10个变量作为监控变量得到数据矩阵X(30×10×400)作为训练样本,如表3所示.故障种类和故障参数设置如表4所示.本文给出5种算法在故障2下的监控图,理想的监控图为在正常阶段(0~200采样点)所有统计量均在控制限以下,在故障阶段(200~400采样点)所有统计量均在控制限以上.

表3   过程变量

Tab.3  Monitoring variables

序号过程变量序号过程变量
1通风速率6溶解氧浓度
2搅拌功率7反应器体积
3基质馈送率8二氧化碳浓度
4补料温度9pH值
5基质浓度10发酵罐温度

新窗口打开| 下载CSV


表4   故障类型

Tab.4  Fault types

故障序号变量序号故障类型幅值/%引入时间/h
11阶跃5200~400
22斜坡10200~400
32阶跃5200~400
41斜坡10200~400

新窗口打开| 下载CSV


在进行GSFA-GNPE建模时,松弛因子β用来平衡数据的局部邻域信息和全局结构信息,作为一个多目标优化问题,β很难找到一个绝对的最优解.因此为了平衡局部信息和全局信息,本文选取β=0.5,相关性阈值η=0.3,时间延迟γ根据文献[24]中的自相关函数法选取γ=17,邻域数k根据经验取k=6,核窗宽控制核函数的径向作用范围,本文通过交叉验证法设置θ=2000.降维维数的确定在过程监控邻域目前尚没有主流的通用方法,本文需将所提算法与DPCA进行比较,因此本文选择与DPCA相同的降维维数,在建立DPCA模型时使用主元贡献度准则确定降维维数,GSFA建模时保留的慢特征数p=6,T2和SPE统计量的统计置信度和贝叶斯推断的置信度均为99%.

根据式(21)计算出顺序相关矩阵,将青霉素发酵过程的10个变量进行动态变量和静态变量的划分,其中变量序号为1、2、4、6、7、8的变量被划分为动态变量,序号为3、5、9、10的变量被划分为静态变量.5种算法对4个故障批次的故障检测率如表5所示.

表5   青霉素发酵过程中4个故障批次故障检测率

Tab.5  Fault detection rates of four failed batches during penicillin fermentation

故障
序号
NPESFATNPEDPCAGSFA-GNPE
T2SPES2SPET2SPET2SPEBIC-C2BIC-SPEBIC
11/0.0851/0.0051/0.051/0.0051/0.060.995/0.0050.99/0.081/0.051/0.041/0.041/0.005
20.945/0.10.95/00.875/0.020.98/00.97/0.150.965/0.1250.915/0.250.95/0.1350.925/0.031/00.995/0.03
30.99/0.081/0.010.98/0.011/0.0051/0.0651/0.020.99/0.0051/0.031/0.011/01/0.01
40.44/0.1050.94/00.925/0.0650.475/00.65/0.220.94/00.93/0.070.915/0.050.815/0.040.91/00.975/0.04

新窗口打开| 下载CSV


NPE、SFA、TNPE、DPCA和GSFA-GNPE算法在故障2下的监控图如图4所示,故障2为搅拌功率从第200个采样点开始到第400个采样点结束的斜坡故障.由图4(a)可以看出,NPE算法的T2和SPE分别在第210和211个采样点检测出故障,且T2在0~50采样点间存在误报,因此NPE算法对于故障2存在较大的误报及故障检测延时.图4(b)为SFA算法的S2和SPE监控图.从图4(b)中可以看出,S2在第220个采样点才检测出故障发生,且在50~100采样点之间存在较多的误报,SPE在第204个采样点较早检测出故障,且在0~200采样点之间无误报发生.图4(c)为TNPE算法的T2和SPE监控图.从图4(c)中可以看出,TNPE算法的检测延时相较于NPE算法有所降低,原因是TNPE考虑了过程数据的时序特征,但在0~50采样点之间仍存在较多误报.图4(d)为DPCA算法的T2和SPE监控图.从图4(d)中可以看出,DPCA算法检测延时较高且误报也较多,检测效果不佳.图4(e)为GSFA-GNPE算法的BIC-C2,BIC-SPE和BIC联合指标监控图.从图4(e)中可以看出,BIC-C2在第214个采样点检测出故障,且在0~50采样点间有少量故障,而BIC-SPE统计量在故障一发生就立即检测到了故障,且全程无误报漏报,联合指标BIC也在第201个采样点处立即检测出了故障发生,基本不存在检测延迟.通过综合分析5种算法在故障2下的检测率和误报率,GSFA-GNPE算法有着更好的检测效果,原因是GSFA-GNPE算法分别考虑了过程数据的动态特性和静态特性,且针对两种特性分别采取了不同的方法进行监控, 在提取数据局部信息的基础上分析了其全局结构,能够更加全面地捕捉数据特征,因此能够及时有效地反映过程故障.5种算法对4种故障的平均故障检测率F图5所示.由图5可知,GSFA-GNPE算法的3种指标均有良好的检测效果,进一步说明了本文所提算法的有效性.

图4

图4   5种算法对故障2的监控图

Fig.4   Monitoring chart of Fault 2 by five algorithms


图5

图5   青霉素发酵过程中4个故障批次的平均故障检测率对比

Fig.5   Comparison of average fault detection rates of four failed batches during penicillin fermentation


5 结语

本文提出一种基于GSFA-GNPE算法的动态-静态联合指标间歇过程监控方法.通过计算顺序相关矩阵,将过程变量划分为动态子空间和静态子空间,并在其中使用对应的算法进行统计分析.在动态子空间中,使用GSFA方法充分提取过程的动态特征,并且通过全局结构分析提取其全局信息特征;在静态子空间中,GNPE方法通过方差最大保持数据的全局结构,同时发挥NPE的局部结构保持能力,能有效提取过程数据的静态信息.然后,使用贝叶斯推断建立联合指标监控整个间歇过程.最后,将本文所提算法应用到数值实例和青霉素发酵仿真过程,研究结果显示所提出的GSFA-GNPE算法具有良好的监控效果.

参考文献

WANG R, EDGAR T F, BALDEA M, et al.

A geometric method for batch data visualization, process monitoring and fault detection

[J]. Journal of Process Control, 2018, 67:197-205.

DOI:10.1016/j.jprocont.2017.05.011      URL     [本文引用: 1]

赵春晖, 余万科, 高福荣.

非平稳间歇过程数据解析与状态监控——回顾与展望

[J]. 自动化学报, 2020, 46(10):2072-2091.

[本文引用: 1]

ZHAO Chunhui, YU Wanke, GAO Furong.

Data analytics and condition monitoring methods for nonstationary batch processes—Current status and future

[J]. Acta Automatica Sinica, 2020, 46(10):2072-2091.

[本文引用: 1]

纪洪泉, 何潇, 周东华.

基于多元统计分析的故障检测方法

[J]. 上海交通大学学报, 2015, 49(6):842-848.

[本文引用: 1]

JI Hongquan, HE Xiao, ZHOU Donghua.

Fault detection techniques based on multivariate statistical analysis

[J]. Journal of Shanghai Jiao Tong University, 2015, 49(6):842-848.

[本文引用: 1]

李晗, 萧德云.

基于数据驱动的故障诊断方法综述

[J]. 控制与决策, 2011, 26(1):1-9.

[本文引用: 1]

LI Han, XIAO Deyun.

Survey on data driven fault diagnosis methods

[J]. Control and Decision, 2011, 26(1):1-9.

[本文引用: 1]

姚旭, 王晓丹, 张玉玺, .

特征选择方法综述

[J]. 控制与决策, 2012, 27(2):161-166.

[本文引用: 1]

YAO Xu, WANG Xiaodan, ZHANG Yuxi, et al.

Summary of feature selection algorithms

[J]. Control and Decision, 2012, 27(2):161-166.

[本文引用: 1]

童楚东, 蓝艇, 史旭华.

基于互信息的分散式动态PCA故障检测方法

[J]. 化工学报, 2016, 67(10):4317-4323.

[本文引用: 1]

TONG Chudong, LAN Ting, SHI Xuhua.

Fault detection by decentralized dynamic PCA algorithm on mutual information

[J]. CIESC Journal, 2016, 67(10):4317-4323.

[本文引用: 1]

HE X F, CAI D, YAN S C, et al.

Neighborhood preserving embedding

[C]// Tenth IEEE International Conference on Computer Vision (ICCV’05) . Beijing: IEEE, 2005: 1208-1213.

[本文引用: 1]

陈法法, 杨晓青, 陈保家, .

基于正交邻域保持嵌入与多核相关向量机的滚动轴承早期故障诊断

[J]. 计算机集成制造系统, 2018, 24(8):1946-1954.

[本文引用: 1]

CHEN Fafa, YANG Xiaoqing, CHEN Baojia, et al.

Early fault diagnosis of rolling bearing based on orthogonal neighbourhood preserving embedding and multi-kernel relevance vector machine

[J]. Computer Integrated Manufacturing Systems, 2018, 24(8):1946-1954.

[本文引用: 1]

TONG C D, LAN T, SHI X H.

Fault detection and diagnosis of dynamic processes using weighted dynamic decentralized PCA approach

[J]. Chemometrics and Intelligent Laboratory Systems, 2017, 161:34-42.

DOI:10.1016/j.chemolab.2016.11.015      URL     [本文引用: 1]

KU W F, STORER R H, GEORGAKIS C.

Disturbance detection and isolation by dynamic principal component analysis

[J]. Chemometrics and Intelligent Laboratory Systems, 1995, 30(1):179-196.

DOI:10.1016/0169-7439(95)00076-3      URL     [本文引用: 2]

苗爱敏, 葛志强, 宋执环, .

基于时序扩展的邻域保持嵌入算法及其在故障检测中的应用

[J]. 华东理工大学学报(自然科学版) , 2014, 40(2):218-224.

[本文引用: 1]

MIAO Aimin, GE Zhiqiang, SONG Zhihuan, et al.

Neighborhood preserving embedding based on temporal extension and its application in fault detection

[J]. Journal of East China University of Science and Technology (Natural Science Edition) , 2014, 40(2):218-224.

[本文引用: 1]

ZHANG H Y, TIAN X M, DENG X G.

Batch process monitoring based on multiway global preserving kernel slow feature analysis

[J]. IEEE Access, 2017, 5:2696-2710.

DOI:10.1109/ACCESS.2017.2672780      URL     [本文引用: 1]

HONG H F, JIANG C, PENG X, et al.

Concurrent monitoring strategy for static and dynamic deviations based on selective ensemble learning using slow feature analysis

[J]. Industrial & Engineering Chemistry Research, 2020, 59(10):4620-4635.

DOI:10.1021/acs.iecr.9b05547      URL     [本文引用: 1]

YAN S F, JIANG Q C, ZHENG H Y, et al.

Quality-relevant dynamic process monitoring based on dynamic total slow feature regression model

[J]. Measurement Science and Technology, 2020, 31(7):075102.

DOI:10.1088/1361-6501/ab7bbd      URL     [本文引用: 1]

CHAI Z, ZHAO C H.

Enhanced random forest with concurrent analysis of static and dynamic nodes for industrial fault classification

[J]. IEEE Transactions on Industrial Informatics, 2020, 16(1):54-66.

DOI:10.1109/TII.9424      URL     [本文引用: 1]

WISKOTT L, SEJNOWSKI T J.

Slow feature analysis: Unsupervised learning of invariances

[J]. Neural Computation, 2002, 14(4):715-770.

DOI:10.1162/089976602317318938      URL     [本文引用: 1]

索寒生, 蒋白桦, 宫向阳, .

基于SFA的工业过程质量相关的在线故障检测

[J]. 控制工程, 2019, 26(6):1222-1227.

[本文引用: 1]

SUO Hansheng, JIANG Baihua, GONG Xiangyang, et al.

Online quality-related fault detection of industrial processes based on SFA

[J]. Control Engineering of China, 2019, 26(6):1222-1227.

[本文引用: 1]

张汉元, 田学民.

基于KSFDA-SVDD的非线性过程故障检测方法

[J]. 化工学报, 2016, 67(3):827-832.

[本文引用: 1]

ZHANG Hanyuan, TIAN Xuemin.

Nonlinear process fault detection based on KSFDA and SVDD

[J]. CIESC Journal, 2016, 67(3):827-832.

[本文引用: 1]

SHARDT Y A W.

Statistics for chemical and process engineers

[M]. Berlin, Germany: Springer, 2015.

[本文引用: 1]

顾幸生, 周冰倩.

基于LNS-DEWKECA算法的多模态工业过程故障检测

[J]. 控制与决策, 2020, 35(8):1879-1886.

[本文引用: 1]

GU Xingsheng, ZHOU Bingqian.

Multimodal industrial process fault detection based on LNS-DEWKECA

[J]. Control and Decision, 2020, 35(8):1879-1886.

[本文引用: 1]

LEE J M, YOO C, LEE I B.

Statistical process monitoring with independent component analysis

[J]. Journal of Process Control, 2004, 14(5):467-485.

DOI:10.1016/j.jprocont.2003.09.004      URL     [本文引用: 1]

ROBINSON J A.

Probability and statistics for engineers and scientists

[J]. Technometrics, 1990, 32(3):348-349.

[本文引用: 1]

胡永兵, 高学金, 李亚芬, .

批次加权软化分的多阶段AR-PCA间歇过程监测

[J]. 仪器仪表学报, 2015, 36(6):1291-1300.

[本文引用: 1]

HU Yongbing, GAO Xuejin, LI Yafen, et al.

Multiphase AR-PCA monitoring for batch processes based on the batch weighted soft classifying

[J]. Chinese Journal of Scientific Instrument, 2015, 36(6):1291-1300.

[本文引用: 1]

ZHAO H T.

Dynamic graph embedding for fault detection

[J]. Computers & Chemical Engineering, 2018, 117:359-371.

DOI:10.1016/j.compchemeng.2018.05.018      URL     [本文引用: 1]

/