基于MWSA的热力系统单参数时序预测方法
Sequential Prediction Method of Single Parameter for Thermal System Based on MWSA
Received: 2021-08-5 Revised: 2021-10-6
作者简介 About authors
肖鹏飞(1996-),硕士,从事热力系统的状态监测与故障诊断研究.
热力系统的状态参数变化可以实时反映系统的运行状态,针对热力系统参数运行数据预测手段匮乏的现状,基于4种算法提出一种单参数预测方法并简称MWSA,对当前设备状态参数进行分解降噪、趋势提取和时序预测,并将预测结果作为下一步运行管理策略和装备维修的参考,对系统的长期安全稳定运行具有重要意义.首先, 利用中值回归经验模态分解(MREMD)方法将监测得到的运行状态参数分解为若干个本征模态函数(IMF)和残余分量.然后,对不符合筛选条件的分量进行小波阈值降噪(WTD),并将去噪后的分量与原本符合筛选条件的分量重组成新的IMF分量.最后,利用基于奇异值分解(SVD)和优化参数排列熵(PE)的K-means聚类算法,对重组后的IMF分量进行分类,取熵值较低的一类分量重构为趋势项并采用整合滑动平均自回归模型(ARIMA)进行预测.经实际案例验证,该方法能够有效克服原始参数时序中高频噪声的干扰,与不采用降噪处理的同类方法相比,该方法预测的准确度更高.
关键词:
The changes in the status parameters of the thermal system reflect the operating status of the system in real time. The forecast results of the trend extraction and time series prediction of the current equipment status parameters can be used as a reference for the next operation management strategy and equipment maintenance, which can be used for the long-term system safe and stable operation. In this paper, a method which is described as MWSA, based on the midpoint and regression based empirical mode decomposition (MREMD), the wavelet threshold denoising (WTD) and midpoint and techniques, the singular value decomposition (SVD) and optimized parameter permutation entropy (PE), and an auto regressive integrated moving average model (ARIMA), is applied to the single-parameter time series prediction of thermal systems. First, the MREMD is used to decompose the monitored operating state parameters into a number of intrinsic mode functions (IMF) and residual components. Next, the components that do not meet the screening conditions are subjected to wavelet thresholding. The denoised components and the components that originally meet the filtering conditions are recomposed into new IMF components. Finally, the K-means clustering algorithm based on SVD and PE is used to classify the recomposed IMF components, the component with a lower entropy value is selected and reconstructed into a trend item, and ARIMA is used to predict. An actual case verifies that this method can effectively overcome the interference of high-frequency noise in the original parameter timing, and the prediction accuracy is higher than that of similar methods without noise reduction treatment.
Keywords:
本文引用格式
肖鹏飞, 倪何, 金家善.
XIAO Pengfei, NI He, JIN Jiashan.
热力系统的运行参数大多为非平稳时间序列.在非平稳时间序列趋势项的提取方面,文献[4]对风速时序数据进行预测并基于排列熵(PE)的经验模态分解(EMD)趋势项提取算法,结合人工神经网络(ANN)的预测模型对提取的趋势进行预测,通过计算预测数据与实际数据的相关系数来验证预测精度,相比未引入排列熵算法的EMD结合ANN的EMD-ANN算法具有更好的预测效果;陈亮等[5]提出基于集合经验模态分解(EEMD)和奇异值分解(SVD)的排列熵非平稳时序趋势提取方法,并通过与文献[6]和文献[7]中的方法进行对比,验证了该算法的优越性,但由于EEMD分解后的各个本征模态函数(IMF)含噪信息不一,且在分解后的噪声分量和信号分量的分界问题方面选择直接去掉最高频分量的方法而未做量化分析,导致最高频IMF分量中的信号信息丢失,其余分量未进行降噪处理,使后续趋势提取误差增加;刘海江等[8]提出利用EMD结合小波阈值去噪(WTD)的降噪方法,在保留原信号信息的基础上对噪声进行了更有效地消除,但因EMD算法中的“端点效应”问题导致重构信号误差较大;黄礼敏[9]在EMD算法的基础上提出了中值回归经验模态分解(MREMD)方法,有效解决了EMD分解过程中的“端点效应”问题,并且优化了包络线生成方式,但同样未对分解后的IMF分量进行定量分界,导致后续计算结果误差较大.Behera等[10]利用整合滑动平均自回归(ARIMA)模型,通过对公共部门每天接到的电话次数进行预测,并与实际数据对比分析,验证了模型的有效性,其预测结果可作为部门管理层规划员工日常工作量的参考.但由于热力系统中的参数历史数据中包含较多干扰,直接采用ARIMA模型预测误差较大;仇琦等[11]在ARIMA预测模型的基础上提出了基于EMD结合ARIMA的EMD-ARIMA算法预测模型,通过对光电功率信号经EMD分解后的预测验证了模型的有效性,但这两种方法都未对原始非平稳信号的趋势进行提取,导致预测干扰较大.
基于上述研究提出一种热力系统单参数时序预测模型,由MREMD、WTD、基于奇异值分解和排列熵的K-means聚类算法(SVD-PE-KCA)和ARIMA共4部分组成,简称MWSA.利用对原始信号的分解、降噪和趋势提取,使预测结果更加精确,可为热力系统的运行管理、控制优化和维修保障研究提供底层输入,具有一定的理论创新和工程应用价值.
1 预测步骤和算法
基于MWSA的单参数时序预测流程如图1所示.
图1
图1
基于MWSA的单参数时序预测流程图
Fig.1
Flow chart of single parameter sequential prediction method based on MWSA
首先,利用MREMD算法将历史运行参数的时序数据信号分解为若干个IMF分量和1个残余分量(Rn);其次,计算各个IMF分量与原信号的互相关系数和均方根误差,筛选出不符合阈值条件的分量进行WTD,并将去噪后的IMF分量与原本符合筛选条件的分量以及残余分量重组成新的IMF分量;再次,利用SVD将重组后的新IMF分量分解,重构成按照奇异值升序排列的奇异值分量,并采用基于优化参数的PE算法计算各个IMF分量的熵值,利用K-means聚类算法针对各IMF分量熵值进行分类;最后,选取熵值较低的一类IMF分量重构为当前运行参数的变化趋势项,并采用ARIMA模型对其进行预测.
1.1 MREMD分解
MREMD采用自回归(AR)模型对信号端点延拓,并用优化包络线拟合的方法改善了EMD算法中的“端点效应”问题,具体步骤和算法如下.
步骤一 对于长度为N的初始时间序列x0(t),采用如下式所示的p阶AR模型对x(t)的左右端点进行预测延拓,即x(t)为延拓后的新序列,使左右端点处于延拓后时间序列的相邻两个极值点之间.
式中:xt(t=p+1, p+2, …, N)为均值点;ϕ0,ϕ1,…,ϕp为p+1个实数;μt为零均值的白噪声序列.
步骤二 计算延拓后新时序中相邻极值点间的均值,得到初始信号x0(t)的均值点序列{
步骤三 将计算得到的信号分量h1,0(t)作为原始信号,重复步骤一和步骤二进行迭代计算,直到经过l次迭代后的信号分量h1,l(t)满足如下式所示的终止条件.
式中:σ*为归一化标准差;σl-1和σl分别为第l-1次迭代后信号分量h1,l-1(t)和第l次迭代后信号分量h1, l(t)的均值点序列标准差;P为条件概率;根据Sigma原则[12]定义
式中:xz为延拓后新序列的第z个极值点;
步骤四 将h1,l(t)作为1阶本征模态函数(即I1分量)输出,x0(t)-I1得到分量R1,并将R1作为原始信号重复步骤一至步骤四,直到残余信号成为单调函数或分离不出新的IMF分量为止,残余信号提取过程表示为
式中:下标n为能够分解出的IMF分量个数.
经过上述分解后,原始信号x0(t)可表示为所有IMF分量和最终残余分量之和,表达式为
1.2 IMF分量选取
对于MREMD分解后的IMF分量,噪声主要集中在高频分量中,在工程实际应用时一般通过舍弃高频分量的方法来达到降噪的目的,但这同样也会丢弃部分的信号信息,使得分析结果产生误差.此外,虽然低频分量通常包含了较多的信息成分,但同样也存在一些噪声,仅靠舍弃高频分量的方法并不能够实现完全降噪的目的.为此,本文采用王彬蓉等[13]提出的IMF分量筛选方法对所有分量进行筛选,在降噪的同时尽可能多地保留原始信号的信息,具体步骤和算法如下.
步骤一 计算各阶IMF分量与原始信号的相关系数ci和均方根误差RMSEi,表达式为
式中:
步骤二 计算IMF分量相关系数筛选阈值和均方差筛选阈值,表达式为
步骤三 选取满足如下条件的IMF分量,进行小波阈值降噪为
1.3 WTD
WTD是利用小波变换将原始信号分解成多层近似系数和细节系数,由于经过小波变换后的噪声信息主要集中在绝对值较小的细节系数中,所以可通过将绝对值小于规定阈值的细节系数设置为0,并将剩余小波系数(即分解得到的近似系数和保留的细节系数)通过小波逆变换重构回原始信号的方法,以达到去除噪声的目的,具体步骤和算法如下.
式中:λj为第j层小波细节系数的噪声阈值;d(j)为第j层小波细节系数;median为中间值函数,即将每层系数按照降序排列后,取其中间数的值(当系数个数为奇数时)或中间两个数的均值(当系数个数为偶数时).
步骤二 阈值处理.常用阈值处理函数有硬阈值函数、软阈值函数和复合阈值函数[16]等,依次表示为
式中:
1.4 趋势项提取
采用SVD、PE和K-means聚类算法的组合以实现信号的进一步降噪和趋势项的提取,具体步骤和算法如下.
步骤一 SVD分解.将经过小波阈值降噪处理后的n个IMF分量I1~In和残余分量Rn去均值,然后以列向量的形式组成矩阵AN×(n+1),并计算其协方差矩阵B(n+1)×(n+1):
式中:Λ=diag(
将矩阵U和A中0特征值所对应的向量去掉,重构后的K个奇异值分量表示为
式中:PK为第K个奇异值分量.
步骤二 PE计算.利用延迟相空间重构法[17]对IN×K中各个奇异值分量进行重构,如对分量P1重构表示为
式中:l=N-(m-1)τ;p1, i(i=1, 2, …, N)为第1个奇异值分量的第i个元素;m为嵌入维数;τ为延迟时间.
将重构矩阵的每行元素按升序排列,得到每行元素的索引值,然后将每行元素的索引值组成索引向量并构成索引矩阵.索引矩阵中每行元素的排列方式共有m!种可能,假设第b种排列方式在索引矩阵中的出现次数为ub,统计其出现的频率为
由式(16)可计算得到各奇异值分量的排列熵为
步骤三 K-means聚类.根据计算得到的排列熵值对IMF分量进行聚类,选取熵值较低的分量重构原始信号的趋势项.首先,任意选取其中1个点ρ1作为1个类别中心,并选择与ρ1距离最远的ρ2点为另1个类别中心,计算熵值序列中其余对象点x与ρ1和ρ2的距离为
然后,把其余各点划分到与两个类别中心距离近的一类,将两类点的均值作为新的类别中心进行分类,重复上述步骤,直至两个类别中心不再发生变化为止.最后,将两类熵值点中平均熵值较低一类所对应的奇异值分量筛选出来[18],重构为原始信号的趋势项为
式中:EN×K为通过聚类分析选取的熵值点对应的IMF分量取均值扩展后的矩阵,未选取分量对应的均值用N×1替换;SN×K为筛选出的奇异值分量矩阵,未选取的分量用N×1替换;
1.5 ARIMA预测模型
ARIMA常用于差分平稳时间序列的拟合和预测,具体步骤和算法如下.
步骤一 对式(19)计算得到的趋势项TN×1进行平稳性(Phillips-Perron)检验[19],然后对检验结果为非平稳的时间序列作差分平稳化处理,表示为
式中:
步骤二 对经过平稳化处理后的趋势项的
式中:s和q分别为模型的自回归系数多项式阶数和移动平均系数多项式阶数;
步骤三 经过AIC检验得到模型的自回归系数多项式阶数s和移动平均系数多项式阶数q,并拟合ARIMA(s, d, q)模型表达为
式中:d为非平稳序列经差分变为平稳序列的差分次数;a1~as为AR模型系数;b1~bq为MA模型系数;εt-q~εt为白噪声序列;c为常数;yt-s~ yt为
步骤四 对ARIMA模型的残差序列进行LB(Ljung-Box)统计量检验[21],表示为
∀k'>0
式中:N∈[1, k']且为整数;RLB为残差序列的Ljung-Box统计量值;
2 预测案例
以某型船舶蒸汽动力系统的除氧器水位为案例,对上述基于MWSA的热力系统单参数时序预测方法进行验证.按1.1节的步骤和算法,对一段时间内监控系统采集的实际水位数据进行MREMD分解,得到7个IMF分量和1个残余分量,如图2所示.
图2
对于分解得到的分量,根据式(8)计算其与原始信号的相关系数和均方根误差,如表1所示.
表1 各个IMF分量与原信号的相关系数和均方根误差
Tab.1
IMF分量 | 相关系数 | 均方根误差 |
---|---|---|
I1 | 0.046 9 | 7.772 7 |
I2 | 0.105 5 | 7.739 0 |
I3 | 0.106 1 | 7.742 4 |
I4 | 0.526 2 | 6.679 1 |
I5 | 0.426 7 | 7.153 2 |
I6 | 0.599 1 | 6.797 9 |
I7 | 0.593 4 | 6.494 4 |
根据式(9)计算得到IMF分量相关系数的筛选阈值λIMF=0.301 7,均方差的筛选阈值δIMF=7.314 1,符合条件的分量有I4~I7.按1.3节的具体步骤和算法对I1~I3进行小波阈值降噪,经反复测试,选取Sym4小波基,分解层数为3层.采用固定阈值选取方法,根据式(11)计算各层的噪声阈值.采用不同阈值函数处理后的各IMF分量的信噪比及均方根误差,如表2所示.
表2 去噪后各IMF分量的信噪比、均方根误差
Tab.2
方法 | IMF分量 | 信噪比 | 均方根误差 |
---|---|---|---|
复合阈值函数 | I1 | 39.185 4 | 0.004 1 |
I2 | 36.503 3 | 0.013 8 | |
I3 | 56.600 6 | 0.001 6 | |
硬阈值函数 | I1 | 14.015 4 | 0.073 5 |
I2 | 38.981 8 | 0.010 3 | |
I3 | 83.197 9 | 7.604 1×10-5 | |
软阈值函数 | I1 | 12.118 4 | 0.090 7 |
I2 | 32.954 7 | 0.020 7 | |
I3 | 74.748 9 | 0.000 2 |
图3
图4
图4
各分量互信息值随延迟时间的变化曲线
Fig.4
Variation curve of mutual information value with delay time
图5
图5
各分量伪近邻率随嵌入维数的变化曲线
Fig.5
Variation of pseudo nearest neighbor rate with embedding dimension
表3 各奇异值分量的最佳延迟时间、最佳嵌入维数和排列熵值
Tab.3
奇异值分量 | τopt | mopt | PE |
---|---|---|---|
P1 | 23 | 3 | 2.467 2 |
P2 | 12 | 2 | 0.975 2 |
P3 | 25 | 2 | 1.263 9 |
P4 | 18 | 2 | 1.212 7 |
P5 | 12 | 3 | 3.123 8 |
P6 | 9 | 3 | 2.972 9 |
P7 | 6 | 3 | 2.955 8 |
P8 | 6 | 4 | 4.709 8 |
对各分量的排列熵值进行K-means聚类,选取P2、P3和P4共3个分量进行趋势项重构,结果如图6所示.
图6
根据1.5节的步骤和算法,对除氧器水位进行拟合和预测.首先,对如图6所示的趋势项进行Phillips-Perron检验,结果为非平稳序列,再经过4次差分计算后转换为平稳序列;然后,对差分平稳化后的序列进行AIC,得到自回归系数多项式阶数s以及移动平均系数多项式阶数q分别为1和3;在经过4次反差分计算和LB统计量检验后,拟合得到如式(22)所示的ARIMA(1, 4, 3)模型.
图7
图7
基于MOSP的除氧器水位趋势项与预测项
Fig.7
Trend and prediction of deaerator water level based on MSOP
图8
图8
基于MWSA的除氧器水位的趋势项与预测项
Fig.8
Trend and prediction of deaerator water level based on MWSA
3 结语
提出一种基于MWSA的热力系统单参数时序预测方法,并以某型号船舶蒸汽动力系统的除氧器水位为例,根据实际运行数据预测其在未来一段时间内的变化趋势.通过与基于MSOP的时序预测方法对比,证明所提方法的预测误差较小,预测结果较为准确.该算法完全基于基本物理规律,利用纯数学推导得出,在推导过程中未加入任何约束条件或有关具体设备的辅助方程,在数学上具有本质的普适性.利用滑动数据采集窗口可以对其他时段的数据进行分析验证,亦可通过添加其他设备的数据接口,对其他热力参数进行分析和预测.研究成果可用于热力系统的运行管理、控制优化和维修保障研究,达到优化运行管理和控制策略,合理安排维修保障资源、减少设备故障和延长系统使用寿命的目的.
参考文献
考虑给水泄漏的锅炉升负荷仿真及其可靠性
[J].
Simulation and performance reliability of boiler load raising process considering leakage of feed water
[J].
基于ARMA模型的燃煤机组主蒸汽压力控制策略
[J].
Control strategy of main steam pressure of coal-fired unit based on ARMA model
[J].
基于ARIMA和LSTM组合模型的核电厂主泵状态预测
[J].
Condition prediction of reactor coolant pump in nuclear power plants based on the combination of ARIMA and LSTM
[J].
A permutation entropy-based EMD-ANN forecasting ensemble approach for wind speed prediction
[J].DOI:10.1007/s00521-020-05141-w URL [本文引用: 1]
基于EEMD-SVD-PE的轨道波磨趋势项提取
[J].
An EEMD-SVD-PE approach to extract the trend of track irregularity
[J].
Joint empirical mode decomposition and sparse binary programming for underlying trend extraction
[J].DOI:10.1109/TIM.2013.2265451 URL [本文引用: 1]
基于HHT的振动信号趋势项提取方法
[J].
Method of vibration signal trend extraction based on HHT
[J].
换挡加速度信号的EMD和小波阈值降噪方法
[J].
EMD and wavelet threshold denoising method of gear-shift acceleration signals
[J].
基于改进EMD-ARIMA的光伏发电系统短期功率预测
[J].
DOI:1672-0792(2020)08-0042-09
[本文引用: 1]
光伏发电功率的准确预测对于提高电网和微电网的供电质量和降低运行成本具有重要意义。针对光伏发电时间序列的非线性和非平稳特征,在传统基于经验模态分解(EMD)方法的基础上,加入白噪声检验环节,提出一种基于改进EMD和差分自回归移动平均(ARIMA)相结合的光伏发电系统短期功率预测方法。首先利用EMD将原始光伏发电系统功率序列分解为多个具有不同频率的固有模态函数(IMF)分量,并对各IMF分量进行白噪声检验,筛选出不含白噪声的IMF分量;然后,对分量进行平稳性检验,对非平稳分量进行平稳化处理;最后对平稳的分量序列分别建立ARIMA预测模型,将各分量预测值进行叠加得到最终预测值。为验证方法的有效性,利用实证系统对3种天气条件下共15天的光伏发电功率进行了预测,并与传统的ARIMA、EMD-AR和EMD-ARIMA等方法进行了对比。误差统计结果表明,在相同样本数据量的前提下,该方法预测误差普遍低于其它方法。
An improved short-term power prediction method of PV power generation system based on EMD-ARIMA model
[J].
DOI:1672-0792(2020)08-0042-09
[本文引用: 1]
The accurate prediction of photovoltaic power generation is of great significance to improve the power supply quality of the power grid and microgrid and reduce operating costs. Aiming at the non-linear and non-stationary characteristics of photovoltaic power generation time series, based on the traditional empirical mode decomposition (EMD) method, this study introduces the white noise test link and proposes a short-term power prediction method based on improved empirical mode decomposition (EMD) and auto regressive integrated moving average (ARIMA) model. Firstly, the original PV output sequence is decomposed into multiple Intrinsic Mode Function (IMF) components with different frequencies by EMD, and white noise test on each IMF component is performed to filter out IMF components without white noise. Then, the components are tested for stationarity, and those non-stationary components are smoothed. Finally, the stationary component sequences are reconstructed by ARIMA prediction models, respectively, and the final prediction result is obtained by superimposing prediction value of each component. In order to verify the effectiveness of the method, a demonstrated system is used to predict the PV output for a total of 15 days under three weather conditions and the result is compared with the three methods of traditional ARIMA, EMD-AR, and EMD-ARIMA. The error statistics show that the prediction error of this method is generally lower than the other three methods under the premise of the same sample data volume.
基于六西格玛理论的轴流泵叶轮水力效率影响因子分析
[J].
Influencing factors analysis of hydraulic efficiency of axial flow pump impeller based on six sigma theory
[J].
基于EMD自适应重构的心音信号特征筛选及分类
[J].
Feature selection and classification of heart sound based on EMD adaptive reconstruction
[J].
一种改进的小波阈值去噪算法
[J].
An improved wavelet threshold denoising algorithm
[J].
相空间重构参数选择方法的研究
[J].
Selection of embedding parameters in phase space reconstruction
[J].
基于k-means聚类算法的分布式能源系统典型日冷热负荷选取
[J].
Selection of typical daily cooling and heating load of CCHP system based on k-means clustering algorithm
[J].
PP检验对异方差时间序列的伪检验
[J].
Spurious tests to he-teroscedastic time series with PP test
[J].
基于AIC准则判断锂电池最优模型
[J].
Evaluating optimal models of lithium battery based on AIC
[J].
ARIMA时间序列分析模型在臭氧浓度中长期预报中的应用
[J].
Application of ARIMA model for mid-and long-term forecasting of ozone concentration
[J].DOI:10.1021/es8002603 URL [本文引用: 1]
排列熵算法参数的优化确定方法研究
[J].
Method for optimal determination of parameters in permutation entropy algorithm
[J].
基于MSOP的蒸汽动力系统单参数运行稳定性评估方法
[J].
An operation stability assessment method of a single-parameter in steam power system based on MSOP
[J].
/
〈 |
|
〉 |
