上海交通大学学报, 2024, 58(6): 806-818 doi: 10.16183/j.cnki.jsjtu.2022.511

新型电力系统与综合能源

基于CEEMDAN-GSA-LSTM和SVR的光伏功率短期区间预测

李芬,1, 孙凌1, 王亚维2, 屈爱芳3, 梅念4, 赵晋斌1

1.上海电力大学 电气工程学院, 上海 200090

2.中国船舶集团有限公司第七二二研究所低频电磁通信技术实验室,武汉 430205

3.上海师范大学 数理学院,上海 200234

4.国网经济技术研究院有限公司,北京 102209

Short-Term Interval Forecasting of Photovoltaic Power Based on CEEMDAN-GSA-LSTM and SVR

LI Fen,1, SUN Ling1, WANG Yawei2, QU Aifang3, MEI Nian4, ZHAO Jinbin1

1. College of Electric Power Engineering, Shanghai University of Electric Power, Shanghai 200090, China

2. Laboratory of Low Frequency Electromagnetic Communication Technology, the 722 Research Institute, CSSC, Wuhan 430205, China

3. Mathematics and Science College, Shanghai Normal University, Shanghai 200234, China

4. State Grid Economic and Technological Research Institute Co., Ltd., Beijing 102209, China

责任编辑: 王历历

收稿日期: 2022-12-9   修回日期: 2023-03-14   接受日期: 2023-05-9  

基金资助: 国家自然科学基金面上项目(52177184)
上海绿色能源并网工程技术研究中心(13DZ2251900)

Received: 2022-12-9   Revised: 2023-03-14   Accepted: 2023-05-9  

作者简介 About authors

李芬(1984-),博士,副教授,主要研究方向为新能源开发利用与电力变换技术;E-mail:lifen2012@shiep.edu.cn.

摘要

针对光伏输出功率存在间歇性和波动性的问题,提出一种光伏功率短期区间预测模型.首先,该模型采用自适应噪声完备集合经验模态分解将历史光伏出力数据分解为不同的分量并按照其与赤纬角、时角等时序特征量的相关性定义为时序分量和随机分量.其次,分别使用经过引力搜索算法优化的长短期记忆神经网络和支持向量回归模型对时序分量和随机分量进行预测.再次,叠加时序分量和随机分量的预测结果得到点预测结果.然后,对误差进行Johnson变换及正态分布建模后得到光伏功率区间预测结果.最后,利用算例验证该模型的有效性.结果表明:在不同天气情况下,上述模型比现有预测模型精度更高,具有较好的鲁棒性,能够基于预测值提供较为精准的置信区间.

关键词: 光伏功率预测; 区间预测; 自适应噪声完备集合经验模态分解; 引力搜索算法; 长短期记忆; 支持向量回归; Johnson变换

Abstract

Aimed at the intermittency and fluctuation of photovoltaic output power, a short-term interval prediction model of photovoltaic power is proposed. First, the model uses the complete ensemble empirical mode decomposition of adaptive noise (CEEMDAN) to decompose the historical photovoltaic output data into different components and define them as time-series components and random components according to their correlation with time-series features such as declination and time angles. Then, the long short-term memory (LSTM) neural network and the support vector regression (SVR) model optimized by the gravitational search algorithm (GSA) are used to predict the time series components and the random components respectively, and the prediction results of the time series components and the random components are superimposed to obtain the point prediction result. After the error is subjected to Johnson transformation and normal distribution modeling, the photovoltaic power interval prediction result is obtained. Finally, the effectiveness of the method is verified by an example. The comparison of the proposed model with other existing prediction models under different weather conditions suggests that the proposed model has a higher accuracy and a better robustness, which can provide precise confidence intervals based on point prediction values.

Keywords: photovoltaic power prediction; interval prediction; complete ensemble empirical mode decomposition with adaptive noise (CEEMDAN); gravitational search algorithm (GSA); long short-term memory (LSTM); support vector regression (SVR); Johnson transformation

PDF (2987KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

李芬, 孙凌, 王亚维, 屈爱芳, 梅念, 赵晋斌. 基于CEEMDAN-GSA-LSTM和SVR的光伏功率短期区间预测[J]. 上海交通大学学报, 2024, 58(6): 806-818 doi:10.16183/j.cnki.jsjtu.2022.511

LI Fen, SUN Ling, WANG Yawei, QU Aifang, MEI Nian, ZHAO Jinbin. Short-Term Interval Forecasting of Photovoltaic Power Based on CEEMDAN-GSA-LSTM and SVR[J]. Journal of Shanghai Jiaotong University, 2024, 58(6): 806-818 doi:10.16183/j.cnki.jsjtu.2022.511

在“双碳”目标下,我国能源转型节奏越来越快,光伏发电进入新发展阶段[1].光伏功率预测作为源网荷储一体化和多能互补发展的关键技术之一,对进一步规范和完善光伏电站消纳统计工作有重大意义,可以为电力系统的调度、运行及新能源消纳提供更为完善的数据支撑.

针对光伏功率与关键气象环境因素随时间变化的本质特征,文献[2]中提出利用经验模态分解(Empirical Mode Decomposition,EMD)产生不同尺度的环境数据序列,运用主成分分析方法对输入模型参数降维,最后采用长短期记忆(Long Short-Term Memory,LSTM)网络构建整体模型.实验结果表明,LSTM模型在光伏预测领域相较于反向传播神经网络(Back Propagation, BP)和极端梯度提升(Extreme Gradient Boosting,XGboost)具有更好的适应性.然而,太阳辐射在具有时序性的同时,也潜在很强的随机性,这导致光伏输出功率具有间歇性和波动性的特点[3-5],如果遇到气象条件不佳如环境因素波动较大的转折天气或恶劣天气,则上述模型的性能将大大降低.文献[6]中提出一种基于XGBoost 的实时校正光伏预测模型,它将基准预测值及其与实测值的实时动态误差作为实时层XGBoost 模型输入实时叠加,以实时误差修正的方法对XGboost算法进行优化.实验结果表明,经过实时误差修正的XGboost算法在超短期预测尺度上性能优于LSTM,有利于解决光伏输出功率在较短时间段内的随机波动问题.然而,这种实时误差修正的方法仅在超短期尺度下效果较好,在短期或中长期的尺度下进行实时修正会导致模型复杂度提高,因此必须额外考虑气象环境因素的时序特征.文献[7]中针对高维特征量提出一种基于卷积神经网络(Convolutional Neural Network,CNN)、LSTM的光伏功率预测模型,将高维特征量形成矩阵输入卷积层,优化了计算速度,在传统深度学习模型上提升了预测精度.但是,在特征量维度不高的情况下,该模型池化层中会丢失大量时序和随机性信息,影响预测效果.

针对光伏输出功率存在间歇性和波动性的特点,概率区间预测可以提供预测值的波动区间,在一定的置信水平下给出输出功率的上下界值[8-9].文献[10]中提出一种基于互补集合经验模态分解(Complementary Ensemble Empirical Mode Decomposition, CEEMD)和深度信念网络(Deep Belief Network, DBN)的光伏功率预测方法,对不同天气条件下的CEEMD-DBN预测结果进行核密度估计(Kernel Density Estimation, KDE),最后得到预测区间.该方法解决EMD分解带来的模态混叠问题的同时消除了辅助白噪声.但是,该模型也并未兼顾气象环境因素的时序特征,预测过程有待改善.

针对以上问题,在充分兼顾环境因素的时序性与随机性的基础上,本文提出一种基于自适应噪声完备集合经验模态分解(Complete Ensemble Empi~rical Mode Decomposition with Adaptive Noise,CEEMDAN)和引力搜索算法(Gravitational Search Algorithm,GSA)优化后的LSTM网络及支持向量回归(Support Vector Regression, SVR)的光伏功率短期区间预测模型.首先,利用CEEMDAN将历史出力数据分解为不同分量并按照其与赤纬角、时角等时序特征量的相关性定义为时序分量和随机分量.其次,分别使用经过GSA优化的LSTM和SVR模型对时序分量和随机分量进行预测.再次,叠加时序分量和随机分量的预测结果得到点预测结果.然后,对误差进行Johnson变换及正态分布建模后得到光伏功率区间预测结果.算例验证结果表明:与实时修正的XGboost算法、CNN-LSTM网络以及EMD-GSA-LSTM、EMD-GSA-SVR相比,所提模型在点预测环节中精度更高,鲁棒性较好,在区间预测环节中能够基于点预测值提供较为精准的置信区间.

1 模型理论基础

1.1 CEEMDAN算法

EMD是一种能将时间序列信号分解为数个本征模态函数(Intrinsic Mode Function, IMF)的信号分析方法,集合经验模态分解(Ensemble Empirical Mode Decomposition, EEMD)在EMD的基础上加入高斯白噪声[11],解决了EMD存在的模态混叠问题.CEEMDAN则在EEMD的基础上改进,在分解的每个阶段都加入特定自适应噪声,相较于EEMD提升了计算速度,得到更好的模态分解结果[12].CEEMDAN算法的分解流程如下所示.

(1) 在信号x(n)中加入幅值为ε0的高斯白噪声ωi(n),即

x(n)'=x(n)+ε0ωi(n)

式中:i为加入白噪声的次数.

(2) 定义Ej[·]为经过EMD分解后的第j个本征模态分量,对x(n)'进行i次EMD分解,其结果取平均值得到第一个本征模态分量HIMF1(n),即

E1[x(n)']=HIMF1i(n)
HIMF1(n)=1I'i=1I'HIMF1i(n)

(3) 计算去除HIMF1(n)后的残差R1(n),即

R1(n)=x(n)'-HIMF1(n)

(4) 计算第二个本征模态分量HIMF2(n)及其残差R2(n),即

HIMF2(n)=1I'i=1I'E1[R1(n)+ε1E1[ωi(n)]]
R2(n)=R1(n)-HIMF2(n)

(5) 对于其他阶段,重复以上步骤计算第k个本征模态分量和其残差,即

HIMFk(n)= 1I'i=1I'E1[Rk-1(n)+εk-1Ek-1[ωi(n)]]
Rk(n)=Rk-1(n)-HIMFk(n)

1.2 GSA算法

GSA算法是Rashedi等[13]在2009年提出的一种优化算法.如图1所示,该算法通过模拟物体间的万有引力,让种群内所有物体都朝着质量更大的物体运动.F1, 2F1, 3F1, 4分别为质量代理M2M3M4M1的作用力,F1F1, 2F1, 3F1, 4的合力,a1M1F1方向的加速度.在GSA中,更大的质量代表更优的解,经过数次迭代后即可找到种群内的最优解.和常用的粒子群算法、蚂蚁群算法相比,GSA能够避免陷入局部最优解,在处理全局问题上能取得更好的效果[14],具体方法如下.

图1

图1   GSA质量代理运行示意图

Fig.1   Diagram of GSA agent operation


D维种群内有N个质量代理,第K个质量代理的位置定义为

XK=(xK1,xK2,xK3, ,xKD),K=1, 2, , N

t时刻质量代理b对质量代理a的作用力Fa, bD

Fa, bD(t)=G(t)Ma(t)Mb(t)(xbD(t)-xaD(t))Rab(t)+δ

式中:G(t)为随时间t递减的引力变量;Rab(t)为ab间的欧氏距离;Ma(t)、Mb(t)分别为质量代理ab的惯性质量;δ为防止分母为0的变量.

Rab(t)=Xa(t),Xb(t)2
ma(t)=Bfita(t)-Bworst(t)Bbest(t)-Bworst(t)
Ma(t)=ma(t)K=1NmK(t)

式中:Bfita(t)为t时刻质量代理a的适应度.在最小值问题中,Bworst(t)为所有时刻中适应度最大值,Bbest(t)为所有时刻中适应度最小值;最大值问题相反.

t时刻,为了增加算法的随机特征引入[0,1]中的随机数τK,则质量代理a所受的在D维上的合力和其在D维上的加速度分别为

FaD(t)=i=K, KaNτKFa, bD(t)
aaD(t)=FaD(t)Ma(t)

质量代理aD维中下一时刻速度和位置分别为

vaD(t+1)=τKvaD(t)+aaD(t)
xaD(t+1)=xaD(t)+vaD(t+1)

1.3 LSTM神经网络

LSTM是基于循环神经网络(Recurrent Neural Network, RNN)诞生的一种神经网络,与RNN相比,LSTM解决了长序列训练过程中的梯度消失和梯度爆炸问题,更适用于光伏出力的预测[15-17].

LSTM的一个神经元在t时刻有3个输入,包括细胞状态Ct-1、隐层状态ht-1和输入向量Xt;两个输出为细胞状态Ct和隐层状态ht.其中ht-1Xt经过门控单元对Ctht的输出造成影响,门控单元由遗忘门ft、输入门it和输出门ot构成.LSTM网络拓扑结构如图2所示.

图2

图2   LSTM拓扑结构图

Fig.2   Topology diagram of LSTM


WfWiWoWc分别为遗忘门、输入门、输出门和输入单元状态权重矩阵;bfbibobc分别为遗忘门、输入门、输出门和输入单元状态的偏置项;σ(·)为激活函数,一般为sigmoid函数;tanh(·)为双曲正切函数,则

ft=σ(Wf·[ht-1 xt]+bf)it=σ(Wi·[ht-1 xt]+bi)C˜t=tanh(Wc·[ht-1 xt]+bc)Ct=ft×Ct-1+it×C˜tot=σ(Wo·[ht-1 xt]+bo)ht=ottanh(Ct)

神经元作为LSTM的构成部分,它的数量对Ctht.,rL确定模型的学习速度,决定目标函数在何时收敛到最优解,因此在超参数优化环节中需要选取合适的LSTM神经元数量m和学习率rL以达到更好的预测效果[18].

1.4 SVR算法

SVR是基于支持向量机的一种回归算法,主要思想是寻找输入空间到输出空间的一个非线性映射Φ(x),将输入数据x映射到高维特征区间ψ中, 继而在高维空间内寻找到SVR函数[19-20].

f(x)=Φ(x)w+bΦ(x)RDψwψ

式中:w为权值向量;b为偏置项.可以通过最小化下列泛函数进行估计,

R(w)=12w2+Cc=1dJθ[yc, f(xc)]Jθ[yc, f(xc)]=  yc-f(xc)-θ,yc-f(xc)θ0,yc-f(xc)<θ 

式中:C为惩罚参数;xcyc分别为输入、输出变量的值;Jθ[yc, f(xc)]为θ不敏感函数,当SVR的输出与实际输出的绝对值小于设定的θ值时可以忽略不计,否则让损失函数的值为两者差的绝对值超过θ的部分.由式(20)可知,SVR可以表示为

min12w2+Ci=1n(ξc2+ξ^c2)s.t.(Φ(xc)w+b)-ycθ+ξc,   c=1, 2, , d yc-(Φ(xc)w+b)θ+ξ^c,   c=1, 2, , d ξc,ξ^c0, c=1, 2, , d

为了让式(20)有解,式(21)中引入松弛变量ξcξ^c,通过拉格朗日乘子法可得:

w=c=1n(αc-αc*)Φ(xc)

式中:αcαc*为两个拉格朗日乘子.结合式(19)和式(22),f(x)可以表示为

f(x)=c=1n(αc-αc*)K(xc, x)+bK(xc, x)=Φ(xc)Φ(x)

式中:K(xc, x)为核函数.由上式可见,SVR在计算f(x)时,只需算出拉格朗日乘子和核函数,因此选择合适的核函数及其内部参数可以有效地提高SVR预测模型的精度[21].

1.5 Johnson变换

Johnson变换是基于Johnson分布的一种数据变换方法,可以将非正态的样本通过一系列变换转换为正态分布的数据[22-23].

Johnson变换从SBSLSU 3个分布系列中选取最优函数对样本进行拟合,其形式为

Z=γ+δgX-ξλ

式中:γδ为形状参数;g(·)为变换函数;X为随机变量;ξ为位置参数;λ为尺度参数,如表1所示.

表1   Johnson变换的3种类型

Tab.1  Three types of Johnson transformation

分布系列g(·)约束条件
SBln X-ξξ+λ-Xξ<X<ξ+λ,λ>0
SLln X-ξλX>ξ,λ>0
SUarsinh X-ξλλ>0

新窗口打开| 下载CSV


2 模型结构

所提预测模型结构如图3所示,模型可以分成两个环节:点预测环节和区间预测环节.分别以这两个环节对模型整体结构进行阐述.

图3

图3   CEEMDAN-GSA-LSTM和SVR区间预测模型结构示意图

Fig.3   Schematic diagram of interval prediction based on CEEMDAN-GSA-LSTM and SVR


2.1 点预测环节

点预测环节是模型的先行环节,如图3左半部分所示,主要目的是结合历史功率数据和多种地面辐射观测数据及常规气象要素观测数据,利用CEEMDAN-GSA-LSTM和SVR实现对未来3 d内光伏出力点的预测,流程如下:

(1) 针对历史光伏功率数据,选取合适的序列长度进行CEEMDAN分解,使得每次分解均能得到相同数量的HIMF分量.

(2) 分析既有的地面辐射、气象要素观测数据及计算的天文数据,选取具有时序特征的数据作为时序特征量,其余特征量为随机特征量.计算各HIMF分量与时序特征量的皮尔逊相关系数(ρ).根据经验,若两组数据之间的皮尔逊相关系数的绝对值大于0.3,则称这两组数据存在相关性[24],因此将与时序特征量相关系数绝对值大于0.3的HIMF分量定义为时序分量,其他分量定义为随机分量.

(3) 在时序分量和随机分量中各取一部分作训练,利用GSA对LSTM及SVR进行超参数优化.

(4) 使用经过GSA优化的LSTM和SVR模型对时序分量和随机分量进行预测,将所得结果相加即为点预测环节结果.

2.2 区间预测环节

区间预测环节是模型的后续环节,如图3右半部分所示,主要目的是结合点预测结果分析误差区间并利用Johnson变换进行正态分布建模,最终得到未来3 d内不同置信度下的光伏功率波动区间,流程如下.

(1) 计算点预测结果与真实值的误差,统计其分布情况.

(2) 按第1天、第2天和第3天将未来3 d内的预测误差分成3部分.

(3) 对3部分误差值进行Johnson变换,使变换后的误差符合正态分布.

(4) 结合正态分布的累计分布函数,经过Johnson逆变换,得到在不同置信度下的误差分布范围,从而得到光伏功率波动区间.

3 算例分析

3.1 数据来源及评价指标

算例中使用的地面辐射观测数据及常规气象要素观测数据均来自国家气象信息中心,同期历史光伏出力数据来自武汉某并网光伏电站,所有数据均经过高质量的数据清洗和归一化处理,剔除异常数据,可信度高.

算例中地面辐射观测数据及气象要素观测数据选取每日8:00—18:00的有效数据,每小时采样一次,每日共有11个采样点,共660个采样日,其中前600个采样日为训练集,后60个采样日为测试集,目标实现对未来3 d的功率数据预测.

算例中衡量点预测结果的评价指标采用归一化均方根误差和对称平均绝对百分比误差,分别记为eNeS.衡量区间预测结果的评价指标选用预测区间平均宽度(Prediction Interval Normalized Average, PINAW)和预测区间覆盖率(Prediction Interval Coverage Probability, PICP),分别记为QPINAWQPICP.表示为

eN=1N's=1N'(Pf,s-Po,s)21N's=1N'Po,seS=1N's=1N'|Po,s-Pf,s|(|Po,s|+|Pf,s|)/2QPINAW=1N's=1N'Us-Lsymax-yminQPICP=1N's=1N'κs 

式中:Pf为预测值;Po为实际值;LsUs分别为第s个样本下、上边界值;ymaxymin分别为目标值的最大值和最小值,可以保证QPINAW归一化在[0,1]内;κs为二进制变量,若实际功率包含于所构建的预测区间内,其值为1,否则为0.

3.2 时序分量和随机分量

在历史光伏出力数据中任意选取连续的5组数据进行CEEMDAN分解,每组数据均有77个采样点,结果均得到HIMF1~HIMF7共7组HIMF分量.

算例中地面辐射、常规气象要素观测数据及经过计算的天文数据有气压、温度、相对湿度、过去1 h降水量、10 min内平均风速、10 min内平均能见度、总云量、赤纬角、时角、修正清晰度指数k'T、大气层上界水平面总辐射I0、水平面总辐射I、水平面直接辐射Ib、法向直射辐射Ion、日照百分率.其中,赤纬角是地球赤道平面与太阳和地球中心连线的夹角,它的变化反映出不同季节的变化.时角是天子午圈与天体的赤经圈在北极所成的球面角,增长速率为15°/h,它的变化反映出1 d内时间的变化.I0指地球大气层外接收到的太阳辐射量,具有很强的时序特征[25].修正清晰度指数k'T表示大气的透明程度,与太阳在天空中的位置密切相关[26].因此,将赤纬角、时角、大气层上界水平面总辐射I0、修正清晰度指数k'T定义为时序特征量,其他特征量定义为随机特征量.

分别计算每组光伏出力数据的7个HIMF分量与其相对应的赤纬角、时角、I0k'Tρ,将与时序特征量存在相关性的HIMF分量定义为时序分量,其余分量定义为随机分量.

图4所示,HIMF4HIMF5HIMF6与4个时序特征量的相关系数绝对值均小于0.3,可以认为不存在相关性.因此,在算例中,将HIMF1HIMF2HIMF3HIMF7定义为时序分量,将HIMF4HIMF5HIMF6定义为随机分量.

图4

图4   IMF分量与各时序特征量相关性示意图

Fig.4   Diagram of correlation between IMFs and time series characteristic quantities


3.3 基于GSA的超参数优化

超参数设置对神经网络和机器学习的结果影响很大,针对不同气象环境特征,超参数应当相应作出调整.在算例中,对于LSTM中神经元个数mrL和SVR中的惩罚参数C、核函数参数g,选取前100 d内的特征量及其对应时序分量或随机分量训练,个体适应度选取为预测值与真实值的eS,迭代次数取200,利用GSA算法进行优化,具体流程如图5所示.

图5

图5   GSA优化流程图

Fig.5   Flow chart of GSA optimization


LSTM网络模型由一个输入层、一个隐藏层和一个输出层构成.采用Adam算法作为网络求解器,激活函数使用tanh函数,为保证平稳收敛,学习率衰减率设置为0.8.SVR网络模型采用径向基函数作为核函数, 结果进行五折交叉验证.

经过迭代之后,LSTM个体最优适应度停留在13.6%,学习率最终保持在0.0013,神经元个数m最终稳定在8个;SVR个体最优适应度停留在11.9%;惩罚参数C最终保持在87,核函数参数g最终稳定在0.018.

3.4 点预测结论及算法适应性分析

选用前文中超参数对LSTM网络进行训练,实现对4个时序分量的预测.表2是预测结果和未经优化的LSTM网络、BP神经网络和SVR算法在3次不同天气情况中的预测性能对比.由表可见,在针对时序分量的预测环节中,LSTM相较于BP神经网络和SVR有更低的eNeS,更具优势.对比GSA优化前后的LSTM预测评价指标, LSTM网络在经过GSA的优化后呈现出更好的性能,eN平均降低11.7%,eS平均降低16.2%.

表2   时序分量预测性能对比

Tab.2  Comparison of prediction performance of time series components

天气分量GSA-LSTMLSTMBPSVR
eS/%eN/%eS/%eN/%eS/%eN/%eS/%eN/%
晴天HIMF120.33.727.54.854.415.050.513.2
晴天HIMF221.43.526.35.252.314.349.414.5
晴天HIMF318.72.621.93.747.212.148.813.6
晴天HIMF718.22.119.93.648.19.941.010.3
转折HIMF147.010.159.514.794.444.289.242.7
转折HIMF239.29.760.315.694.643.187.642.0
转折HIMF335.46.452.012.388.738.588.736.3
转折HIMF729.15.552.313.383.340.382.136.9
阴雨HIMF145.513.270.644.0110.555.5100.357.2
阴雨HIMF240.312.165.542.5103.252.497.051.4
阴雨HIMF341.210.171.335.499.943.692.340.2
阴雨HIMF738.97.862.232.1101.244.290.141.1

新窗口打开| 下载CSV


同样选用前文中参数进行SVR建模,实现对3个随机分量的预测.表3是其预测结果和未经优化的SVR、BP神经网络和LSTM网络在3次预测中的性能对比.由表可见,在针对随机分量的预测环节中,SVR比BP神经网络和LSTM神经网络有更低的eNeS,能够取得更好的效果.对比GSA优化前后的SVR预测评价指标,SVR算法在经过GSA的优化后呈现出更好的性能,eN平均降低3.4%,eS平均降低6.6%.

表3   随机分量预测性能对比

Tab.3  Comparison of prediction performance of random components

天气分量GSA-SVRLSTMBPSVR
eS/%eN/%eS/%eN/%eS/%eN/%eS/%eN/%
晴天HIMF425.77.139.010.542.310.036.29.2
晴天HIMF524.36.838.710.737.09.627.99.8
晴天HIMF622.45.632.28.831.18.430.28.0
转折HIMF460.017.575.434.786.335.467.822.3
转折HIMF557.120.369.732.883.334.962.424.6
转折HIMF650.915.475.230.975.131.655.318.7
阴雨HIMF462.420.587.342.499.945.469.422.9
阴雨HIMF556.219.689.040.097.141.064.427.1
阴雨HIMF654.818.783.534.989.035.759.921.0

新窗口打开| 下载CSV


将LSTM神经网络与SVR算法所得预测结果相加,即可得 CEEMDAN-GSA-LSTM和SVR模型点预测结果.表4是所提模型与EMD-GSA-LSTM模型、EMD-GSA-SVR模型、实时误差修正的XGboost模型和CNN-LSTM模型的预测效果对比.

表4   点预测结果性能对比

Tab.4  Comparison of point prediction performance

天气CEEMDAN-GSA-LSTM
和SVR
EMD-GSA-LSTMEMD-GSA-SVRXGBoost-RCCNN-LSTM
eS/%eN/%eS/%eN/%eS/%eN/%eS/%eN/%eS/%eN/%
晴天22.83.729.65.038.69.130.14.524.29.1
转折40.09.161.816.064.122.247.121.255.410.1
阴雨48.514.678.440.363.026.254.732.550.719.6

新窗口打开| 下载CSV


图6是表中几种预测模型的预测曲线与实际值的对比.图中:Pac为交流功率.从表4图6(a)中可以看出,在连续晴天、无气象条件突变的情况下,几种预测模型均具有良好的预测精度.相比较而言,所提模型eNeS更小,预测效果更佳.结合图6(b)可以看出,在气象条件出现突变的转折天气情况下,光伏功率出力会发生较大波动,与连续晴天相比,各模型预测结果的eNeS均有升高,预测精度均有下降.但在各预测模型中,所提模型的eNeS保持最小,依然取得最好的预测效果.由图6(c)可以看出,在连续阴雨天气情况下,各模型的预测精度与晴天相比均大幅度降低,但所提模型的eNeS相较而言保持最小,取得良好的预测效果.

图6

图6   各模型点预测结果对比图

Fig.6   Comparison of prediction results of different models


为了确保CEEMDAN-GSA-LSTM和SVR点预测模型具有良好的鲁棒性,设计一种算法适应性实验,在历史光伏出力数据出现异常错误的情况下验证算法准确性.为了模拟最恶劣的情况,沿用上文中连续阴雨天气下的情况进行试验,将77个历史光伏出力数据中的某些数据替换为异常数据后,再重新测试,实验所使用的历史光伏出力数据如图7所示,其中异常数据D1、D2是将第1~22个历史光伏出力数据替换为时序性数据和随机性数据的数据集合,异常数据D3、D4是将1~77个历史光伏处理数据全部替换为时序性数据和随机性数据的数据集合.

图7

图7   五组光伏出力数据

Fig.7   Output data of five sets of PV


表5是在地面辐射、常规气象要素观测数据及经过计算的天文数据不变的情况下,仅改变原始历史数据时得到的适应性分析结果对比.可以看出,当原始数据出现异常错误时,各模型的预测精度都将下降,当原始数据完全不能对应时,预测精度达到最差.当出现各种类型的异常值错误时,与单独的LSTM和SVR相比,所提使用LSTM预测时序分量、使用SVR预测随机分量的方法预测精度更高,适应性更好.

表5   适应性分析结果对比

Tab.5  Comparison of adaptive analysis results

数据组别CEEMDAN-GSA-LSTM和SVREMD-GSA-LSTMEMD-GSA-SVR
eS/%eN/%eS/%eN/%eS/%eN/%
原始历史数据48.514.678.440.363.026.2
D172.336.594.448.485.839.2
D273.438.998.953.391.157.1
D3203.5250.4200.4287.5241.1329.9
D4212.3233.9240.1298.8242.9310.5

新窗口打开| 下载CSV


整体来看,在各种气象条件和数据条件下,CEEMDAN-GSA-LSTM和SVR均能保持较好的预测性能,整体模型表现出较高的鲁棒性.

3.5 区间预测及其结论分析

使用CEEMDAN-GSA-LSTM和SVR模型对测试集前40个采样日的光伏出力以滑动窗口模式进行点预测,计算每个时刻的预测值与实际光伏出力的绝对误差ε.在点预测中,3个采样日内的预测精度呈现出递减趋势,因此,在区间预测过程中按照时间先后分类预测可以达到更好的效果.

图8是40个采样日内共 1 254 个时刻的绝对误差的频率直方图,由图可见ε呈钟形分布,有一定的偏度特性.对ε进行Anderson-Darling正态性检验,得到P值小于0.05,不满足正态分布特征,正态分布不能有效地反映ε的整体分布情况.

图8

图8   ε的频率直方图

Fig.8   Frequency histogram of ε


按第1、第2、第3个采样日将 1 254 个时刻的ε值分为3部分,每部分均有418个ε值,分别代表每次预测中第1~11,第12~22,第13~33个时刻的ε的集合,记为ε1ε2ε3.

分别对ε1ε2ε3作Anderson-Darling正态性检验,得到P值均小于0.05, 不满足正态分布特征,为了使其呈正态分布,对ε1ε2ε3进行Johnson变换,得到ε'1ε'2ε'3.

图9ε1ε2ε3进行Johnson变换前后的概率图,图中数据点越贴近正态分布的拟合曲线说明该数据越服从正态分布.由图可见,经过Johnson变换后,ε'1ε'2ε'3更贴近曲线,对ε'1ε'2ε'3进行正态性检验,结果中的P值均大于0.05,满足正态分布特征,可以认为符合正态分布.

图9

图9   Johnson变换前后概率图对比

Fig.9   Comparison of probability graphs before and after Johnson transformation


利用正态分布分析ε'1ε'2ε'3在不同置信水平下的置信区间,经过Johnson逆变换后得到对应的绝对误差范围,在点预测结果上叠加相应的绝对误差范围,得到区间预测结果.

图10是所提区间预测方法在不同置信水平下的预测效果,表6是其对应的误差指标.由图10表6可见,在不同天气条件下,预测对象基本能够落入95%置信水平所在区间内,当置信水平取40%时,连续阴雨天气下已经有超过50%的预测对象处于区间外.综合评价来看,在实际预测中,置信水平取80%~95%时,QPICP可以达到90%以上,能够取得较好效果.

图10

图10   区间预测结果

Fig.10   Results of interval prediction


表6   不同置信水平下区间预测性能

Tab.6  Interval prediction performance at different confidence coefficients

置信
水平/
%
晴天转折阴雨
QPICPQPINAWQPICPQPINAWQPICPQPINAW
951.00000.13070.96970.23930.93940.2238
800.93940.09840.93940.18760.90910.1733
600.84850.07030.81820.13820.69700.1282
400.63640.04600.63640.09230.48480.0864

新窗口打开| 下载CSV


表7是所提区间预测方法和其他3种方法在95%置信水平不同天气条件下的预测结果.由表可见,在相同天气条件下,直接进行正态分布建模和logistic分布建模的方法与所提Johnson变换-正态分布建模的方法相比,QPINAW偏大,QPICP偏小.KDE作为当下较为流行的非参数估计方法,在3种天气条件下,QPICP均能达到93%以上,但它的QPINAW略大于所提区间预测方法,预测效果略劣于所提区间预测方法.

表7   区间预测结果性能对比

Tab.7  Comparison of interval prediction performance

天气Johnson变换-正态分布正态分布logistic分布KDE
QPICPQPINAWQPICPQPINAWQPICPQPINAWQPICPQPINAW
晴天1.00000.13070.96970.20221.00000.22341.00000.1988
转折0.96970.23930.93940.33750.93940.32570.96970.3028
阴雨0.93940.22380.87880.34520.90910.35320.93940.2961

新窗口打开| 下载CSV


4 结论

为进一步完善光伏电站的消纳统计工作,针对光伏输出功率存在的间歇性和波动性问题,提出一种基于CEEMDAN-GSA-LSTM和SVR的光伏功率短期区间预测模型.经过算例分析,可以看出该模型具有以下优势:

(1) 兼顾气象环境因素的时序性和随机性,在各种天气下均能得到较好的预测结果.

(2) 本模型参数并非固定,可以根据当地气象环境数据进行本地化修正.

(3) 相比于其他模型,本模型点预测精度更高,预测效果有所提升.

(4) 给出较为精准的预测区间,解决了传统点预测难以量化光伏发电中不确定性的问题.

参考文献

国家发展改革会, 国家能源局.

关于促进新时代新能源高质量发展的实施方案

[EB/OL].(2022-05-30)[2022-05-30]. http://zfxxgk.nea.gov.cn/2022-05/30/c_1310608539.htm.

URL     [本文引用: 1]

National Development and Reform Commission, National Energy Administration.

The implementation plan for promoting the high-quality development of new energy in a new era

[EB/OL].(2022-05-30)[2022-05-30]. http://zfxxgk.nea.gov.cn/2022-05/30/c_1310608539.htm.

URL     [本文引用: 1]

张雲钦, 程起泽, 蒋文杰, .

基于EMD-PCA-LSTM的光伏功率预测模型

[J]. 太阳能学报, 2021, 42(9): 62-69.

[本文引用: 1]

ZHANG Yunqin, CHENG Qize, JIANG Wenjie, et al.

Photovoltaic power prediction model based on EMD-PCA-LSTM

[J]. Acta Energiae Solaris Sinica, 2021, 42(9): 62-69.

[本文引用: 1]

叶林, 马明顺, 靳晶新, .

考虑风电-光伏功率相关性的因子分析-极限学习机聚合方法

[J]. 电力系统自动化, 2021, 45(23): 31-40.

[本文引用: 1]

YE Lin, MA Mingshun, JIN Jingxin, et al.

Factor analysis-extreme learning machine aggregation method considering correlation of wind power and photovoltaic power

[J]. Automation of Electric Power Systems, 2021, 45(23): 31-40.

[本文引用: 1]

黎嘉明, 艾小猛, 文劲宇, .

光伏发电功率持续时间特性的概率分布定量分析

[J]. 电力系统自动化, 2017, 41(6): 30-36.

[本文引用: 1]

LI Jiaming, AI Xiaomeng, WEN Jinyu, et al.

Quantitative analysis of probability distribution for duration time characteristic of photovoltaic power

[J]. Automation of Electric Power Systems, 2017, 41(6): 30-36.

[本文引用: 1]

李芬, 周尔畅, 孙改平, .

一种新型天气分型方法及其在光伏功率预测中的应用

[J]. 上海交通大学学报, 2021, 55(12): 1510-1519.

DOI:10.16183/j.cnki.jsjtu.2021.264      [本文引用: 1]

为提高光伏功率预测准确率提出了一种新的天气分型方法,该方法首先按总云量大小区分晴天和云天,然后根据太阳被遮蔽的程度将云天进一步细分为三类.该方法能有效识别影响光伏出力的关键气象环境因子特征,并对其加权求和得到新型分类指标Sky Condition Factor(SCF).该方法物理意义明确,区分度较好且易于量化.对天气类型合理细分后,可消除众多气象环境因子之间的耦合关系,降低输入变量维度,易于统计建模.最后分别基于原理和统计方法进行建模验证,结果显示该方法可以有效提高光伏功率预测的准确率.

LI Fen, ZHOU Erchang, SUN Gaiping, et al.

A novel weather classification method and its application in photovoltaic power prediction

[J]. Journal of Shanghai Jiao Tong University, 2021, 55(12): 1510-1519.

[本文引用: 1]

唐雅洁, 林达, 倪筹帷, .

基于XGBoost的双层协同实时校正超短期光伏预测

[J]. 电力系统自动化, 2021, 45(7): 18-27.

[本文引用: 1]

TANG Yajie, LIN Da, NI Chouwei, et al.

XGBoost based Bi-layer collaborative real-time calibration for ultra-short-term photovoltaic prediction

[J]. Automation of Electric Power Systems, 2021, 45(7): 18-27.

[本文引用: 1]

AGGA A, ABBOU A, LABBADI M, et al.

CNN-LSTM: An efficient hybrid deep learning architecture for predicting short-term photovoltaic power production

[J]. Electric Power Systems Research, 2022, 208: 107908.

[本文引用: 1]

万灿, 崔文康, 宋永华.

新能源电力系统概率预测:基本概念与数学原理

[J]. 中国电机工程学报, 2021, 41(19): 6493-6509.

[本文引用: 1]

WAN Can, CUI Wenkang, SONG Yonghua.

Probabilistic forecasting for power systems with renewable energy sources: Basic concepts and mathematical principles

[J]. Proceedings of the CSEE, 2021, 41(19): 6493-6509.

[本文引用: 1]

黎敏, 林湘宁, 张哲原, .

超短期光伏出力区间预测算法及其应用

[J]. 电力系统自动化, 2019, 43(3): 10-16.

[本文引用: 1]

LI Min, LIN Xiangning, ZHANG Zheyuan, et al.

Interval prediction algorithm for ultra-short-term photovoltaic output and its Application

[J]. Automation of Electric Power Systems, 2019, 43(3): 10-16.

[本文引用: 1]

杨茂, 王凯旋.

基于CEEMD-DBN模型的光伏出力日前区间预测

[J]. 高电压技术, 2021, 47(4): 1156-1164.

[本文引用: 1]

YANG Mao, WANG Kaixuan.

Day-ahead interval forecasting of PV power based on CEEMD-DBN model

[J]. High Voltage Engineering, 2021, 47(4): 1156-1164.

[本文引用: 1]

茆美琴, 龚文剑, 张榴晨, .

基于EEMD-SVM方法的光伏电站短期出力预测

[J]. 中国电机工程学报, 2013, 33(34): 17-24.

[本文引用: 1]

MAO Meiqin, GONG Wenjian, ZHANG Liuchen, et al.

Short-term photovoltaic generation forecasting based on EEMD-SVM combined method

[J]. Proceedings of the CSEE, 2013, 33(34): 17-24.

[本文引用: 1]

ZHANG C, HUA L, JI C L, et al.

An evolutionary robust solar radiation prediction model based on WT-CEEMDAN and IASO-optimized outlier robust extreme learning machine

[J]. Applied Energy, 2022, 322: 119518.

[本文引用: 1]

RASHEDI E, NEZAMABADI-POUR H, SARYAZDI S.

GSA: A gravitational search algorithm

[J]. Information Sciences, 2009, 179(13): 2232-2248.

[本文引用: 1]

ALI KHAN T, LING S H.

A novel hybrid gravitational search particle swarm optimization algorithm

[J]. Engineering Applications of Artificial Intelligence, 2021, 102: 104263.

[本文引用: 1]

杨晶显, 张帅, 刘继春, .

基于VMD和双重注意力机制LSTM的短期光伏功率预测

[J]. 电力系统自动化, 2021, 45(3): 174-182.

[本文引用: 1]

YANG Jingxian, ZHANG Shuai, LIU Jichun, et al.

Short-term photovoltaic power prediction based on variational mode decomposition and long shortterm memory with dual-stage attention mechanism

[J]. Automation of Electric Power Systems, 2021, 45(3): 174-182.

[本文引用: 1]

苏向敬, 周汶鑫, 李超杰, .

基于双重注意力LSTM神经网络的可解释海上风电出力预测

[J]. 电力系统自动化, 2022, 46(7): 141-151.

[本文引用: 1]

SU Xiangjing, ZHOU Wenxin, LI Chaojie, et al.

Interpretable offshore wind power output forecasting based on long short-term memory neural network with dual-stage attention

[J]. Automation of Electric Power Systems, 2022, 46(7): 141-151.

[本文引用: 1]

LIU R H, WEI J C, SUN G P, et al.

A short-term probabilistic photovoltaic power prediction method based on feature selection and improved LSTM neural network

[J]. Electric Power Systems Research, 2022, 210: 108069.

[本文引用: 1]

LI J L, SONG Z H, WANG X F, et al.

A novel offshore wind farm typhoon wind speed prediction model based on PSO-Bi-LSTM improved by VMD

[J]. Energy, 2022, 251: 123848.

[本文引用: 1]

董春曦, 饶鲜, 杨绍全, .

支持向量机参数选择方法研究

[J]. 系统工程与电子技术, 2004, 26(8): 1117-1120.

[本文引用: 1]

DONG Chunxi, RAO Xian, YANG Shaoquan, et al.

Method for selecting the parameters of support vector machines

[J]. Systems Engineering & Electronics, 2004, 26(8): 1117-1120.

[本文引用: 1]

徐浩, 姜新雄, 刘志成, .

基于概率预测的电网静态安全运行风险评估及主动调控策略

[J]. 电力系统自动化, 2022, 46(1): 182-191.

[本文引用: 1]

XU Hao, JIANG Xinxiong, LIU Zhicheng, et al.

Probability prediction based risk assessment and proactive regulation and control strategy for static operation safety of power grid

[J]. Automation of Electric Power Systems, 2022, 46(1): 182-191.

[本文引用: 1]

WANG H L, XU D X, MARTINEZ A.

Parameter selection method for support vector machine based on adaptive fusion of multiple kernel functions and its application in fault diagnosis

[J]. Neural Computing & Applications, 2020, 32(1): 183-193.

[本文引用: 1]

SLIFKER J F, SHAPIRO S S.

The Johnson system: Selection and parameter estimation

[J]. Technometrics, 1980, 22(2): 239-246.

[本文引用: 1]

HE Y Y, ZHENG Y Y.

Short-term power load probability density forecasting based on Yeo-Johnson transformation quantile regression and Gaussian kernel function

[J]. Energy, 2018, 154: 143-156.

[本文引用: 1]

汪冬华. 多元统计分析与SPSS应用[M]. 上海: 华东理工大学出版社, 2010.

[本文引用: 1]

WANG Donghua. Multivariate statistical analysis and SPSS application[M]. Shanghai: East China University of Science and Technology Press, 2010.

[本文引用: 1]

LI F, LIN Y L, GUO J P, et al.

Novel models to estimate hourly diffuse radiation fraction for global radiation based on weather type classification

[J]. Renewable Energy, 2020, 157: 1222-1232.

[本文引用: 1]

DEMAIN C, JOURNÉE M, BERTRAND C.

Evaluation of different models to estimate the global solar radiation on inclined surfaces

[J]. Renewable Energy, 2013, 50: 710-721.

[本文引用: 1]

/