上海交通大学学报(自然版), 2021, 55(12): 1520-1531 doi: 10.16183/j.cnki.jsjtu.2021.244

新能源电力系统中的分布式光伏净负荷预测

廖启术1, 胡维昊,1, 曹迪1, 黄琦1,2, 陈哲3

1.电子科技大学 机械与电气工程学院, 成都 611731

2.成都理工大学 核技术与自动化工程学院,成都 610051

3.奥尔堡大学 能源系, 奥尔堡 DK-9110,丹麦

Distributed Photovoltaic Net Load Forecasting in New Energy Power Systems

LIAO Qishu1, HU Weihao,1, CAO Di1, HUANG Qi1,2, CHEN Zhe3

1. School of Mechanical and Electrical Engineering, University of Electronic Science and Technology of China, Chengdu 611731, China

2. College of Nuclear Technology and Automation Engineering, Chengdu University of Technology, Chengdu 610051, China

3. Department of Energy Technology, Aalborg University, Aalborg DK-9110, Denmark

通讯作者: 胡维昊,男,教授,博士生导师;E-mail:whu@uestc.edu.cn.

责任编辑: 石易文

收稿日期: 2021-07-7  

基金资助: 廖启术(1998-),男,湖南省益阳市人,硕士生,主要从事可再生能源负荷和发电预测研究.

Received: 2021-07-7  

摘要

为响应碳达峰、碳中和的需求,构建一套完整的“源-网-荷-储”的新能源电力系统,提出了一种基于Hamiltonian Monte Carlo推断深度高斯过程(HMCDGP)算法的分布式光伏净负荷预测模型.首先,分别使用直接预测和间接预测两种形式对预测模型的精度进行实验并得到点预测结果;其次,使用所提出的模型进行概率预测实验并得到区间预测结果;最后,通过以澳洲电网记录的300户净负荷数据为基础的对比实验验证所提模型的优越性.在得到准确的净负荷概率预测后,可以通过电力调度充分利用光伏产出,减少化石能源使用,从而减少碳排放.

关键词: 净负荷概率预测; 光伏产出; 深度高斯过程; 点预测; 区间预测

Abstract

To respond to the demand of achieving carbon peaking and carbon neutrality goals, and to construct a complete “source-grid-load-storage” new energy power system, a distributed photovoltaic net load forecasting model based on Hamiltonian Monte Carlo inference for deep Gaussian processes (HMCDGP) is proposed. First, direct and indirect forecasting methods are used to examine the accuracy of the proposed model and to obtain spot forecasting results. Then, the proposed model is used to perform probability forecasting experiments and produce interval prediction results. Finally, the superiority of the proposed model is verified through the comparative experiments based on the net load data of 300 households recorded by Australia Grid. After obtaining the exact net load probabilistic forecasting results, the photovoltaic production can be fully utilized via power dispatch, which can reduce the use of fossil energy and further reduce the carbon emission.

Keywords: net load forecasting; photovoltaic production; deep Gaussian process; point forecasting; interval prediction

PDF (69168KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

廖启术, 胡维昊, 曹迪, 黄琦, 陈哲. 新能源电力系统中的分布式光伏净负荷预测[J]. 上海交通大学学报(自然版), 2021, 55(12): 1520-1531 doi:10.16183/j.cnki.jsjtu.2021.244

LIAO Qishu, HU Weihao, CAO Di, HUANG Qi, CHEN Zhe. Distributed Photovoltaic Net Load Forecasting in New Energy Power Systems[J]. Journal of shanghai Jiaotong University, 2021, 55(12): 1520-1531 doi:10.16183/j.cnki.jsjtu.2021.244

中国在2020年向世界做出承诺:“二氧化碳排放力争2030年前达到峰值,努力争取2060年前实现碳中和”.实现碳达峰和碳中和目标最大的挑战是当前中国能源结构中化石能源消耗占比过高,因此,将化石能源最大限度淘汰并提升新能源的地位至关重要.在未来低碳化电力系统中,分布式新能源发电将是最重要的一部分.其中,太阳能是最具开发潜力的新能源之一[1],光伏发电是一种主要的新能源发电方式.在以新能源为主的新型电力系统中,一套协调发展的“源-网-荷-储”系统是不可缺少的.净负荷指的是微电网内电力消耗和电力产出的差值,等价于负荷端与电网之间的交换负荷, 是“源-网-荷-储”中关键的一环.在当前的电力系统中,净负荷预测可以为电力调度提供依据,最大限度地利用微网内部新能源的产出,减少化石能源的使用,从而减少碳排放.在未来的新能源电力系统中,净负荷预测可以起到监测电力系统的作用,对维持电力系统稳定具有重要作用.光伏发电受气象因素影响具有很高的不确定性和波动性,这给净负荷预测带来很大的干扰,因此,一种准确的净负荷预测方法是不可缺少的.在过去的100多年里,负荷预测指的主要是负荷点预测(确定性预测),即对每个时间点给出一个确定性的预测值.然而随着市场竞争加剧、基础设施老化、新能源发电并网,负荷概率预测对于电力系统的规划和调度越来越重要.同理,净负荷概率预测对于区域电力系统也尤为重要.

目前,国内外已经有大量针对电力系统负荷预测的研究,其中,传统的点预测方法有线性回归[2]、神经网络[3,4,5]、支持向量机[6]、长短期记忆网络[7]等.由于点预测只能给出一个确定的预测值而无法对负荷的不确定性进行度量,所以负荷概率预测逐渐成为热点,概率预测的形式一般有区间预测和概率密度预测[8].文献[9,10,11,12,13]使用了分位数回归(QR)来进行负荷概率预测.文献[9]利用各种姐妹模型的点预测结果来辅助分位数回归实现了区间预测.文献[10]利用神经网络分位数回归实现了概率密度预测.文献[11]将深度学习算法与分位数回归理论相结合,通过分析多种天气因素与短期负荷的相关性强弱,实现了对短期负荷的概率密度预测.文献[12]提出了支持向量分位数回归预测模型,对短期电力负荷进行了概率密度预测.文献[13]使用将径向基函数神经网络与分位数回归相结合的一种负荷概率密度预测方法,实现了短期负荷概率密度函数预测.

不同于负荷预测,净负荷由于规模小、规律弱而难以预测,所以关于净负荷预测的研究比较少.净负荷是微网内部电力消耗和产出的差值,因此净负荷预测的背景一般为含分布式能源如风电、水电或光电等区域.其中点预测方法有:文献[14]使用了一种基于深度神经网络和小波变换集成的新型电力净负荷预测模型,提高了净负荷预测精度.概率预测方法有:文献[15]结合反向传播神经网络算法与分位数回归模型, 并利用核密度估计算法计算得到了月最大净负荷概率分布预测;文献[16]使用Bayesian深度学习来同时捕捉模型不确定性和随机不确定性,在净负荷预测中取得了较好的效果.

随着概率预测需求不断提升,高斯过程回归(GPR)在负荷预测和净负荷预测领域也已取得一些进展.文献[17]提出一种改进的高斯过程(GP)回归算法,并结合基于K-means特征提取方法对模型输入变量进行选择以对负荷进行区间预测.文献[18]采用模糊C-均值聚类算法构建样本集,并结合改进高斯过程回归对短期负荷进行区间预测.文献[19]以高斯过程回归为基础,利用混沌粒子群算法对饱和负荷的不确定性进行建模并实现了有效的概率区间预测.文献[20]分别使用了一种动态高斯过程和分位数回归来实现净负荷预测,并详细记录了两种方法的实验结果.

GPR的预测效果很大程度上取决于基于人为经验选择的核函数,且在标准高斯过程回归中涉及到大量矩阵的逆运算,因此这种方法不适合大规模数据下的回归分析.深度高斯过程(DGP)通过将多个高斯过程堆叠,结合GP的灵活性以及深度结构的适应性,将输入空间的拉伸和压缩变换为一个具有自调节能力的核函数.DGP可以将GP中核函数的设计这个繁琐的过程转化成自身参数和层数的调节过程,以避免手动设计核函数过程中人为干预造成的影响.

为了弥补GPR存在的缺陷,本文提出了一种基于Hamiltonian Monte Carlo推断深度高斯过程[21]的分布式光伏净负荷概率预测模型,该模型能够捕捉净负荷的不确定性,为电力决策提供可靠的概率依据.另外,以智能电表记录数据为基础提出了直接预测和间接预测两种预测形式,并通过实验验证了两种预测形式的可行性.最后,与其余几种表现优异的预测方法进行了对比.从点预测和概率预测两个方面对这些方法的预测结果进行了全面的评估,证明了所提方法的优越性,并得到了可靠的区间预测结果.本文研究在得到可靠的净负荷预测后,可以通过电力调度充分利用光伏产出,减少化石能源使用,为碳达峰、碳中和提供理论基础.

1 算法理论介绍

1.1 高斯过程

1.1.1 标准高斯过程回归 在净负荷预测中,按时间顺序将每个时刻的净负荷排序可得到 {Jt}.在预测第t时刻的净负荷时,将该时刻前的一部分历史净负荷数据和其他信息结合构成输入特征信息,通过寻找输入信息到该时刻净负荷之间的映射关系来达到预测效果.其中,点预测的映射关系可看作函数关系,概率预测的映射关系可以看作概率分布函数.

假设有训练数据集为{X,Y}

X=[x1x2xN]TY=[y1y2yN]T

为训练特征数据(输入)和其标签(输出); N为训练集数据总数.则有:

Y=g(X)+ε

式中:ε为高斯白噪声;g(X)为输入映射到输出的高斯过程.则有:

ε~N0,σn2I
g(X)~GP(m(X),K(X,X))

式中: σn2为高斯噪声的方差;I为N维单位矩阵;此处g(X)为均值为m(X)(一般取零均值)、协方差函数矩阵(核函数矩阵)为K(X,X)的高斯过程.

先验分布可以表示为

p(Y|X)=N(0,K(X,X)+σn2I)

当有新的测试点x*输入时通过GP可以得到预测值g(x*),训练样本(含噪声)与测试样本(无噪声)关系为

Yg(x*)~ N00,K(X,X)+σn2IK(X,x*)K(x*,X)K(x*,x*)

式中:K(X,x*)和K(x*,X)为训练集输入和测试点之间的协方差矩阵,分别为N×1和1×N维;K(x*,x*)为测试点的协方差.具体可以表示为

K(X,X)=  k(x1,x1)k(x1,x2)k(x1,xN)k(xN,x1)k(xN,x2)k(xN,xN)K(X,x*)=k(x1,x*)k(x2,x*)k(xN,x*)K(x*,X)=  k(x*,x1)k(x*,x2)k(x*,xN)K(x*,x*)=k(x*,x*)

式中:各个协方差矩阵中的元素k(·)可以表示为(以xi 和xj 表示k(·)中的两个输入):

k(xi,xj)=σard2exp-12(xi-xj)2

式中:σard为协方差参数.

在输入训练数据后的后验分布g(x*)为

g(x*)|Y;X,x*~N(g-(x*),cov(g(x*)))
g-(x*)=K(x*,X)(K(X,X)+σn2I)-1Y
cov(g(x*))=K(x*,x*)- K(x*,X)(K(X,X)+σn2I)-1K(X,x*)

式中: g-(x*),cov(g(x*))为测试点的回归均值和方差.

1.1.2 标准高斯过程回归训练 高斯过程回归训练时通过基于梯度的极大边缘似然法找到使负对数边缘似然 -lgp(Y|X)最大的超参数来优化模型,即

θGP=argmaxθGP(-lgp(Y|X))

式中:θGP 为高斯过程回归模型的超参数,可以表示为 θGP=σard,σn.用极大边缘似然法优化的训练复杂度为O(N3),当训练集较大时,训练时间较长,不利于应用到大数据集场景.

1.1.3 稀疏高斯过程回归 为使高斯过程能在大样本背景下使用,一般采用稀疏高斯过程(SGP).通过引用M个辅助点(M≪N)来使训练复杂度降低到O(NM2).变分辅助变量近似方法通过引入M个辅助输入Z=[z1 z2…zM ]T 和对应的辅助输出u=[u1 u2…uM ]T 来近似原来的N维高斯过程.引入辅助变量后的联合概率分布为

p(Y,f,u;X,Z)=     p(Y|f)p(f,u;X,Z)

式中:p(Y|f)为似然;f为N维标准高斯过程无噪声的输出;p(f,u;X,Z)为联合高斯过程先验且能被分解为p(u)和p(f|u;X,Z).p(u)为先验分布,p(f|u;X,Z)为条件分布,则有:

p(u)=N(u|0,K(Z,Z))
p(f|u;X,Z)=N(f|K(X,Z)K(Z,Z)-1u,K(X,X)-K(X,Z)K(Z,Z)-1K(Z,X))

式中:K(X,X)、K(X,Z)、K(Z,X)、K(Z,Z)分别为N×N、N×M、M×N、M×M维核函数矩阵.引入变分后验分布q(u,f)=p(f|u)q(u),其中q(u)=N(μ,Σ).变分推断通过最小化变分后验q(u,f)和真实后验p(u,f)之间的Kullback-Leibler (KL)散度来优化参数(KL散度越小表明两种分布越接近),等价于最大化模型证据(ELBO)下界:

lgp(Y)Eq(u,f)lgp(Y,f,u)q(u,f)

式中:p(Y,f,u)由式(12)给出;E为数学期望.

高斯边缘似然为

q(f)=p(f|u)q(u)du=N(f|K(X,Z)K(Z,Z)-1u,K(X,X)+K(X,Z)×K(Z,Z)-1(Σ-K(Z,Z))K(Z,Z)-1K(Z,X))

ELBO化简后为

 lgp(Y)  Eq(f)lgp(Y|f)-Ω(q(u)||p(u))

式中:函数Ω(·)指KL散度函数.上式中各项皆为已知,可通过最大化ELBO来优化SGP模型超参数:θSGP={μ,Σ, Z, σard, σn},得到变分参数μΣ后,即可利用最优分布q(u)=N(μ, Σ)对新来的测试点x*进行预测.

1.2 随机梯度Hamiltonian Monte Carlo深度高斯过程

1.2.1 深度高斯过程 由于GP的核函数一般依赖于手动调整或者对数据集有较多的认知来进行选择,所以在没有足够的先验知识时对核函数的选择是有一定难度的.当把GP的模型推广到深度结构时,隐藏层通过拉升或扭曲输入空间在不需要人为调整的情况下,可以起到“自动调整”核函数的作用[22].两层的深度高斯过程如图1所示,由两层的SGP组合而成,其中: f1f2分别指第1层和第2层的SGP的无噪声输出; Z0Z1分别指第1层和第2层的稀疏辅助输入;u1 、u2 分别指第1层和第2层的稀疏辅助输出;g1 (·)、g2 (·)分别指第1层和第2层的SGP.

图1

图1   两层深度高斯过程结构图

Fig.1   Deep Gaussian process with two hidden layers


一个具有L层的深度高斯过程可以看作由L个SGP组成的深度结构模型,即 g1(·),g2(·),,gL(·).每个fl是前一层的输出和后一层的输入,即

gl(fl-1)=GP(0,Kl(fl-1,fl-1))

与稀疏高斯过程引入变分分布后求解边缘似然方法一样,引入变分分布:

  q({fl,ul}l=1L)=  l=1Lp(fl|ul;fl-1,Zl-1)q(ul)
qul=Nμl,Σl

式中,μlΣl分别为第l层的变分先验分布的均值和方差.

最后一层即输出层的边缘似然为

q(fL)=l=1L-1q(fl;fl-1,Zl-1)dfl

深度高斯过程的ELBO为

lgp(Y)=Eq(fL)lgp(Y|fL)-l=1LΩ[q(ul)||p(ul)]

通过基于梯度的优化算法即可优化所有的模型超参数,即

θDGP={{μl}l=1L,{Σl}l=1L,{Zl}l=0L-1,{σardl}l=1L,{σnl}l=1L}

得到最优的变分参数和模型超参数后,在测试阶段,输入新的测试点x*即可通过测试点的边缘分布得到回归值(q(f*L)为测试点的后验分布):

q(f*L)=l=1L-1q(f*l;f*l-1,Z*l-1)df*l

1.2.2 Hamiltonian Monte Carlo采样 在上述深度高斯过程中,通过变分推断找到真实后验分布 p(ul)的变分近似后验分布q(ul),且变分近似后验分布假设为高斯分布.实际中很多数据集的后验分布呈现非高斯分布[21],本文通过对后验分布进行采样来求取近似后验分布p(ul).与常见的拒绝采样、重要性采样和Markov Chain Monte Carlo(MCMC)采样等方法相比, Hamiltonian Monte Carlo(HMC)采样效率更高、更灵活且速度更快,因此本文采用HMC采样,随机梯度Hamiltonian Monte Carlo采样深度高斯过程伪代码如算法1所示.引入辅助变量r与待采样变量u组成联合分布p(u, r),构成一个能量守恒的动力学系统:

  p(u,r)exp-U(u)-12rTm-1rU(u)=-lgp(u)

式中: U(u)为势能;r为动能;m为质量矩阵.通过基于随机梯度的算法可以对动能和势能分别进行更新,从而寻找新的采样点:

Δu=γm-1rΔr=-γΔU(u)-γCm-1r+   N(0,2γ(C-B^))

式中:C为摩擦项; B^为假设的随机梯度模型噪声;γ为步长;m在对后验分布没有足够认识时一般取单位矩阵.在设置这些采样器参数时,使用文献[23]提到的自动调整方法.与深度高斯过程通过ELBO优化模型超参数和变分参数不同,本文使用Monte Carlo期望最大化来优化参数,即通过第1步从后验分布采样,第2步最大化采样样本和数据输出的平均对数联合概率分布来优化HMCDGP模型参数.

第1步:

u1,2,,S~p(u|X,θDGP)

第2步:

θDGP=argmaxθDGPQ(θDGP)
Q(θDGP)=1Ss=1Slgp(Y,us|θDGP)

式中:S为每次迭代采样的样本数;θDGP为 HMCDGP模型所有的超参数.

在迭代完成后,将采样获得的 p(ul)与优化后的模型超参数θDGP代入下式即可求得每层和输出层的边缘分布:

 p(fl;fl-1,Zl-1)=p(fl|ul)p(ul)dul
p(fL)=l=1Lp(fl;fl-1,Zl-1)dfl

算法1 HMCDGP训练与测试

输入 训练集(X, Y),测试点输入x*,后验采样数为S,训练次数为e

求解:模型超参数θDGP

输出 测试输出y*

(1) 训练过程开始

(2) 初始化所有模型参数;

(3) 初始化后验分布p(u);

(4) While 训练次数小于e

(5) MCME的第1步采样得到近似后验p(u'):

(6) 采样器参数通过随机梯度更新:

u=uu;

r=rr;

(7) MCME的第2步求模型超参数θDGP;

(8) 按式(30)求每层的边缘分布p(fl);

(9) end

(10) 训练过程结束

(11) 测试过程开始

(12) 训练过程优化好的参数θDGP代入模型;

(13) 求测试集近似后验分布p(u*);

(14) 按式(31)求输出层边缘分布p(f*L);

(15) 输出层边缘分布即为测试输出概率分布;

(16) 测试过程结束

在测试阶段,输入新的测试集x*即可通过测试点的边缘分布得到回归值:

p(f*L)=l=1L-1p(f*l;f*l-1,Z*l-1)df*l

2 模型框架和评估指标

2.1 模型框架

2.1.1 原始数据处理 本次实验数据来自澳洲电网发布的一份报告,报告记录了2011-07-01至2012-06-30期间300户装有可精确记录光伏发电智能电表居民区的真实数据[16],该居民区可以视为一个只含光伏新能源的微网.从报告中可以得到该居民区一年内每间隔0.5 h的原始电力消耗 F'、原始光伏产出P'、及原始净负荷J'.其中,三者关系为

J'=F'-P'

在本次实验中,由于得到的原始数据是300户居民各自的电力消耗和光伏产出,所以需要对原始数据进行整合,得到300户居民整体的电力消耗、光伏产出和净负荷数据,即新电力消耗 F、新光伏产出P以及新净负荷J.

2.1.2 提取输入特征 对3组新数据,分别进行历史特征提取并结合时间信息组成新的3组数据集{XF, YF}、{XP, YP}和{XJ, YJ}.

历史特征提取指针对t时刻的电力消耗F和净负荷J,选取2天前和1天前该时刻附近的负荷值做输入特征;针对光伏产出P选取1天前、2天前、3天前以及一周前该时刻的光伏产出值做输入特征.

时间信息指针对t时刻的负荷和光伏产出选取该时刻的小时、星期、月份信息为输入特征.值得注意的是,经过实验对比发现时间信息以独热编码方式输入效果最好,因此,后续实验时间信息都采用独热编码方式.

具体数据集如下:

XFt=[Ft-24,Ft-24.5,Ft-25,Ft-48,Ft-48.5,Ft-49,ht,dt,mt]
XPt= Pt-24,Pt-48,Pt-72,Pt-24×7,ht,dt,mt
XJt=Jt-24,Jt-24.5,Jt-25,Jt-48,Jt-48.5,Jt-49,ht,dt,mt

式中:对于下标t-a,当a为整数时,如下标t-24指对于t时刻的输入特征,选取前1天该时刻的真实值;当a为非整数时,如下标t-24.5指对于t时刻的输入特征,选取前1天该时刻前半小时的值(1天前该时刻附近).对于某一时刻t的输入特征有对应的输出值即该时刻的真实值,有 YFt=FtYPt=PtYJt=Jt.从3个数据集中分别选取训练集即{FTr}={XFTr, YFTr}、{PTr}={XPTr, YPTr}、{JTr}={XJTr, YJTr}和测试集{XFTs, YFTs}、{XPTs, YPTs}、{XJTs, YJTs},每个训练集和测试集分别包括 4800 和480个样本.

2.1.3 预测 净负荷等于电力消耗减去光伏产出,因此可以有两种预测形式.直接预测法通过先求出净负荷然后直接利用历史净负荷信息得到预测净负荷YJTs;间接预测法通过先分别利用历史电力消耗信息和历史光伏产出信息来预测未来电力消耗YFTs和未来光伏产出YPTs,然后通过两者相减得到未来净负荷.实验中选用了3个HMCDGP模型分别对电力消耗、光伏产出和净负荷进行了预测.由于输入特征提取环节3个数据集选用的历史特征最晚都是24小时前的值,所以本次实验构建的模型适用于做短期日前净负荷预测,即对未来的一天每个时刻进行预测.图2描述了原始数据处理、提取输入特征和预测3个模块之间的关系以及每个模块的内部结构.

图2

图2   预测模型框架

Fig.2   Structure of forecasting model


2.2 评估指标

2.2.1 点预测指标 传统的用来评估点预测的指标有均方根误差(RMSE)、平均绝对误差(MAE)、标准均方根偏差(NRMSD).

RMSE=1Hh=1H(A^h-Ah)2
MAE=1Hh=1H|A^h-Ah|
NRMSD=RMSE(Ahmax-Ahmin)

式中: Ahmax为实际值中的最大值; Ahmin为实际值中的最小值;Ah 为实际值;$\widehat{A}_h$ 为预测值;H为预测总数.RMSE可以反映预测值和实际值之间的偏差,常用作机器学习模型预测结果衡量的标准;MAE是绝对误差的平均值,可以反映预测值误差的实际情况;NRMSD可以理解为RMSE的归一化结果.三者都是取值越小代表精度越高、预测效果越好.

2.2.2 概率预测指标 最常用的评估概率预测的标准为可靠性、锐度和分辨率.这些标准在文献[24]中第一次用来评估概率风电预测.可靠性描述了预测分布与真实值的接近程度,类似点预测的精度.锐度描述了预测分布与实际值重合的紧密程度,如真实值的最大最小值与99%置信度的预测区间上下限非常接近,则认为预测是锐度高的.锐度类似点预测的误差范围,锐度越高对应误差越小.分辨率描述了预测区间随时间的变化程度,若在整个预测范围预测区间宽度不变,则认为预测没有分辨率.如由于电力使用的特性,负荷预测白天的宽度应该要高于晚上的宽度.分辨率类似点预测的方差.

Pinball Score是一种可以评估上述标准的全面性指标,通过计算每个分位数的预测值与实际值的关系来评估预测结果.Pinball指标可以表示为

Qb=(1-τ)(A^h,τ-Ah),Ah<A^h,ττ(Ah-A^h,τ),AhA^h,τ

式中: τ=0.01,0.02,,0.99,为不同的分位数;A^h,τ为第h个样本分位数为τ时的预测值.将每个分位数对应的Qb求平均值便是本文用来评估概率预测效果的指标,Qb值越小代表预测结果越好.

PINAW Score是另一种概率预测指标,主要用于评估预测区间宽度,Qa可以表示为

Qa=1HRh=1H(Bhα-Dhα)

式中:R为实际值最大值与最小值的差值;B、D分别为在置信度为α时预测区间的上下限. Qa值越小表示预测区间越窄、预测效果越好.

3 算例分析

为了验证所用方法的优越性,选用了其余5种方法来进行对比.其中点预测方法3种,分别是线性回归法(LR)、支持向量回归法(SVR)、反向传播神经网络(BPN);概率预测方法2种,分别是QR、SGP.

3.1 直接预测和间接预测

为了对比直接预测和间接预测两种形式的预测效果,使用上述5种方法和本文所提方法来分别针对两种预测形式进行实验,其中训练集为2012-03-04至2012-06-11之间的100天,测试集为2012-06-17至2012-06-26之间的10天.对其精度指标RMSE、MAE和NRMSD进行对比分析,结果如表1所示.

表1   6种方法直接和间接预测对比

Tab.1  Comparison of six methods with direct and indirect forecasting

方法RMSEMAENRMSD
间接直接间接直接间接直接
BPN35.0035.7420.2221.190.1090.111
QR33.5333.5222.0621.750.1040.104
SVR32.5231.4219.3820.800.1000.098
LR31.1431.0421.3522.410.0960.096
SGP31.3431.4920.8321.050.0970.098
HMCDGP28.6528.1218.6719.010.0890.087

新窗口打开| 下载CSV


从精度对比结果可以看出,间接预测和直接预测的精度相差不大.其中,BPN和SGP在3个指标上都是间接预测效果略微好于直接预测;其余4种方法在3个指标上各有优劣,但精度相差不大.选择其中一种点预测方法SVR、一种概率预测方法SGP以及本文所用方法HMCDGP绘制它们分别在2012-06-20和2012-06-21这两天的直接预测和间接预测结果,如图3所示.从图3中可以看到,3种预测模型的直接预测结果和间接预测结果都很接近.

图3

图3   3种预测模型的两种预测形式结果

Fig.3   Results of three forecasting models using two prediction patterns


实验结果表明,两种预测形式都是可行的.从数据特征分析,电力消耗和光伏产出可以看作是相互独立的,因此,使用间接预测时可以先分别预测两者的值再相减得到净负荷的预测值.而直接预测作为较为常规的预测形式,通过求解输入特征和净负荷之间的关系来实现未来时间点的净负荷预测也是合理的.

间接预测形式在每种方法的建模过程中需要两个模型同时对电力消耗和光伏产出进行训练和测试,其建模复杂度、调参难度和时间成本都约为直接预测的两倍,因此接下来的实验都将采用直接预测形式.

3.2 预测结果对比

为了验证所用方法的优越性,接下来将和本章开始提到的另外5种方法作对比.本节实验针对夏季和冬季分别进行了训练和测试,夏季实验的训练集为2012-03-04至2012-06-11之间的100天,测试集为2012-06-17至2012-06-26之间的10天,冬季实验的训练集为2011-09-18至2011-12-27之间的100天,测试集为2012-01-01至2012-01-10之间的10天.点预测方法对比其点预测指标RMSE、MAE和NRMSD,概率预测方法既对比点预测指标也对比概率预测指标QbQa,结果如表23所示.其中,计算点预测指标时,QR的预测值取分位数为0.5时的预测结果;计算概率预测指标PINAW时,取置信度α为80%.

表2   点预测结果

Tab.2  Spot forecasting results

方法夏季冬季
RMSEMAENRMSDRMSEMAENRMSD
BPN35.74021.1850.110941.26729.4840.1369
QR33.52221.7510.104039.46225.2190.1309
SGP31.49021.0470.097734.70224.6570.1151
SVR31.42420.8040.097535.92925.7180.1192
LR31.04422.4110.096336.27227.5980.1203
HMCDGP28.12419.0140.087233.95024.6460.1126

新窗口打开| 下载CSV


表3   概率预测结果

Tab.3  Probabilistic forecasting results

方法夏季冬季
QbQa/%QbQa/%
QR7.53322.5612.42826.18
SGP8.32623.179.50028.91
HMCDGP6.80319.578.71224.92

新窗口打开| 下载CSV


从点预测结果可以看到,HMCDGP比其余5种方法的点预测效果更好.在夏季的测试结果中,和点预测方法反向传播神经网络(BPN)对比,HMCDGP在RMSE、MAE和NRMSD这3个方面分别提升了21.31%、10.25%和21.37%;和概率预测方法分位数回归(QR)对比,HMCDGP在RMSE、MAE和NRMSD这3个方面分别提升了16.10%、12.58%和16.15%;在冬季的测试结果中,和点预测方法BPN相比,HMCDGP在RMSE、MAE和NRMSD上分别提升了17.73%、16.41%和17.75%,和概率预测方法QR相比,HMCDGP在RMSE、MAE和NRMSD分别提升了13.97%、2.27% 和 13.98%. 夏季和冬季的点预测结果体现了HMCDGP在预测精度上的优越性.

从概率预测结果可以看到,HMCDGP比另外两种概率预测方法效果更好.在夏季的测试结果中,和概率预测方法稀疏高斯过程回归(SGP)对比,HMCDGP在QbQa分别提升了18.29%和15.53%;在冬季的测试结果中,和概率预测方法分位数回归(QR)对比,HMCDGP在QbQa分别提升了29.90%和4.81%.Qb描述的是概率预测结果和真实值的拟合程度,对应2.2.2节提到的可靠性和锐度;Qa描述的是预测区间的宽度,对应2.2.2节提到的分辨率.HMCDGP在两个指标上均为最小,说明HMCDGP在可靠性、锐度和分辨率上都是优于另外两种方法的.另外,在夏季测试结果中,QR的点预测效果不如SGP,但是概率预测效果却优于SGP,说明点预测效果和概率预测效果并不一定是相对应的,在评估某种概率预测模型时应综合考虑其点预测和概率预测效果.

2012-06-20和2012-06-21两天的点预测结果对比图如图4所示.从图4可以看出,在净负荷曲线上升和下降时6种方法的点预测效果相差不大,在波谷和波峰时预测效果出现了较大差别,这说明了波谷和波峰较难预测且波谷和波峰的预测效果对整体预测效果的影响较大.

图4

图4   6种方法预测结果对比

Fig.4   Comparison of forecasting result of six methods


图4中可以看到,几种方法的预测结果在波谷处的差异较大,尤其在第二日的波谷处6种方法和实际值之间出现了较大偏差.波谷出现的时刻是每日的正午左右,由于净负荷是电力消耗和光伏产出的差值,所以在中午光伏产出最大的时候净负荷形成了波谷.由于短期内每日的电力消耗基本保持规律,光伏产出便成了影响波谷净负荷的主要因素,当光伏产出受天气等外界因素影响变化较大时便会导致波谷处净负荷预测偏差较大.

对于电力决策而言,负荷的峰值是一个关键因素[16].从图4可以看到,峰值负荷出现的时候是每天的19~21时左右,该时段光伏产出基本为0,因此影响波峰净负荷的主要因素是电力消耗.在没有光伏产出时,电力消耗等于净负荷,峰值负荷因为波动较大且不稳定而比较难预测,因此能否在峰值负荷处取得较好的预测效果也是衡量一种负荷预测方法好坏的重要标准.

图4可以看到,在净负荷曲线上升、下降以及波峰处,HMCDGP的预测结果都是最好的;在波谷处HMCDGP的预测结果在两天都处于6种方法的中间水平,但是其余几种方法在其中一日预测效果好的在另一日则变差了,因此综合看来HMCDGP的预测效果是最好的.

3.3 区间预测

在上一节对比概率预测指标Qa时,选取了统一的置信度为80%.为了更全面地了解区间预测的效果,接下来将选取置信度分别为90%、80%、70%和60%时来进行区间预测实验,其中训练集为 2012-03-04 至2012-06-11之间的100天,测试集为2012-06-17至2012-06-26之间的10天,结果如表4所示.

表4   不同置信度下的Qa

Tab.4  Qa a different confidence levels

方法Qa=90%Qa=80%Qa=70%Qa=60%
QR29.4422.5618.0914.34
SGP29.5123.1718.7715.32
HMCDGP25.0619.5715.8212.79

新窗口打开| 下载CSV


表4中可以看到,通过纵向对比,每种方法的Qa随着置信度的增加在变大,这说明置信度越高预测区间越宽,也意味着预测是有效的;通过横向对比,在每一种置信度下,HMCDGP的Qa都是最小的,也再一次验证了HMCDGP的区间预测效果是最好的.

为了更加直观地对比3种方法的区间预测效果,2012-06-20这一天QR、SGP和HMCDGP的区间预测结果如图5所示.

图5

图5   3种概率预测模型的预测区间

Fig.5   Predictive interval of three probabilistic forecasting models


图5(a)中部分实际值在90%置信区间之外,说明QR在这部分的区间预测效果较差,该部分区间预测的可信度也较低;图5(b)中的实际值基本都在90%置信区间之内,证明SGP能提供可靠的概率依据,但是在这一天内预测区间都比较宽且在每个时刻都很平均,说明SGP的区间预测并不精确;图5(c)中实际值基本都在90%置信区间之内且在波峰、波谷、上升和下降时置信区间宽度明显有区别:上升和下降时预测区间最窄,其次是波峰,波谷预测区间最宽.由于波峰主要由电力消耗决定、波谷主要由光伏产出决定,光伏产出不确定性更大,所以波谷的预测区间应该最宽以应对波谷净负荷波动.从2.2.2节的概率预测标准——分辨率角度来看,区间预测在每个时段的预测宽度也应该有区别.综合看来,HMCDGP的区间预测效果最好.

4 结论

本文提出了一种基于HMCDGP的净负荷概率预测模型,并采用了直接预测和间接预测两种预测形式.实验中比较了HMCDGP与另外5种预测方法的点预测精度,对比了HMCDGP与另外2种概率预测方法的概率预测效果,并分析了在不同置信度下概率预测方法的区间预测效果.实验结果表明:

(1) 直接预测和间接预测都是可行的预测形式,两者的预测精度相差不大;

(2) HMCDGP在点预测的精度上比其余5种方法都要高,在概率预测的可靠性、锐度和分辨率上都比另外2种概率预测方法更好;

(3) 3种概率预测方法都能得到区间预测结果,且HMCDGP的区间预测效果最好.

以上结果表明,将HMCDGP应用到净负荷预测是完全可行的,并得到了较好的预测效果.接下来将把净负荷预测的规模从区域性微网扩大到大规模电力系统,为构建完整的“源-网-荷-储”新能源电力系统提供依据.另外,出于对用户隐私的保护,文中所用数据的报告未披露300户居民的具体所在地,因此无法取得实验数据准确的气象信息,在未来的研究工作中,将会把气象信息作为一个输入特征来提高净负荷预测的准确度.

参考文献

江泽民.

对中国能源问题的思考

[J]. 上海交通大学学报, 2008, 42(3):345-359.

[本文引用: 1]

JIANG Zemin.

Reflections on energy issues in China

[J]. Journal of Shanghai Jiao Tong University, 2008, 42(3):345-359.

[本文引用: 1]

HONG T, WANG P, WILLIS H L.

A naïve multiple linear regression benchmark for short term load forecasting

[C]// 2011 IEEE Power and Energy Society General Meeting. Detroit, MI, USA: IEEE, 2011: 1-6.

[本文引用: 1]

肖白, 刘庆永, 牛强, .

基于元胞负荷特性分析的RBF神经网络空间负荷预测方法

[J]. 电网技术, 2018, 42(1):301-307.

[本文引用: 1]

XIAO Bai, LIU Qingyong, NIU Qiang, et al.

A spatial load forecasting method based on RBF neural network and cellular load characteristics analysis

[J]. Power System Technology, 2018, 42(1):301-307.

[本文引用: 1]

吴云, 雷建文, 鲍丽山, .

基于改进灰色关联分析与蝙蝠优化神经网络的短期负荷预测

[J]. 电力系统自动化, 2018, 42(20):67-72.

[本文引用: 1]

WU Yun, LEI Jianwen, BAO Lishan, et al.

Short-term load forecasting based on improved grey relational analysis and neural network optimized by bat algorithm

[J]. Automation of Electric Power Systems, 2018, 42(20):67-72.

[本文引用: 1]

占勇, 程浩忠, 丁屹峰.

自适应神经网络在短期负荷预测中的应用

[J]. 上海交通大学学报, 2005, 39(Sup.1):14-17.

[本文引用: 1]

ZHAN Yong, CHENG Haozhong, DING Yifeng.

The application of adaptive neural network in short term load forecasting

[J]. Journal of Shanghai Jiao Tong University, 2005, 39(Sup.1):14-17.

[本文引用: 1]

赵佩, 代业明.

基于实时电价和加权灰色关联投影的SVM电力负荷预测

[J]. 电网技术, 2020, 44(4):1325-1332.

[本文引用: 1]

ZHAO Pei, DAI Yeming.

Power load forecasting of SVM based on real-time price and weighted grey relational projection algorithm

[J]. Power System Technology, 2020, 44(4):1325-1332.

[本文引用: 1]

陈振宇, 刘金波, 李晨, .

基于LSTM与XGBoost组合模型的超短期电力负荷预测

[J]. 电网技术, 2020, 44(2):614-620.

[本文引用: 1]

CHEN Zhenyu, LIU Jinbo, LI Chen, et al.

Ultra short-term power load forecasting based on combined LSTM-XGBoost model

[J]. Power System Technology, 2020, 44(2):614-620.

[本文引用: 1]

HONG T, FAN S.

Probabilistic electric load forecasting: A tutorial review

[J]. International Journal of Forecasting, 2016, 32(3):914-938.

DOI:10.1016/j.ijforecast.2015.11.011      URL     [本文引用: 1]

LIU B D, NOWOTARSKI J, HONG T, et al.

Probabilistic load forecasting via quantile regression averaging on sister forecasts

[J]. IEEE Transactions on Smart Grid, 2017, 8(2):730-737.

[本文引用: 2]

何耀耀, 闻才喜, 许启发, .

考虑温度因素的中期电力负荷概率密度预测方法

[J]. 电网技术, 2015, 39(1):176-181.

[本文引用: 2]

HE Yaoyao, WEN Caixi, XU Qifa, et al.

A method to predict probability density of medium-term power load considering temperature factor

[J]. Power System Technology, 2015, 39(1):176-181.

[本文引用: 2]

庞昊, 高金峰, 杜耀恒.

基于时间卷积网络分位数回归的短期负荷概率密度预测方法

[J]. 电网技术, 2020, 44(4):1343-1350.

[本文引用: 2]

PANG Hao, GAO Jinfeng, DU Yaoheng.

A short-term load probability density prediction based on quantile regression of time convolution network

[J]. Power System Technology, 2020, 44(4):1343-1350.

[本文引用: 2]

何耀耀, 刘瑞, 撖奥洋.

基于实时电价与支持向量分位数回归的短期电力负荷概率密度预测方法

[J]. 中国电机工程学报, 2017, 37(3):768-776.

[本文引用: 2]

HE Yaoyao, LIU Rui, HAN Aoyang.

Short-term power load probability density forecasting method based on real time price and support vector quantile regression

[J]. Proceedings of the CSEE, 2017, 37(3):768-776.

[本文引用: 2]

何耀耀, 许启发, 杨善林, .

基于RBF神经网络分位数回归的电力负荷概率密度预测方法

[J]. 中国电机工程学报, 2013, 33(1):93-98.

[本文引用: 2]

HE Yaoyao, XU Qifa, YANG Shanlin, et al.

A power load probability density forecasting method based on RBF neural network quantile regression

[J]. Proceedings of the CSEE, 2013, 33(1):93-98.

[本文引用: 2]

ALIPOUR M, AGHAEI J, NOROUZI M, et al.

A novel electrical net-load forecasting model based on deep neural networks and wavelet transform integration

[J]. Energy, 2020, 205:118106.

[本文引用: 1]

方陈, 江兴稳, 周健, .

含分布式能源区域电网月最大净负荷概率预测

[J]. 水电能源科学, 2018, 36(9):197-200.

[本文引用: 1]

FANG Chen, JIANG Xingwen, ZHOU Jian, et al.

Probability prediction of monthly net load for regional power grid with distributed energy penetration

[J]. Water Resources and Power, 2018, 36(9):197-200.

[本文引用: 1]

SUN M Y, ZHANG T Q, WANG Y, et al.

Using Bayesian deep learning to capture uncertainty for residential net load forecasting

[J]. IEEE Transactions on Power Systems, 2020, 35(1):188-201.

DOI:10.1109/TPWRS.59      URL     [本文引用: 3]

刘升伟, 王星华, 鲁迪, .

基于改进高斯过程回归的短期负荷概率区间预测方法

[J]. 电力系统保护与控制, 2020, 48(1):18-25.

[本文引用: 1]

LIU Shengwei, WANG Xinghua, LU Di, et al.

Electric load probabilistic interval prediction method based on improved Gaussian process regression

[J]. Power System Protection and Control, 2020, 48(1):18-25.

[本文引用: 1]

宗文婷, 卫志农, 孙国强, .

基于改进高斯过程回归模型的短期负荷区间预测

[J]. 电力系统及其自动化学报, 2017, 29(8):22-28.

[本文引用: 1]

ZONG Wenting, WEI Zhinong, SUN Guoqiang, et al.

Short-term load interval prediction based on improved Gaussian process regression model

[J]. Proceedings of the CSU-EPSA, 2017, 29(8):22-28.

[本文引用: 1]

彭虹桥, 顾洁, 胡玉, .

基于混沌粒子群—高斯过程回归的饱和负荷概率预测模型

[J]. 电力系统自动化, 2017, 41(21):25-32.

[本文引用: 1]

PENG Hongqiao, GU Jie, HU Yu, et al.

Forecasting model of saturated load based on chaotic particle swarm and optimization-Gaussian process regression

[J]. Automation of Electric Power Systems, 2017, 41(21):25-32.

[本文引用: 1]

VAN DER MEER D W, MUNKHAMMAR J, WIDÉN J.

Probabilistic forecasting of solar power, electricity consumption and net load: Investigating the effect of seasons, aggregation and penetration on prediction intervals

[J]. Solar Energy, 2018, 171:397-413.

DOI:10.1016/j.solener.2018.06.103      URL     [本文引用: 1]

HAVASI M, HERNANDEZ-LOBATO J M, MURILLO-FUENTES J J.

Inference in deep Gaussian processes using stochastic gradient Hamiltonian Monte Carlo

[EB/OL].(2018-11-12)[2021-03-04]. https://arxiv.org/abs/1806.05490.

URL     [本文引用: 2]

DAMIANOU A C.

Deep Gaussian processes and variational propagation of uncertainty

[EB/OL].(2015-02-10) [2021-03-04]. https://www.researchgate.net/publication/283296556_Deep_Gaussian_Processes_and_Variational_Propagation_of_Uncertainty.

URL     [本文引用: 1]

SPRINGENBERG J T, KLEIN A, FALKNER S, et al.

Bayesian optimization with robust Bayesian neural networks

[EB/OL]. [2021-03-04] https://xueshu.baidu.com/usercenter/paper/show?paperid=14b338c730619da3fd3ba5160a7cd186.

URL     [本文引用: 1]

PINSON P, NIELSEN H A, MØLLER J K, et al.

Non-parametric probabilistic forecasts of wind power: Required properties and evaluation

[J]. Wind Energy, 2007, 10(6):497-516.

DOI:10.1002/(ISSN)1099-1824      URL     [本文引用: 1]

/