上海交通大学学报, 2022, 56(8): 1004-1013 doi: 10.16183/j.cnki.jsjtu.2021.486

新型电力系统与综合能源

基于集成学习的电动汽车充电站超短期负荷预测

李恒杰1,3, 朱江皓1, 傅晓飞2, 方陈2, 梁达明1, 周云,3

1.兰州理工大学 电气工程与信息工程学院, 兰州 730050

2.国网上海市电力公司, 上海 200122

3.上海交通大学 电力传输与功率变换控制教育部重点实验室,上海 200240

Ultra-Short-Term Load Forecasting of Electric Vehicle Charging Stations Based on Ensemble Learning

LI Hengjie1,3, ZHU Jianghao1, FU Xiaofei2, FANG Chen2, LIANG Daming1, ZHOU Yun,3

1. School of Electrical Engineering and Information Engineering, Lanzhou University of Technology, Lanzhou 730050, China

2. State Grid Shanghai Municipal Electric Power Company, Shanghai 200122, China

3. Key Laboratory of Power Transmission and Power Conversion Control of the Ministry of Education, Shanghai Jiao Tong University, Shanghai 200240, China

通讯作者: 周 云,男,讲师;E-mail:yun.zhou@sjtu.edu.cn.

责任编辑: 陈晓燕

收稿日期: 2021-11-30  

基金资助: 国家自然科学基金项目(52167014)
教育部产学合作协同育人项目(202002010028)
上海市科委技术标准项目(21DZ2204800)
国家电网有限公司科技项目(52094021000F)

Received: 2021-11-30  

作者简介 About authors

李恒杰(1981-),男,陕西省西安市人,副教授,主要从事电气交通融合与用电能效管理的研究.

摘要

精确的电动汽车充电站充电负荷预测是提高充电站安全经济运行的重要措施,也是支撑充电基础设施新建、扩容规划决策的重要基础.为提高电动汽车充电站超短期充电负荷预测的精度,提出一种基于集成学习的充电站超短期充电负荷预测方法.首先,以预测精确度与响应速度为主要目标,使用轻量级梯度提升框架构建基础回归器模型;其次,通过自适应提升方法对基础回归器群进行集成;最后,通过超参数调整与优化,建立基于能量集成轻量梯度提升框架(EEB-LGBM)的双层充电站超短期充电负荷预测模型.算例结果表明,相较于反向传播神经网络、卷积神经长短期记忆网络、差分自回归移动平均模型等预测模型,所提出的基于EEB-LGBM的超短期充电负荷预测模型具有更高的精确度,同时可以大幅度缩短训练时间和降低计算资源需求.

关键词: 电动汽车充电站; 充电负荷; 超短期预测; 集成学习; 经济性

Abstract

Accurate electric vehicle load forecasting is the basis for maintaining the safe and economical operation of charging stations, and for supporting the planning and decision-making of new and expanded charging infrastructure. In order to improve the accuracy of the ultra-short-term load forecasting of charging stations, an ultra-short-term load forecasting method based on ensemble learning is proposed. First, aimed at the prediction accuracy and the response speed, the light gradient boosting machine (LightGBM) framework is utilized to build several basic regressors. Next, the basic regressors are integrated by using the adaptive boosting (Adaboost) method. Finally, by using hyperparameter adjustment and optimization, a dual-system for ultra-short-term load forecasting of charging stations named energy ensemble boosting-light gradient boosting machine (EEB-LGBM) is generated. The analysis of the numerical examples shows that the proposed model has a higher accuracy than the back propagation neural network (BPNN), convolutional neural networks-long short term memory (CNN-LSTM), autoregressive integrated moving average (ARIMA), and other load forecasting methods, which can greatly reduce the training time and the computing power requirements of the training platform.

Keywords: electric vehicle charging station; charging load; ultra-short-term forecasting; ensemble learning; economy

PDF (3182KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

李恒杰, 朱江皓, 傅晓飞, 方陈, 梁达明, 周云. 基于集成学习的电动汽车充电站超短期负荷预测[J]. 上海交通大学学报, 2022, 56(8): 1004-1013 doi:10.16183/j.cnki.jsjtu.2021.486

LI Hengjie, ZHU Jianghao, FU Xiaofei, FANG Chen, LIANG Daming, ZHOU Yun. Ultra-Short-Term Load Forecasting of Electric Vehicle Charging Stations Based on Ensemble Learning[J]. Journal of Shanghai Jiaotong University, 2022, 56(8): 1004-1013 doi:10.16183/j.cnki.jsjtu.2021.486

负荷预测对于智能电网的可靠性运维和有效管理至关重要.对充电负荷进行超短期精确预测是提高充电站安全经济运行的重要措施,还能为智能电网的安全监测、成本控制、调控决策提供重要依据,同时也是充电基础设施投资新建、充电站容量扩充与规划决策的有力支撑[1].在电动汽车还未大规模并入电网时,对能源系统中的负荷进行预测已经有20多年的发展历史,研究方法主要有两类:一类是基于数学预测模型的传统预测方法,包括趋向外推法、弹性系数法、时间序列法、线性回归法等,主要基于线性关系构建,忽略了气候、日期类型等因素对超短期充电负荷预测的影响,预测准确率较低;另一类是机器学习类算法,包括决策树、神经网络、集成学习、深度学习等[2-6].

近年来,基于机器学习的电力系统负荷预测方法因其越来越高的精度,已成为负荷预测领域的热点.文献[7]通过条件生成式对抗网络(Conditional Generative Adversarial Network, CGAN)对抗学习复杂的非线性数据之间的联系,减少了特征值的偏差,提高了预测精度,但训练数据仅包含单一类型数据,缺少泛化能力.文献[8]结合降噪自编码器、奇异谱分析和长短期记忆神经网络构建综合电力预测模型,降低了噪声干扰,提高了预测精度,但模型较为复杂,对平台算力有较高要求.文献[9]使用反向传播网络人工神经网络(Back Propagation-Artificial Neural Network, BP-ANN)提取数据特征向量,卷积神经网络(Convolutional Neural Networks, CNN)提取图像特征,通过多层BP-ANN进行短期预测,但模型训练时间过长,难以部署.文献[10]将改进的随机森林与密度聚类组合,通过叠加各分量预测值来获取负荷预测值,但模型构建复杂,泛化能力较低.文献[11]构建道路模型,通过Dijkstra路径寻优算法在出行链上预测电动汽车(Electric Vehicle, EV)充电负荷概率密度函数,但时间尺度长,无法面对超短期的负荷预测.

考虑到超短期充电负荷预测问题数据的大体量、高时效、高计算资源要求等因素的影响,本文使用集成学习(Ensemble Learning, EL)进行超短期充电负荷预测.一般的回归性预测方法只考虑到天气、温度、湿度等因素的影响,并未考虑到电动汽车基础设施需求的特异性.电动汽车充电负荷需求具有时空不确定性、随机性,且电动汽车配置参数存在个性化差异,为超短期充电站负荷的精确预测带来了挑战.为解决上述问题,使用占用资源极低的轻量级梯度提升框架(Light Gradient Boosting Machine, LightGBM)构建基础充电负荷,预测基础回归器群;为进一步提升预测精度,使用提升集成方法对基础回归器群进行集成,在经过多次迭代和超参数调整后构成最终的充电负荷预测模型.

1 EEB-LGBM预测框架

能量集成轻量梯度提升框架(Energy Ensemble Boosting-Light Gradient Boosting Machine, EEB-LGBM)结构包括2层,即基础回归器群生成层和集成决策层.基础回归器群生成层的作用是学习构建后的数据集的特征,并生成数个具有差别的基础回归器构成基础回归器群.集成决策层的作用是对基础回归器群进行串行优化,在合并后输出最终模型用于超短期充电负荷预测.EEB-LGBM预测框架的结构如图1所示.结构中的各个参数及其意义如表1所示.

图1

图1   EEB-LGBM预测框架结构

Fig.1   Structure of EEB-LGBM forecasting framework


表1   结构参数及其意义

Tab.1  Structure parameters and their significance

参数名称意义
X真实样本实际负荷数据
Y条件样本充电负荷影响因素
Z噪声样本随机噪声数据
r学习率收敛权重
dmax最大深度树结构的深度
wmin最小支点量分支节点的权重
λ收缩步长新特征权重
n迭代次数自我迭代的次数
wn基础回归器群迭代中阶段性回归器群
Fn(x)集成预测模型迭代中阶段性预测模型

新窗口打开| 下载CSV


在EEB-LGBM预测框架中,初始的样本划分将影响因素、噪声数据与真实充电负荷数据同步输入进行训练集划分,并对每一轮生成的基础回归器的参数进行记录,在下一轮时通过计算出的回归权重不断进行串行迭代并更新自身参数,以此不断优化,最终集成为基于EEB-LGBM预测框架的超短期充电负荷预测模型.

在用该结构进行超短期充电负荷预测时,用实际充电负荷数据、影响充电负荷的相关因素和随机噪声数据构成原始数据集.将原始数据集进行权值划分后用于训练基础回归器,并搜索基础回归器的最优参数进行并行化优化,数个基础回归器构成基础回归器群进行多次迭代,最终集成为用于超短期充电负荷预测的最终模型,从而进行超短期充电负荷预测.

生成模型层主要使用LightGBM框架不断生成基础回归器,通过最佳优先规则选择损失函数最大的分支进行生长,因此比任何基于决策树的算法具有更低的损失函数,且极大加快了模型的训练速度[12-16],但也导致负荷特征的数量大幅度减少.为维持预测精度,在特征提取时使用基于梯度的单边取样(Gradient-Based One-Side Sampling, GOSS)和互斥特征捆绑(Exclusive Feature Bundling, EFB)策略.在GOSS过程中,引入估计方差增益V~j(d)(d为训练数据分割点,j为算法选择的特征)来更快地确定训练数据的分割点,其计算公式和近似误差分别为

V~j(d)= 1τxiAlgi+1-abxiBlgi2nlj(d)+ 1τxiArgi+1-abxiBrgi2τrj(d)
E(d)≤ Ca,b2max 1τlj(d),1τrj(d)ln 1/δ+2DCa,bln1/δτ

式中:τ为训练数据集中特征的数量; xi为数据的输入空间;Al为梯度表现更大的一部分训练数据;gi为梯度空间;aAlAr剩余部分中抽取的较小的部分;bAlAr剩余部分中抽取的较大的部分;BlAl剩余部分抽样构建的数据集;nlj(d)为在分割点dl部分抽取的梯度中的特征;ArAl剩余梯度表现更小的部分;BrAr剩余部分抽样构建的数据集;τrj(d)为在分割点dr部分抽取的梯度中的特征;Ca,b为归一化后的梯度空间gi中最大的数据点;δ为数据点选择的概率;D为分割点d上最大的梯度值.

来自样本和特征的扰动将增加基础学习器的多样性,有助于提高泛化性能[17],但同时也会导致训练流程中误差的叠加增大.为减小特征选择时造成的误差,同时避免重复特征和零特征构成的不必要计算,引入EFB特征选择策略进行特征束的构建.通过向特征要素的原始值添加偏移来保证特征的排他性,使得驻留在不同的面元中的特征聚集,将具有排他性的特征捆绑到更少的密集特征上,以此构建特征束.

基础回归器群易受到偏差-方差权衡的影响[18],而使用自适应提升(Adaptive Boosting, Adaboost)方法进行集成,可以在维持模型方差和偏差平衡时增加模型的预测能力,避免因单一模型过于依赖训练集,使得在测试集上测试与真实预测时产生回归精度降低、结果失真等问题.在初始化构建完成数据集的权值分布后,对每一个基础训练样本都赋予相同的权值:

D1=(w11,w12,,w1N)w1i=1/N

i=1, 2, …, N

式中:D1为基础回归器的权重和;w1i为基础回归器的初始权值;N为权值分布的数量.基础回归器框架对权值更新后的训练数据集进行学习,得到原始回归器为

Gm(x)= argminG(x)i=1Nwi(m)Ⅱ(yi≠G(xi))

式中:Gm(x)为根据权值分布与基础算法得到的第m个基础回归器;wi(m)为该基础回归器的权值;yiG(xi)保证对点分类时的权重增加,yi为训练过程中的真实值.通过加权回归误差率εm可以得知原始回归器对于充电负荷的预测正确率,从而进行下一步优化.Gm(x)在训练数据集上的加权回归误差率为

εm= i=1Nwi(m)(yiGm(xi))i=1Nwi(m)

每个基础回归器通过不同的权重系数αm集合为最终的回归模型,Gm(x)在最终回归器中的权重系数为

αm= 12ln 1-εmεm

根据回归误差率更改每个基础回归器的权重系数,预测表现更好的基础回归器具有更高的权重.之后更新训练数据集的权值分布:

wi(m+1)=wi(m)e-yiαmGm(xi)Zm
Zm= i=1Nwmie-yiαmGm(xi)

i=1, 2, …, N

式中:Zm为规范化因子.

在不断更新迭代后,根据权值将1~m的所有基础回归器集合为最终回归器:

G(x)=sign m=1MαmGm(x)

在整个集成过程中基本回归器Gm(x)错误回归的样本权值增大,而被正确分类样本的权值减小,以此完成自我优化和纠错,最终回归模型的加权过程如图2所示.

图2

图2   模型加权优化图

Fig.2   Weighted optimisation chart of model


2 基于EEB-LGBM预测框架的超短期充电负荷预测模型

基于EEB-LGBM预测框架的超短期充电负荷预测模型主要包括数据集构建、回归器集成和充电负荷预测结果输出,其结构如图3所示.

图3

图3   基于EEB-LGBM预测框架的超短期充电负荷预测模型

Fig.3   Ultra-short-term charge load forecasting model based on EEB-LGBM forecasting framework


在构建数据集部分需要确定数据集的大小和特性,选用合适的方法进行数据清洗,为训练部分划分原始训练数据.随机噪声数据为函数生成具有正态分布的变量,与原始训练数据共同输入后使得训练后的模型具有更强的稳定性.充电负荷的影响条件包括气候数据、日期类型数据、连接时长数据等.实际充电负荷数据为充电站监测得到的真实充电站充电负荷数据.在训练超短期充电负荷预测模型的过程中,采用LightGBM结合提升结构生成最终模型,用于超短期充电负荷预测.首先,将实际充电负荷数据、影响条件数据、随机噪声数据同步进行数据清洗后输入集成模型训练部分划分原始权值.其次,基于原始权值数据集生成数个基础回归器,以此构成基础回归器群后进行串行集成,在集成过程中不断迭代优化,最终使得整个基于EEB-LGBM预测框架的充电负荷预测模型达到最优.

为了探究模型效果,使用训练好的超短期充电负荷预测模型进行充电负荷预测,并与其他超短期充电负荷预测模型的预测结果进行对比.所有对比模型使用相同方法构建的初始数据集进行训练,输出1 d的预测曲线,并与真实值进行对比,观察模型拟合度.进行对比实验时,使用回归决定系数(R2)、平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)、均方根误差(Root Mean Square Error, RMSE)、训练时间(Time to Training, TT)作为评价指标,对比不同模型的性能.

2.1 数据分析与处理

2.1.1 实际充电负荷数据

实际充电负荷数据来源于充电站系统的实时采样,单站10个采集点,超短期充电负荷预测输出为未来24 h的充电负荷.为选择合适的基础回归器群框架与集成方式,对数据进行库克距离分析是有必要的.库克距离分析常用在最小二乘回归当中对数据点的影响进行评估[19],也可以用于检查数据集当中不同数据点的影响力[20],其计算公式如下:

Di= j=1n(y^j-y^j(i))2ps2

式中:y^j为预测平均值;y^j(i)为排出i点影响时的预测响应值;p为模型项数;s2为回归模型的均方误差.Di定义为回归模型中所有变化的总和,当 Di>1时,代表该点的数据在数据集中的偏差可能对模型造成影响,Di值越大,则该点对回归模型构建的影响越大.实际充电负荷数据的库克距离分析可视化如图4所示.在实际充电负荷数据集中,部分数据点远超基准水平,偏差影响最大点的Di超过1.75,数据集整体波动性大,符合电动汽车配置的个性化差异导致的充电负荷需求的时空不确定性、随机性.

图4

图4   库克距离分析图

Fig.4   Analysis chart of Cook's distance


2.1.2 影响充电负荷的条件因素

目前对于电力充电负荷预测研究大多考虑的气象影响因素有温度、湿度、降水、风向、风速等[21].但为了更加精细化和实时化地进行充电负荷预测,还需合并考虑连接时长、充电功率、车型配置、节假日等因素.本文使用 1~7代表星期一至星期日,节假日使用0和1进行二值化处理,车型分为纯电、混动,同样使用0和1进行二值化处理.

2.1.3 数据预处理

在统一进行原始权值计算前,需要对数据集进行预处理,以便模型快速提取特征进行学习.对于缺失特征使用中位数估计函数插补,对于多级别特征根据轮廓系数标准使用K均值聚类算法进行压缩,对于插补完成的所有特征使用鲁棒缩放将特征映射到[0, 1]区间上进行规范化,公式如下所示:

v'i= vi-χμ

式中:v'i为规范化处理后的样本;vi为数据集中某个随机数据的值;χ为样本中位数;μ为数据集的四分位间距.

2.2 集成模型训练与优化

基础回归器群框架的选择对于最终模型的性能有较大影响,因此,对于所有适用于超短期充电负荷预测问题的共16种回归模型,使用相同的经过预处理构建完成的数据集进行训练,在相同的评价指标下进行对比.为适应超短期充电负荷预测问题,评价指标R2权重最大,生成时间次之,其他评价指标的权重依次减小.在所有框架中LightGBM框架在精确度上略微领先,但在训练时间上表现出极大优势,因此使用LightGBM框架学习数据集构建数个基础回归器.对于基础回归器群的单个基础回归器,以R2最优为目标进行多次迭代和参数优化,之后将优化好的基础回归器群输入集成层.对于LightGBM框架选取生长最大深度、叶片节点个数、缩分实例、随机部分特征、L1正则化、L2正则化等参数构建参数搜索空间.在超参数空间的参数搜索方法选择树状结构帕仁估计(Tree-Structured Parzen Estimator, TPE)算法,首先根据损失函数对超参数进行排序,并使用分位数对全体超参数进行分组.分别对优化表现较好的超参数组和优化表现较差的超参数组进行核密度估计,给定较好组有更高的被选择概率,较差组有更低的被选择概率.最后,经过优化效果评估后继续分组,不断迭代,最终输出经过最优表现超参数组合优化后的基础回归器群.为加快超参数搜索优化过程,对进行TPE算法搜索的超参数搜索空间使用MongoDB结构构建数据库,转为并行化搜索,进行超参数搜索过程优化,如图5所示.

图5

图5   MongoDB结构图

Fig.5   MongoDB structure chart


将经过优化的基础回归器群进行权重计算,以其中具有最大损失函数的回归器为目标增大优化权重进行迭代,构建集成预测模型.同样以R2最优为目标,以基础回归器群的最优数量、基础回归器的权重缩减系数、误差函数计算方式为超参数,构建MongoDB结构的超参数存储空间,使用TPE算法进行并行化搜索,进一步优化其预测精度构成最终的超短期充电负荷预测模型.

2.3 评价指标

回归模型的评价指标决定系数R2比对称平均绝对百分比误(Symmetric Mean Absolute Percentage Error, SMAPE)、均方误差(Mean Square Error, MSE)、RMSE、平均绝对误差(Mean Absolute Error, MAE)和MAPE等更具信息量和真实性,并且没有MSE、RMSE、MAE及MAPE对回归模型进行性能评价时的可解释性限制[22],甚至可以对比不同研究领域当中不同回归模型的性能.因此在选择基础回归器框架和集成框架时,给予R2更大的参考权重,在R2接近时同时参考MAPE、RMSE、TT等指标,各评价指标的计算公式如下:

R2=1- (yi-y^i)2(yi-y-i)2
MAPE= 1n'i=1n'y^i-yiyi
RMSE= 1n'i=1m'wi(yi-y^i)2

3 实验结果及对比

3.1 实验数据准备

使用Foundation E-Laad.nl(ElaadNL)[23]在2019年实测某充电站的电动汽车充电负荷需求数据以及气象、日期类型数据构建数据集.ElaadNL充电站包括充电桩、快速充电器、电池、充电灯和 IOTA 三相充电器,每相电流至少为16 A,充电功率为11 kW.充电站由不同的用户群体共享,白天的用户群体主要为办公室工作人员,下午或晚上为游客,深夜主要为附近居民,同时还有一些特定的用户群体,如出租车、共享汽车或市内物流.实测充电负荷数据集主要为连接类型、连接时长、充电功率、充电桩编号、总耗能,由充电站系统实时采集.温度、湿度、气压等气象数据采集频率为1次/h,再合并随机噪声数据后构成原始数据集.其中70%为训练集输入模型进行训练,剩余30%为测试集.对基础回归器群与集成方式都进行10折交叉验证进行性能对比.

3.2 模型构建实验

3.2.1 基础回归器性能对比与选择

在基础回归器群的构建过程中,针对充电站充电负荷的超短期回归预测共选取了16种回归算法构建基础回归器进行比较.这16种算法的全称与对应简称如表2所示.选取的16种算法在构建后的相同数据集上进行训练,使用10折交叉验证在相同的测试集上验证所有模型的性能,在相同指标下降序排列,其结果如表3所示.

表2   16种不同算法基础回归器框架的名称与简称

Tab.2  Names and abbreviations of 16 basic regression frameworks of different algorithms

序号算法名称简称
1Light Gradient Boosting MachinLGBM
2Extra Trees RegressorEt
3Random ForestRf
4Gradient Boosting RegressorGbr
5Decision TreeDt
6Bayesian RidgeBr
7Ridge RegressionRidge
8AdaBoost RegressorAda
9Lasso RegressionLasso
10Linear RegressionLr
11Elastic NetEn
12Orthogonal Matching PursuitOmp
13Lasso Least Angle RegressionLlar
14K Neighbors RegressorKnr
15Huber RegressorHuber
16Passive Aggressive RegressorPar

新窗口打开| 下载CSV


表3   16种基础回归器性能对比

Tab.3  Performance comparison of 16 basic regression learners

模型MAEMSERMSDR2MAPERMSETT/s
LGBM1.48359.96523.14720.92711.40900.16030.9520
Et1.476710.95663.27910.91661.11990.154219.9650
Rf1.470711.05043.29150.91611.24100.151910.6240
Gbr1.728911.10573.31300.91561.96500.187637.1450
Dt1.788116.40383.99110.89001.48300.18171.2130
Br3.610034.20695.83180.80167.42200.4518247.2700
Ridge3.620534.39325.84940.80057.33500.45351.9980
Ada4.866837.44686.09250.716011.57900.576956.5100
Lasso3.585138.73546.20080.77976.74800.41690.4880
Lr4.079238.88466.22220.77828.49500.509029.1220
En3.552239.68496.27600.77506.23900.40390.6320
Omp3.404542.68316.50880.76024.95300.37171.5520
Llar10.6004202.963414.2317-0.001426.08700.98520.8980
Knr10.7520226.002415.0233-0.117925.18300.99859.7160
Huber9.3039234.116215.2823-0.154514.44800.902010.5580
Par14.9551318.163217.6986-0.566220.07801.32771.7940

新窗口打开| 下载CSV


在充电站充电负荷超短期预测这一特定的应用场景上,LightGBM框架表现出极大优势:在精确度领先的情况下,其训练时间缩短为Et、Rf等算法的1/260~1/20,大幅增加了调控速度,更适合面对超短期尺度上的充电负荷预测问题;同时计算资源需求大幅度缩小,降低了充电站的构建、维护、检修、扩容的成本.

3.2.2 集成预测层性能对比

在基础回归器群构建完成后,需要选择集成方式构建集成预测层.集成方式主要有类属于同构的袋化集成和提升集成以及类属于异构的混合集成和堆叠集成共4种.对于同构集成算法,统一使用LightGBM作为基础回归器框架进行集成.对于异构集成算法,统一选取表3中排名前3的算法LGBM、Et和Rf进行集成.4种算法在相同的测试集上使用10折交叉验证,使用式(12)计算不同模型中yi点的分布,构成yy^正确率分布,如图6所示.

图6

图6   4种集成算法正确率对比

Fig.6   Comparison of accuracy of four ensemble algorithms


异构集成算法要结合3种不同的算法构建最终预测模型,因此在训练时间上大大落后于同构集成算法,且充电负荷预测的正确率提升并不明显.混合结构准确率提升至95.31%,堆叠结构产生了模型冲突,使得结果失真.在同构结构中,提升结构具有最高的准确率,达到97.23%.在袋化类结构中,采用多个基础回归器并行投票原则进行集成,因此当基础回归器对某个特征点不敏感时,会出现基础回归器群中的所有基础回归器在学习时都出现错误,导致最终回归器同样不能正确学习到该特征点的特征.但在提升类结构的串行集成过程中,后一个基础回归器会对前一个基础回归器不敏感的特征点加大训练权值,因此避免了袋化方式在预测时不断输出同一错误点的缺陷,具有自我纠正能力.因此选择提升方法对基础回归器群进行集成,构成最终的超短期充电负荷预测模型.

3.3 EEB-LGBM预测框架的性能分析

通过学习曲线和残差分析可以观察分析生成的模型对数据的利用效率与预测稳定性.学习曲线将模型在训练集上的损失函数的最优值与在验证数据集上评估的损失函数作对比,验证数据集的参数是否与产生最优函数的参数相同,同时可以观察到对数据的利用效率.计算基于EEB-LGBM预测框架的超短期充电负荷预测模型的学习曲线,可以观察到该模型对训练数据的需求量小,初始训练时收敛速度快,随着训练数据的不断增大,准确率稳步提升,在6000条数据时模型的整体准确率接近峰值,具有良好的泛化能力,其学习曲线如图7所示.

图7

图7   最终模型学习曲线

Fig.7   Learning curves of final model


残差计算可以验证模型的残差是否与随机误差存在一致性,体现回归模型在面对真实随机数据时预测能力的稳定性.残差验证结果的可视化如图8所示.在对基于EEB-LGBM预测框架的模型进行残差计算后可以观察到,该模型在面对随机分布的误差时显示出了极高的稳定性,在训练集上预测精度达到了99.12%,在测试集上精度达到了97.23%.

图8

图8   最终模型残差分析

Fig.8   Residual analysis of final model


3.4 充电负荷预测模型对比

为对比EEB-LGBM的实际预测能力,将其与使用反向传播神经网络(Back Propagation Neural Network, BPNN)、卷积神经长短期记忆网络(Convolutional Neural Networks-Long Short Term Memory, CNN-LSTM)、差分自回归移动平均模型(Autoregressive Integrated Moving Average Model, ARIMA)构成的充电负荷预测模型进行性能对比.各模型均使用相同的充电负荷数据集以及相同的充电负荷条件影响因素数据集进行训练,输出某一天的预测值与实际充电负荷值进行对比,其结果如图9所示.结果表明,虽然各预测方法都可以预测到充电负荷的变化趋势,但本文所提出的基于EEB-LGBM预测框架的超短期充电负荷预测模型与实际充电负荷曲线具有最高的拟合率.各对比预测方法在测试集上的决定系数R2、MAPE以及TT如表4所示.

图9

图9   不同预测模型的预测结果对比

Fig.9   Comparison of prediction results of different prediction models


表4   BPNN、CNN-LSTM、ARIMA、EEB-LGBM的R2、MAPE与训练时间对比

Tab.4  Comparison of R2, MAPE, and TT of BPNN, CNN-LSTM, ARIMA, and EEB-LGBM

模型MAPER2/%TT/s
BPNN6.6588.6329.60
CNN-LSTM4.2194.67334.27
ARIMA6.9884.71197.00
EEB-LGBM1.2197.233.92

新窗口打开| 下载CSV


4 结语

目前的超短期负荷预测模型具有准确率欠缺、时间尺度过长、训练时间长、计算资源需求大等缺点,同时未针对电动汽车充电站充电负荷的特点进行优化.本文提出的基于集成学习的双层预测框架进行超短期充电负荷预测方法通过LightGBM构建高性能的基础回归器群,对充电负荷数据集进行学习,以提升类同构结构进一步提升预测精度,并使用MongoDB构建超参数空间,TPE算法进行并行化超参数搜索进行优化,最终构成超短期充电负荷预测模型.对比实验证明,提出的基于EEB-LGBM预测框架的超短期充电站充电负荷预测模型,相比BPNN、CNN-LSTM、ARIMA预测模型不仅提高了预测精度,且显著缩短了训练时间,降低了计算资源需求,同时具有训练数据需求小、收敛速度快、泛化能力强的优点,能够满足充电站超短期电力充电负荷预测的高效性、稳定性及经济性等要求.

本文使用的提升类结构的串行集成方式在训练时间上还具有进一步优化空间.为更好满足超短期充电负荷预测对预测效率的高要求,后续工作将进行串行集成结构改善,以期进一步缩短模型的训练时间,加快预测响应速度.

参考文献

陈文彬, 徐大勇, 郭瑞鹏.

负荷预测对新能源电网多目标优化调度的影响规律研究

[J]. 电力系统保护与控制, 2020, 48(10): 46-51.

[本文引用: 1]

CHEN Wenbin, XU Dayong, GUO Ruipeng.

A study on the influence rule of load forecasting on multi-objective optimal dispatching of a new-energy grid

[J]. Power System Protection and Control, 2020, 48(10): 46-51.

[本文引用: 1]

孙超, 吕奇, 朱思曈, .

基于双层XGBoost算法考虑多特征影响的超短期电力负荷预测

[J]. 高电压技术, 2021, 47(8): 2885-2898.

[本文引用: 1]

SUN Chao, Qi, ZHU Sitong, et al.

Ultra-short-term power load forecasting based on two-layer XGBoost algorithm considering the influence of multiple features

[J]. High Voltage Engineering, 2021, 47(8): 2885-2898.

[本文引用: 1]

李玉志, 刘晓亮, 邢方方, .

基于Bi-LSTM和特征关联性分析的日尖峰负荷预测

[J]. 电网技术, 2021, 45(7): 2719-2730.

[本文引用: 1]

LI Yuzhi, LIU Xiaoliang, XING Fangfang, et al.

Daily peak load prediction based on correlation analysis and Bi-directional long short-term memory network

[J]. Power System Technology, 2021, 45(7): 2719-2730.

[本文引用: 1]

罗凤章, 张旭, 杨欣, .

基于深度学习的综合能源配电系统负荷分析预测

[J]. 高电压技术, 2021, 47(1): 23-32.

[本文引用: 1]

LUO Fengzhang, ZHANG Xu, YANG Xin, et al.

Load analysis and prediction of integrated energy distribution system based on deep learning

[J]. High Voltage Engineering, 2021, 47(1): 23-32.

[本文引用: 1]

谭嘉, 李知艺, 杨欢, .

基于分布式优化思想的配电网用电负荷多层协同预测方法

[J]. 上海交通大学学报, 2021, 55(12): 1544-1553.

[本文引用: 1]

TAN Jia, LI Zhiyi, YANG Huan, et al.

A multi-level collaborative load forecasting method for distribution networks based on distributed optimization

[J]. Journal of Shanghai Jiao Tong University, 2021, 55(12): 1544-1553.

[本文引用: 1]

钟光耀, 邰能灵, 黄文焘, .

基于多维聚类的配变负荷注意力短期预测方法

[J]. 上海交通大学学报, 2021, 55(12): 1532-1543.

[本文引用: 1]

ZHONG Guangyao, TAI Nengling, HUANG Wentao, et al.

Attention short-term forecasting method of distribution load based on multi-dimensional clustering

[J]. Journal of Shanghai Jiao Tong University, 2021, 55(12): 1532-1543.

[本文引用: 1]

林珊, 王红, 齐林海, .

基于条件生成对抗网络的短期负荷预测

[J]. 电力系统自动化, 2021, 45(11): 52-60.

[本文引用: 1]

LIN Shan, WANG Hong, QI Linhai, et al.

Short-term load forecasting based on conditional generative adversarial network

[J]. Automation of Electric Power Systems, 2021, 45(11): 52-60.

[本文引用: 1]

肖白, 肖志峰, 姜卓, .

基于降噪自编码器、奇异谱分析和长短期记忆神经网络的空间电力负荷态势感知

[J]. 中国电机工程学报, 2021, 41(14): 4858-4867.

[本文引用: 1]

XIAO Bai, XIAO Zhifeng, JIANG Zhuo, et al.

Spatial load situation awareness based on denoising autoencoder, singular spectrum analysis and long short-term memory neural networks

[J]. Proceedings of the CSEE, 2021, 41(14): 4858-4867.

[本文引用: 1]

范士雄, 刘幸蔚, 於益军, .

基于多源数据和模型融合的超短期母线负荷预测方法

[J]. 电网技术, 2021, 45(1): 243-250.

[本文引用: 1]

FAN Shixiong, LIU Xingwei, YU Yijun, et al.

Multi-source data and hybrid neural network based ultra-short-term bus load forecasting

[J]. Power System Technology, 2021, 45(1): 243-250.

[本文引用: 1]

张金金, 张倩, 马愿, .

基于改进的随机森林和密度聚类的短期负荷频域预测方法

[J]. 控制理论与应用, 2020, 37(10): 2257-2265.

[本文引用: 1]

ZHANG Jinjin, ZHANG Qian, MA Yuan, et al.

Short-term load frequency domain prediction method based on improved random forest and density-based spatial clustering of applications with noise

[J]. Control Theory & Applications, 2020, 37(10): 2257-2265.

[本文引用: 1]

罗平, 程晟, 王严, .

考虑用户出行特性的电动汽车充电负荷预测

[J]. 华中科技大学学报(自然科学版), 2020, 48(11): 126-132.

[本文引用: 1]

LUO Ping, CHENG Sheng, WANG Yan, et al.

Electric vehicle charging load forecast considering user's travel characteristics

[J]. Journal of Huazhong University of Science and Technology (Natural Science Edition), 2020, 48(11): 126-132.

[本文引用: 1]

MA X J, SHA J L, WANG D H, et al.

Study on a prediction of P2P network loan default based on the machine learning LightGBM and XGboost algorithms according to different high dimensional data cleaning

[J]. Electronic Commerce Research and Applications, 2018, 31: 24-39.

DOI:10.1016/j.elerap.2018.08.002      URL     [本文引用: 1]

SHAKER B, YU M S, SONG J S, et al.

LightBBB: computational prediction model of blood-brain-barrier penetration based on LightGBM

[J]. Bioinformatics, 2020, 37(8): 1135-1139.

DOI:10.1093/bioinformatics/btaa918      URL     [本文引用: 1]

WANG Y Y, CHEN J, CHEN X Q, et al.

Short-term load forecasting for industrial customers based on TCN-LightGBM

[J]. IEEE Transactions on Power Systems, 2021, 36(3): 1984-1997.

DOI:10.1109/TPWRS.2020.3028133      URL     [本文引用: 1]

KE G, MENG Q, FINLEY T, et al.

Lightgbm: A highly efficient gradient boosting decision tree

[J]. Advances in Neural Information Processing Systems, 2017, 30: 3146-3154.

[本文引用: 1]

MEHTA M, AGRAWAL R, RISSANEN J.

SLIQ: A fast scalable classifier for data mining

[C]// Advances in Database Technology - EDBT '96. Avignon, France: Springer, 1996: 18-32.

[本文引用: 1]

ZHOU Z H.

Ensemble Methods

[M]. New York, USA: Chapman and Hall (CRC Press), 2012.

[本文引用: 1]

REDDY L N, BUTAKOV S, ZAVARSKY P.

Applying ML algorithms to improve traffic classification in intrusion detection systems

[C]// 2020 IEEE 19th International Conference on Cognitive Informatics & Cognitive Computing. Beijing, China: IEEE, 2020: 1-6.

[本文引用: 1]

COOK R D.

Detection of influential observation in linear regression

[J]. Technometrics, 1977, 19(1): 15-18.

[本文引用: 1]

LING R F.

Residuals and influence in regression

[J]. Technometrics, 2012, 26(4): 413-415.

DOI:10.1080/00401706.1984.10487996      URL     [本文引用: 1]

李汉巨.

考虑气象因素累积效应的电力系统96点日负荷预测方法

[J]. 电气技术, 2018, 19(4): 28-32.

[本文引用: 1]

LI Hanju.

The 96 point daily load forecasting method for power system considering the cumulative effect of meteorological factors

[J]. Electrical Engineering, 2018, 19(4): 28-32.

[本文引用: 1]

CHICCO D, WARRENS M J, JURMAN G.

The coefficient of determination R-squared is more informative than SMAPE, MAE, MAPE, MSE and RMSE in regression analysis evaluation

[J]. PeerJ Computer Science, 2021, 7: e623.

DOI:10.7717/peerj-cs.623      URL     [本文引用: 1]

BECTA.

Elaadnl

[EB/OL]. (2020-01-15)[2021-08-23]. https://platform.elaad.io/.

URL     [本文引用: 1]

/