“双碳”背景下风光等可再生能源在传统电网中的渗透率不断提高.微电网能够解决分布式电源的灵活高效应用问题,实现对负荷多种能源形式的高可靠供给,近年来发展迅速[1 ] .但微电网中可再生能源出力波动性和不确定性严重影响能源供需平衡[2 ] 、储能系统能量管理[3 ] 、需求响应管理[4 ] ,对其出力进行精确预测能够有效提高微电网日前调度计划制定科学性[5 ] .大量新建的微电网投入运行时间短,其中可再生能源缺少历史数据而更难以建立高精度的出力预测模型,因此在小样本数据条件下实现新建微电网的日前优化调度运行成为一个亟待解决的问题.
针对小样本条件下可再生能源出力预测问题研究方法可归纳为以下两类,一是利用数据增强的方法对少量历史数据进行扩充[6 -8] 来增加参与预测任务的数据量,进而提高预测精度.然而基于数据增强的方法从相似域抽取样本时存在人为随机性,难以表现出可再生能源发电的时序特性.二是基于模型迁移的方法利用公共知识进行泛化,该方法首先在大数据集上训练得到一个具有强泛化能力的模型,然后使用少量目标可再生能源出力数据对该模型进行参数微调,避免数据扩充方法中人为抽取样本的过程,提升预测精度同时减少计算时间.文献[9 -10 ]中分别对出力数据丰富的光伏电站和水电站出力进行建模并将该模型外推至目标电站的出力预测任务.文献[11 ]中将带物理约束性的长短期记忆网络(long short-term memory,LSTM)作为预训练网络,在多种天气条件下验证了新建光伏(photovoltaic,PV)电站的功率预测效果.文献[12 ]中提出目标风电(wind turbine,WT)出力的多层级迁移学习模型,验证了迁移层数对出力预测精度的影响.文献[13 ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低.
在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16] 和基于人工智能的数据驱动算法[17 -21] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性.
综上,针对当前小样本条件下微电网调度策略中存在的可再生能源出力预测精度较差、调度决策空间探索不充分的不足,提出一种基于小样本数据驱动模式的新建微电网优化调度方法.该方法将域对抗学习和梯度反转机制的思想融入迁移学习框架中,设计出域对抗神经网络(domain adversarial neural network,DANN)融合LSTM的迁移学习网络结构DANN-LSTM,增强了模型在目标域小样本条件下可再生能源出力预测任务上的泛化能力.在此基础上,首先,使用DANN-LSTM预测新建微电网中小样本条件下可再生能源出力;然后,进一步建立日前微电网优化调度的马尔可夫决策模型,使用TD3算法求解模型得到最优经济性调控策略;最后,进行仿真验证所提方法的有效性.
1 基于域对抗迁移学习的小样本条件下可再生能源出力预测
迁移学习(transfer learning,TL)与传统机器学习预测可再生能源出力方法不同,其放宽了训练数据与测试数据必须满足独立同分布这一基本假设,旨在利用源域丰富易获得的可再生能源出力数据和模型来帮助完成目标域上少量可再生能源出力的建模预测任务.基于迁移学习的小样本条件下可再生能源出力预测问题可以被定义为一个五元组:<D s ,T s ,D t ,T t ,fτ (·)>,其中D s 和D t 分别为源域和目标域的数据集. 已建成并投入运行时间较长的可再生能源电站数据充足,其出力随气象特征变化的模型容易训练且拟合效果良好,因此设定为源域;新建微电网中可再生能源出力数据匮乏,需要借助源域模型对其出力进行建模,因此设定为目标域. 源域和目标域中的数据集包括气象数据、源域丰富风光出力数据和目标域少量风光出力数据及其标签空间,T s 和T t 为源域和目标域的任务,即需要分别建立的可再生能源出力随气象特征变化的模型;fτ (·)为源域和目标域任务之间的迁移策略.
为了提高模型迁移的方法在目标域小样本条件下可再生能源出力数据上的泛化性能进而降低预测误差,文献[27 ]中基于生成对抗网络(generative adversarial network,GAN)的思想提出一种较为新颖的DANN,该网络可以有效提高目标域可再生能源出力数据在小样本条件下的学习效果进而提升预测精度.
常规基于模型迁移的小样本条件下可再生能源出力预测方法通常仅在源域电站出力数据上进行训练,这种做法忽略了目标域上可再生能源电站独特的运行环境,从而不能有效地将源域电站上训练所得模型迁移至目标域电站出力建模任务中.而DANN引入域对抗的方式,在源域和目标域之间同时进行域适应训练,增强了可再生能源出力数据的“域不变性”,具有降低过拟合风险,提升目标域小样本条件下可再生能源出力数据利用效率的独特优势,因此将DANN引入小样本条件下可再生出力预测可提高预测精度.
可再生能源出力通常表现出较强的时序特性,而传统DANN模型使用少量神经元构造的特征提取器由于结构单一,难以处理时序数据间的长期依赖关系.LSTM通过引入门机制[9 ] ,能够有效捕捉到长时序可再生能源数据随时间变化的特征,因此将其用作特征提取器来对长期的源域和目标域少量数据进行特征提取.综上,本文将LSTM引入DANN中,设计出改进的DANN-LSTM网络结构,其能够适用于小样本条件下可再生能源长时序数据出力预测任务.
网络结构如图1 所示,包括特征提取器Gf (θf )、标签预测器Gy (θy )、域分类器Gd (θd ) 3个部分,θf 、θy 、θd 分别为其参数,模型输入数据为包括出力和气象数据的源域电站数据集与仅有气象数据的目标域数据集.
图1
图1
所提改进DANN-LSTM网络结构
Fig.1
Improved DANN-LSTM network structure proposed
基于DANN-LSTM的小样本条件下可再生能源出力预测方法的基本原理包括数据正向映射和误差反向传播两个过程,这两个过程按先后顺序进行.正向映射是将数据输入特征提取器Gf (θf )映射到一个共同的特征空间F ;特征空间中源域电站数据集的特征向量则会经过预测器Gy (θy )的映射获得对应出力的预测结果;同时,源域电站和目标域电站的特征向量共同经过域分类器Gd (θd )得到每个输入的域分类结果.
正向映射过程实现两个目标:第一是实现源域电站出力的准确预测以及预测误差的最小化,因此构造其损失函数为
(1) $L_{y_{i}}\left(\boldsymbol{G}_{y}\left(\boldsymbol{G}_{f}\left(\boldsymbol{x}_{i}\right)\right), y_{i}\right)=\lg \frac{1}{\boldsymbol{G}_{y}\left(\boldsymbol{G}_{f}\left(\boldsymbol{x}_{i}\right)\right)_{y_{i}}}$
式中:L y i 为第i 个输入数据的出力预测损失;xi 、yi 分别表示第i 个源域输入样本的气象数据和对应的功率.第二是对特征空间的数据进行域分类,使域分类器能够分辨出特征空间中的数据属于源域或目标域,实现域分类误差的最大化,构造其损失函数为
(2) L d i (Gd (Gf (xi )),di )=di lg 1 G d ( G f ( x i ) ) + (1-di )lg 1 1 - G d ( G f ( x i ) )
式中:L d i 为第i 个输入数据的域分类损失;di 为第i 个输入数据的域分类标签,di ∈{0,1}. 若di =0,则该输入数据属于源域电站出力数据集;若di =1,则该输入数据属于目标域电站出力数据集.
在数据正向映射完成后,DANN-LSTM进行误差反向传播过程.误差反向传播是进行网络参数优化的过程.由式(1)和式(2)可知预测器和域分类器的输入都来自特征提取器,然而域分类器和预测器的损失函数寻优方向相反,导致特征提取器进行参数更新时,域分类损失的梯度与预测损失梯度更新方向相反.常规GAN的做法是以分别固定生成器与鉴别器参数的方式进行分阶段训练[28 ] ,这会削弱两个网络间的耦合效果,限制信息交互能力,进而影响生成高质量出力预测数据的能力.DANN在特征提取器和域分类器之间加入梯度翻转层增强各个网络之间的协调性和一致性,将特征提取器、域分类器和预测器作为一个整体实现“端对端”训练,从而可以在目标域上获得更好的性能.具体做法是在域分类损失反向传播过程中加入梯度反转层使梯度方向自动取反并乘以平衡系数λ ,提升模型的域适应能力.DANN-LSTM的总优化函数为
(3) $\begin{array}{l} W\left(\boldsymbol{\theta}_{f}, \boldsymbol{\theta}_{y}, \boldsymbol{\theta}_{d}\right)=\frac{1}{n_{\mathrm{s}}} \sum_{i=1}^{n_{\mathrm{s}}} L_{y_{i}}\left(\boldsymbol{\theta}_{f}, \boldsymbol{\theta}_{y}\right)- \\ \quad \lambda\left(\frac{1}{n_{\mathrm{s}}} \sum_{i=1}^{n_{\mathrm{s}}} L_{d_{i}}\left(\boldsymbol{\theta}_{f}, \boldsymbol{\theta}_{d}\right)+\frac{1}{n_{\mathrm{t}}} \sum_{i=n_{\mathrm{s}}+1}^{n_{\mathrm{s}}+n_{\mathrm{t}}} L_{d_{i}}\left(\boldsymbol{\theta}_{f}, \boldsymbol{\theta}_{d}\right)\right) \end{array}$
式中:n s 、n t 分别为源域数据数量和目标域数据数量.考虑到模型在训练初期更加注重提高域分类器性能,应避免域分类器过于敏感地响应噪声信号,确保在域自适应任务中能够得到一个合理的域判别边界来提升域对抗训练的稳定性;在训练后期更侧重预测器,提高目标域小样本条件下可再生能源出力的预测精度.因此,平衡系数λ ∈0,1 ,反映在不同训练阶段域分类器和预测器的重要程度,其计算公式如下:
(4) λ = 2 1 + e x p ( - χ p ) -1
式中:χ 为常系数,通常取值为10;p 为当前训练次数与总训练次数的比值. 在网络进行对抗训练过程中λ 会自适应地由0变为1,体现出训练过程中重点任务的动态变化.
反向传播更新网络参数的过程体现了域对抗的思想,即训练过程中通过最小化目标函数来更新预测器的参数,最大化目标函数来更新域判别器的参数:
(5) ( θ f , θ y ) = a r g m i n θ f , θ y W ( θ f , θ y , θ d ) θ d = a r g m a x θ d W ( θ f , θ y , θ d )
使用随机梯度下降算法[29 ] 优化DANN-LSTM的模型参数,梯度更新公式为
(6) θ f ← θ f - μ ∂ L y i ∂ θ f - λ ∂ L d i ∂ θ f θ y ← θ y - μ ∂ L y i ∂ θ f θ d ← θ d - μ ∂ L d i ∂ θ d
(7) μ = μ 0 ( 1 + α p ) β
式中:μ 0 为初始学习率,取为0. 01;α 、β 为超参数,分别取为10和0.75.使用风光出力均方根误差(root mean square error,RMSE)作为验证集上的性能指标,并设定其阈值为0.001,如果该指标在连续的若干轮迭代后不再显著变化或趋于平稳,则可以认为模型已经收敛或无法进一步改善,训练可以停止.
2 基于深度强化学习的微电网优化调度策略
2.1 微电网优化调度目标函数
微电网优化调度通过对储能充放电动作进行控制来获得日内最小运行成本,不同于以往微电网模型中单一储能形式所带来的能量密度和功率输出的限制,本文采用由蓄电池和超级电容器进行配合所组成的复合储能系统来灵活地调整和优化能量存储和释放.微电网优化调度目标函数由微电网与主网交易成本和复合储能系统度电成本组成:
(8) C =min ∑ t = 1 24 (ct pgrid, t +Lbat Δ p b a t , t +Lcap Δ p c a p , t )
式中:ct 为t 时段的实时电价;p grid, t 为t 时段微电网与主网之间的交互功率;L bat 、L cap 分别为蓄电池和电容器的度电成本,取值参考文献[30 ];p bat, t 、p cap, t 分别为t 时段蓄电池和超级电容的有功功率.
(9) p wt, t +p pv, t +p bat, t +p cap, t +p grid, t -p load, t =0
式中:p wt, t 、p pv, t 分别表示t 时段风电和光伏的总有功功率;p load, t 为t 时段负荷总有功功率.
(2) 储能系统约束.本文中微电网采用由锂蓄电池和超级电容器组成的复合储能系统来同时满足对能量的高效转换和长期储存,考虑建造成本问题和使用寿命损耗,应同时满足以下容量约束和充放电功率约束:
(10) s b a t , m i n ≤ s b a t , t ≤ s b a t , m a x p b a t , m i n ≤ p b a t , t ≤ p b a t , m a x s c a p , m i n ≤ s c a p , t ≤ s c a p , m a x p c a p , m i n ≤ p c a p , t ≤ p c a p , m a x
(11) s bat, t +1 = s b a t , t + p b a t , t Δ t η b a t , c h , p b a t , t > 0 s b a t , t - p b a t , t Δ t η b a t , d i s c h , p b a t , t ≤ 0
(12) s cap, t +1 = s c a p , t + p c a p , t Δ t η c a p , c h , p c a p , t > 0 s c a p , t - p c a p , t Δ t η c a p , d i s c h , p c a p , t ≤ 0
式中:s bat, t 、s cap, t 分别为蓄电池和超级电容器在时段t 的容量比例,s bat,max 、s cap,max 和s bat,min 、s cap,min 分别为其上下限,分别取0.8、0.8、0.2和0.2;p bat,max 、p bat,min 分别为蓄电池充放电上下限,分别取±60 kW;p cap,max 、p cap,min 分别为超级电容器充放电上下限,分别取 ±200 kW;η bat,ch 、η bat,disch 和η cap,ch 、η cap,disch 分别为蓄电池和超级电容器充放电效率,取0.9;Δt 为调度时段间隔,取1 h.
2.2 微电网优化调度的马尔可夫决策建模及求解方法
在微电网运行过程中,每个调度时段各电力组件的状态仅由上一调度时段和外部环境的变化所决定,因此可用马尔可夫决策过程(markov decision process,MDP)对其建模.一个MDP可由五元组表示:<S ,A ,P ,R ,γ >,S 为系统的状态变量,A 为系统的动作空间,P 为状态转移概率矩阵,R 为奖励函数,γ ∈(0,1]为折扣因子.
(1) 状态变量S. 每个时段t 内微电网系统的状态变量st ∈S 可表示为
(13) st = p p v - p r e , t p w t - p r e , t p l o a d , t s b a t , t s c a p , t c t
式中:p pv-pre, t 、p wt-pre, t 分别为光伏和风电功率在t 时段的预测值,由前文提出的DANN-LSTM模型预测得到.
(2) 动作变量A. 每个时段t 内微电网控制复合储能系统连续充放电动作来进行调度,系统的动作变量at 可表示为
(14) at = p b a t , t p c a p , t
(3) 奖励R. 设微电网在状态st 下选取动作at 后得到的奖励为Rt ,将目标成本函数转化为奖励的最大化形式:
(15) Rt =-C
(16) P (St +1 |St =st , At =at )
状态转移概率描述了在给定状态和采取特定动作后,微电网系统从当前时段的状态St 转移到下一时段状态St +1 的概率分布.由于每一时段可再生能源及负荷具有不确定性,所以很难对其精确建模表示,本文采用深度强化学习算法通过不断尝试不同的动作并观察系统的奖励来逐步学习得到.
(5) 折扣因子γ .用于平衡当前和未来回报的重要性,表示系统对未来奖励的重视程度,本文取0.99.
深度强化学习能够有效地处理复杂的输入和输出空间并从大量的数据中进行学习,使智能体能够做出高质量的决策[31 ] .TD3是DRL当前较为优秀的算法,将其应用于上述微电网优化调度的马尔可夫决策过程求解,通过对微电网储能系统充放电动作寻优来降低微电网日运行成本.
TD3是一种基于执行器-评判器(Actor-Critic)结构的算法[32 ] ,具体结构见图2 右侧TD3算法框架.Critic网络以微电网环境在t 时段的可再生能源出力、负荷、复合储能系统和实时电价等状态st 以及储能系统动作at 作为输入,输出Q 值函数Q ω C r i ( st ,at ),该函数表示微电网在状态下st 储能系统采取动作at 所获得的预期累积奖励,用来评估储能系统在该状态下采取充放电动作at 的优劣程度,其中ω Cri 为Critic 网络参数.Actor 网络将t时段的微电网环境状态st 作为输入,输出储能系统动作策略μ ω A c t ,微电网获得储能系统动作策略后,根据策略信息对潮流分布结果进行更新并将更新后的状态st +1 发送给储能系统以确保储能系统获得最新的状态信息,根据Q 值函数对储能系统动作策略进行更新,其中ω Act 为Actor 网络参数.
图2
图2
基于小样本数据驱动模式下的新建微电网优化调度策略求解框架
Fig.2
Solution framework of optimal scheduling strategies for newly built microgrids based on a small-sample data-driven model
TD 3使用神经网络实现Critic 网络和Actor 网络的参数化,使用Critic 网络输出Q 值对每一调度时段储能系统动作a 进行评估,并根据估计值与目标值的差异进行参数更新来优化估计值,使智能体能够更准确地评估动作策略的好坏.采用蒙特卡罗采样来近似Q 值损失函数,该函数表示为
(17) L ω C r i =E ( y t - Q ω C r i ( s t , a t ) ) 2
式中:yt =rt +γQ (st +1 ,μ ω A c t ( st +1 ))表示时段t 的目标Q 值,其中rt 为当前调度时段的奖励;E (·)表示期望函数.
Critic网络应用时序差分学习的思想计算出Q 值后,Actor网络使用策略梯度方法来更新参数,以使其在下一时间步生成的储能系统动作策略能够获得更高的累计奖励,计算方法如下:
(18) Δ ω A c t J(μ ' ω A c t )= E S ~ ρ μ ' (Δ a Q ω C r i ( s , a ) a = μ ' ω A c t ( s ) Δ ω A c t μ ' ω A c t (s))
式中:s~ρμ' 为当前微电网状态s 在策略μ' 下的分布;Q ω C r i ( s ,a )| a = μ ' ω A c t ( s ) 为在微电网状态s 下按照策略储能系统进行动作a =μ ' ω A c t ( s )得到的Q 值;J (μ ' ω A c t ) 为能够获取的期望回报.
TD3通过构建双评判器网络结构、目标策略平滑和策略更新延迟技术使Q 值估计更加准确,具体做法详见文献[32 ].微电网智能体通过反复与环境进行交互获得动作策略的同时,利用算法更新Critic网络和Actor网络参数直至奖励值收敛,得到微电网最优日前调度策略.
2.3 求解步骤
所提基于DANN-LSTM和TD3算法的小样本条件下微电网的优化调度策略求解框架如图2 所示,具体流程如下:
(1) 利用地理位置相近电站的丰富历史出力数据作为源域,使用设计的DANN-LSTM网络预测目标微电网中可再生能源出力,为微电网调度过程提供数据支撑,提高决策能力.
(2) 初始化Critic网络和Actor网络的参数和经验池;在每个调度时段将微电网中运行状态和步骤(1)中预测得到的风光出力数据、复合储能系统容量、负荷和实时电价作为Actor网络的状态输入st ;Actor网络根据当前状态分别给出蓄电池和超级电容的初始动作并加入噪声ε ,微电网环境执行当前的控制策略进行状态转移生成下一时刻的状态st +1 ,同时智能体给出当前调度时段的奖励rt 并将经验样本{st , at , rt , st +1 }添加至经验池中.
(3) 从经验池中随机采样一批经验样本,对于每个样本,在Actor网络中根据式(13)计算下一调度时段的储能系统动作at +1 ,并在两个目标Critic网络中分别计算样本的目标值Q Cri,tar1 (s , a |ω Q C r i , t a r 1 ) 和Q Cri,tar2 (s , a |ω Q C r i , t a r 2 ) ,取较小者作为yt 防止过估计问题.根据式(10)更新两个价值Critic网络参数ω Q C r i , t a r 2 和ω Q C r i 2 ,选取合适的延迟更新步长,根据式(14)更新Actor网络参数ω Act .重复以上步骤直至奖励值达到最大且收敛,得到最优调度策略.图中:μ ω A c t , t a r 为ω Act,tar 的策略.
3 算例分析
选择欧洲CIGRE 14节点低压微电网系统作为实验对象,并做相应调整,如图3 所示.微电网系统包括一个蓄电池和一个超级电容器的2个储能单元、4个光伏电站、3个风电机组以及若干负荷.每个可再生能源电站装机容量均为1 MW,微网中其他元件和线路阻值参考文献[33 ].
图3
图3
CIGRE 14节点低压微电网系统
Fig.3
CIGRE 14-node low-voltage microgrid system
3.1 数据描述和仿真设置
采用编程语言版本Python 3.8,深度学习框架为 PyTorch 1.8.1.数据来自renewables.ninja,该开源网站所提供的数据包括辐射强度、温度、降水量、空气密度、风速以及对应的光伏输出功率和风光输出功率.为了能够捕捉到能源产出的细微变化和波动,从而更准确地评估微网系统的性能和经济效益,将数据的采样间隔设置为1 h.特征提取器由4层LSTM层和1层Dense层组成,4层LSTM层单元数分别选为(200,100,100,50),所选源域、目标域风电场和光伏电站地理位置如表1 所示.
3.2 域相似度评估与气象特征筛选
在进行风光出力预测前,首先将得到的数据进行预处理,包括相似度评估和气象特征筛选.以1号光伏为例,采用最大均值差异函数来评估源域数据和目标域数据之间的相似度,避免了预测过程中可能产生负迁移造成预测精度降低,得到以下结果:1号电站与目标域之间的相似度最高,相似度为 0.1248;其次是2号电站,相似度为 0.3184;而3号和4号电站之间的相似度最低,分别为 0.3258 和 0.4752.因此,可以合理地假设1号电站数据更加贴近目标域的特征分布,该源域选择策略有助于减少负迁移现象,确保模型在目标域小样本条件下能够具备较高的出力预测能力.
对于源域风电场和光伏电站,历史数据包括2019年1月1日到2019年12月31日一年间的风光出力数据和对应的气象数据,对于目标域仅有2019年1月1日到1月10日共10 d的历史数据.将包括风光出力数据及对应的气象特征的源域和目标域可再生能源电站数据合并,构造融合数据集,从融合数据集中抽取前70%的数据作为训练集,将余下的30%数据作为测试集.
为了选取与可再生能源出力之间相关性最强的特征并且加快计算速度,使用皮尔逊相关系数来计算各气象特征与可再生能源出力之间的相关性,相关性计算的结果如表2 所示.由表可见,在光伏出力方面,辐射强度与光伏出力之间显示出强相关性,并且远高于其他气候因素.因此,可以仅选取辐射强度作为光伏出力的特征.类似地,在风电出力方面选取风速作为风电出力的特征.
3.3 风光出力预测结果与误差分析
使用均方根误差和平均绝对误差(mean absolute error,MAE)作为评估预测精度的指标.图4 展示了相关精度指标,目标域中风电和光伏电站的预测结果与实际值对比如图5 所示.由图4 和图5 可知,新建微电网历史出力数据严重缺失,传统深度学习用于训练集的数据量过少易发生欠拟合,导致预测精度较差.在理想天气条件下1号和2号PV光伏出力预测结果的平均RMSE和MAE分别高达18.60%、9.68%,非理想天气条件下分别为24.78%、13.00%;在风电出力数据集上理想天气条件下的1号和2号PV平均RMSE和MAE分别为32.96%、17.42%,非理想天气条件下分别为16.20%、7.66%;当风光出力发生突变时,误差更加显著.而使用原深度学习网络模型中加入预训练-微调环节后(即图4 中LSTM-TL对应数据),能使数据量较少的目标域电站学习到相似源域电站的出力特性,在光伏出力预测和风电出力预测的平均精度上分别得到较大提升:理想天气条件下光伏出力数据集平均RMSE降低至11.06%,非理想天气条件下出力预测结果平均RMSE降低至15.70%,相应的平均MAE分别降低至6.26%和7.77%;风电预测任务上理想天气条件下平均RMSE、MAE分别降低至26.85%、14.46%,非理想天气条件下平均RMSE、MAE分别降低至10.70%、5.88%.然而,依赖公共知识的预训练网络在目标域上精确时间尺度上的预测效果仍然不高.DANN通过引入域对抗的方法同时训练源域和目标领域的任务,增强公共特征在目标领域上的映射效果进而提高出力预测精度,与基于模型迁移的方法相比,光伏出力预测结果在理想天气条件下平均RMSE和MAE分别降低4.15百分点、2.31百分点,在非理想天气条件下平均RMSE和MAE分别降低4.33百分点、2.02百分点;风电出力预测结果在理想条件下平均RMSE和MAE分别降低8.56百分点、4.16百分点,在非理想天气下平均RMSE和MAE分别降低2.56百分点和0.89百分点.
图4
图4
可再生能源预测误差指标
Fig.4
Prediction errors of renewable energy output
图5
图5
可再生能源出力预测结果
Fig.5
Prediction results of renewable energy output
与传统的DANN相比,所提网络在DANN的基础上加入LSTM用于特征提取任务,能够更好地捕捉风光出力数据的时序特性,在理想天气条件下光伏出力预测结果平均RMSE和MAE仅有5.73%和2.94%,非理想天气条件下光伏出力预测结果平均RMSE和MAE分别为9.22%和4.66%;同时,理想天气条件下风电预测结果平均RMSE和MAE分别降低至16.68%和9.12%,非理想条件下风电预测结果平均RMSE和MAE分别降低至6.82%和4.34%.证明所提的网络结构能够有效提高小样本条件下可再生能源出力预测的精度.
基于模型迁移的方法预测精度受迁移层数的精度的影响.图6 和图7 展示了不同迁移层数下的预测精度与所提方法的对比.图中:TL-fixed-n 表示固定的前n 层LSTM层数.由图可知,在理想天气条件下,光伏和风电的出力预测精度随着固定的网络层数增加先升后降,且选择固定前两层网络参数时精度最高:光伏出力预测结果RMSE分别为8.26%、7.89%,风电出力预测结果RMSE分别为23.12%和24.15%.固定前4层参数时误差最高,其原因可能在于:理想天气情况下,光伏和风电的出力随相应气象特征间的知识较易提取,只需要两层LSTM层便可充分知识提取;当固定的层数增加时,预训练模型更加关注提高源域电站上的出力预测精度,忽略了目标域电站上的特定出力特征,同时,随着固定的层数增加,模型的参数量也随之增加.过多参数可能导致模型在小数据集上过拟合,进而造成目标域上小样本条件下可再生能源出力预测精度下降,这是迁移学习中的一个常见问题,称为“迁移性能不匹配”[34 ] .而在非理想天气条件下,由于可再生能源的出力随相应气象特征之间的关系较为复杂,所以需要保留更高的LSTM层数进行充分的知识提取.因此,选取固定前4层LSTM层,只对全连接层进行参数微调时预测精度最高.
图6
图6
基于模型迁移的可再生能源出力预测结果随迁移层数变化情况
Fig.6
Prediction results of model transfer-based renewable energy output versus numbers of migrated layers
图7
图7
基于模型迁移的可再生能源出力预测精度随迁移层数变化情况
Fig.7
Prediction accuracy of model transfer-based renewable energy output versus numbers of migrated layers
3.4 微电网优化调度结果
微电网的风光出力数据由DANN-LSTM预测得到,负荷和实时电价来自美国加州电力系统CASIO[35 ] 真实的运行数据.实验中仿真步长取为1 h,每次参与训练样本数设置为128,其他参数设置及仿真环境详见附录表A1.
为了展现所提方法的最优动作空间探索能力,分别将LSTM、LSTM-TL和传统DANN这3种方法与所提方法DANN-LSTM预测所得可再生能源出力作为状态空间进行训练,并将TD3算法与DDPG算法在4种状态空间下所得奖励值进行对比,选取在TD3算法中奖励值最高的两种结果和DDPG算法训练结果中奖励值最高的结果及对应的日运行成本进行展示.图8 和图9 分别给出智能体训练过程中的奖励值和日运行成本变化.由图可见,在初始阶段,由于训练不充分,所以智能体抽取到低奖励值经验的概率较高;随着智能体不断与环境交互并使用高奖励值经验改进策略,在后续训练过程中能够做出更优秀的调度决策并获得更高奖励值,最终学习到日运行成本最低的调度策略.DDPG算法在 2 400 回合奖励函数出现异常值,其原因是神经网络发生“网络退化”现象[32 ] .DDPG算法使用确定性策略,倾向于根据当前的最优动作选择策略.在初始训练阶段,随机性较大的探索有助于探索更多状态-动作对,并发现更好的储能系统充放电策略.但随着训练进行,随机性减少,模型趋向于利用已知的最优充放电动作,可能导致陷入局部最优解.在某些情况下,模型可能会重新探索先前被认为是次优的动作,即输出的策略朝着奖励值较低的轨迹上前进而导致奖励值骤降,随着经验回放缓冲区的更新和样本的变化,模型将有机会学习到更多高奖励的样本,从而使奖励值回到原来的收敛值.与DDPG算法相比,TD3通过在动作策略中加入噪声避免储能动作陷入局部最优,增大最优动作被探索到的概率,并通过值函数的双重更新减小值函数的估计误差,提高智能体控制储能系统在每一调度时段内做出最优充放电动作的决策能力.
图8
图8
奖励值随训练轮数变化结果
Fig.8
Reward value versus numbers of training rounds
图9
图9
日运行成本随训练轮数变化
Fig.9
Daily running cost versus numbers of training rounds
经过约 1 000 回合后,奖励值趋于收敛,DDPG算法训练所得的奖励值约为70,而使用不同预测数据作为状态空间的TD3算法所得的奖励值均高于DDPG.同时,可以看出在同时选用TD3作为优化算法的前提下,使用不同预测精度的可再生能源出力数据作为状态空间的智能体的学习效果也有所差异:使用传统DANN出力预测数据作为状态空间得到的奖励值约为80;使用所提DANN-LSTM方法所得出力预测数据作为状态空间得到的奖励值最高,约为110,同时得到的日运行成本最低,约为910美元,比DDPG算法训练得到的日运行成本降低约90美元,证明所提方法下所得最优调度策略的科学性和经济性.
图10 展示了基于DANN-LSTM预测数据和TD3算法的储能系统充放电动作.通过该调度策略,在确保电力需求得到满足的同时,尽可能降低成本.由图可知,8:00—13:00 系统内光伏出力波动较大,蓄电池无法进行快速调节以应对系统内突变产生的波动.因系统储能形式多样,故超级电容可在光伏与负突变时段快速做出调整,抑制光伏出力波动,降低光伏出力特性对系统的影响.与此同时,储能系统选择在 9:00—13:00 电价较低时进行充电,在 16:00—21:00 电价较高时放电,通过低买高卖的套利策略提高经济效益.
图10
图10
储能充放电动作
Fig.10
Storage charge and discharge
4 结论
提出一种基于小样本数据驱动模式下的新建微电网优化调度策略.设计了一种DANN-LSTM网络结构,通过域对抗的思想训练网络,提高了小样本条件下可再生能源出力预测精度.以最小化运行成本为目标,将优化调度问题转化为马尔可夫决策过程,应用深度强化学习TD3算法进行求解.仿真结果表明:
(1) 与模型迁移方法和传统的DANN相比,所提DANN-LSTM网络结构能有效减小风光出力的预测误差,为小样本条件下新建微电网调度策略的寻优提供有效的数据支撑.
(2) 所使用的TD3算法相较于DDPG能够寻找到更优的储能充放电动作,从而得到更低的系统运行成本.
所提方法在新建单微网中的应用效果良好,但未考虑多微网场景下的协调优化调度等更复杂的场景,这将是下一步的重点研究工作.
附录见本刊网络版(xuebao.sjtu.edu.cn/article/2025/1006-2467/1006-2467-59-06-0732.shtml)
参考文献
View Option
[1]
王文彬 , 郑蜀江 , 范瑞祥 , 等 . “双碳” 背景下微网分布式电能交易绩效评价指标与方法
[J]. 上海交通大学学报 , 2022 , 56 (3 ): 312 -324 .
DOI:10.16183/j.cnki.jsjtu.2021.391
[本文引用: 1]
随着分布式发电研究与应用的迅速发展,分布式交易市场作为一种新型的电力交易模式,能够有效提升可再生能源消纳率,是推动实现“碳达峰、碳中和”目标的重要手段.将市场评价机制引入用户的竞拍交易机制中,将促使用户考虑市场评价机制对其交易策略的影响,推动分布式交易市场的良性发展.针对微网用户间的分布式电能交易市场展开研究,首先,以市场参与主体及交易支撑软硬件为研究对象,分别从电能供应能力、用户满意度、平台安全性等方面建立多维度绩效评价指标体系.然后,对分布式电能交易市场评价方法研究现状进行总结与梳理,并从指标体系建立、指标计算方法及综合评价方法三方面分析了分布式电能交易绩效评价的关键技术.最后,结合当前发展现状,对未来分布式电能交易绩效评价的研究方向进行了展望.
WANG Wenbin , ZHENG Shujiang , FAN Ruixiang , et al . Performance evaluation index and method of micro-grid distributed electricity trading under the background of “carbon peaking and carbon neutrality”
[J]. Journal of Shanghai Jiao Tong University , 2022 , 56 (3 ): 312 -324 .
[本文引用: 1]
[2]
ASLAM S , HERODOTOU H , MOHSIN S M , et al . A survey on deep learning methods for power load and renewable energy forecasting in smart microgrids
[J]. Renewable & Sustainable Energy Reviews , 2021 , 144 : 110992 .
[本文引用: 1]
[3]
杨茂 , 王金鑫 . 考虑可再生能源出力不确定的孤岛型微电网优化调度
[J]. 中国电机工程学报 , 2021 , 41 (3 ): 973 -985 .
[本文引用: 1]
YANG Mao , WANG Jinxin . Optimal scheduling of islanded microgrid considering uncertain output of renewable energy
[J]. Proceedings of the CSEE , 2021 , 41 (3 ): 973 -985 .
[本文引用: 1]
[4]
GAMIL M M , UEDA S , NAKADOMARI A , et al . Optimal multi-objective power scheduling of a residential microgrid considering renewable sources and demand response technique
[J]. Sustainability , 2022 , 14 (21 ): 13709 .
[本文引用: 1]
[5]
WANG J H , YAN G W , REN M F , et al . Short term photovoltaic power prediction based on transfer learning and considering sequence uncertainty
[J]. Journal of Renewable & Sustainable Energy , 2023 , 15 (1 ): 013501 .
[本文引用: 1]
[6]
乔颖 , 孙荣富 , 丁然 , 等 . 基于数据增强的分布式光伏电站群短期功率预测(一): 方法框架与数据增强
[J]. 电网技术 , 2021 , 45 (5 ): 1799 -1808 .
[本文引用: 1]
QIAO Ying , SUN Rongfu , DING Ran , et al . Distributed photovoltaic station cluster gridding short-term power forecasting part I: Methodology and data augmentation
[J]. Power System Technology , 2021 , 45 (5 ): 1799 -1808 .
[本文引用: 1]
[7]
唱友义 , 孙赫阳 , 顾泰宇 , 等 . 采用历史数据扩充方法的风力发电量月度预测
[J]. 电网技术 , 2021 , 45 (3 ): 1059 -1068 .
CHANG Youyi , SUN Heyang , GU Taiyu , et al . Monthly forecast of wind power generation using historical data expansion method
[J]. Power System Technology , 2021 , 45 (3 ): 1059 -1068 .
[22]
LIANG Hong , LI Hongxin , ZHANG Huaying , et al . Control strategy of microgrid energy storage system based on deep reinforcement learning
[J]. Power System Technology , 2021 , 45 (10 ): 3869 -3877 .
[本文引用: 1]
[23]
黎海涛 , 申保晨 , 杨艳红 , 等 . 基于改进竞争深度Q网络算法的微电网能量管理与优化策略
[J]. 电力系统自动化 , 2022 , 46 (7 ): 42 -49 .
[本文引用: 1]
LI Haitao , SHEN Baochen , YANG Yanhong , et al . Energy management and optimization strategy for microgrid based on improved dueling deep Q network algorithm
[J]. Automation of Electric Power Systems , 2022 , 46 (7 ): 42 -49 .
[本文引用: 1]
[24]
冯昌森 , 张瑜 , 文福拴 , 等 . 基于深度期望Q网络算法的微电网能量管理策略
[J]. 电力系统自动化 , 2022 , 46 (3 ): 14 -22 .
[本文引用: 1]
FENG Changsen , ZHANG Yu , WEN Fushuan , et al . Energy management strategy for microgrid based on deep expected Q network algorithm
[J]. Automation of Electric Power Systems , 2022 , 46 (3 ): 14 -22 .
[本文引用: 1]
[25]
叶宇剑 , 袁泉 , 汤奕 , 等 . 抑制柔性负荷过响应的微网分散式调控参数优化
[J]. 中国电机工程学报 , 2022 , 42 (5 ): 1748 -1759 .
[本文引用: 1]
YE Yujian , YUAN Quan , TANG Yi , et al . Decentralized coordination parameters optimization in microgrids mitigating demand response synchronization effect of flexible loads
[J]. Proceedings of the CSEE , 2022 , 42 (5 ): 1748 -1759 .
[本文引用: 1]
[26]
赵鹏杰 , 吴俊勇 , 王燚 , 等 . 基于深度强化学习的微电网优化运行策略
[J]. 电力自动化设备 , 2022 , 42 (11 ): 9 -16 .
[本文引用: 1]
ZHAO Pengjie , WU Junyong , WANG Yi , et al . Optimal operation strategy of microgrid based on deep reinforcement learning
[J]. Electric Power Automation Equipment , 2022 , 42 (11 ): 9 -16 .
[本文引用: 1]
[27]
GANIN Y , USTINOVA E , AJAKAN H , et al . Domain-adversarial training of neural networks
[J]. The Journal of Machine Learning Research , 2016 , 17 (1 ): 2096 -2030 .
[本文引用: 1]
[28]
邵振国 , 张承圣 , 陈飞雄 , 等 . 生成对抗网络及其在电力系统中的应用综述
[J]. 中国电机工程学报 , 2023 , 43 (3 ): 987 -1004 .
[本文引用: 1]
[8]
LIU G L , ZHANG S W , ZHAO H , et al . Super-resolution perception for wind power forecasting by enhancing historical data
[J]. Frontiers in Energy Research , 2022 , 10 : 959333 .
[本文引用: 1]
[9]
史凯钰 , 张东霞 , 韩肖清 , 等 . 基于LSTM与迁移学习的光伏发电功率预测数字孪生模型
[J]. 电网技术 , 2022 , 46 (4 ): 1363 -1372 .
[本文引用: 3]
SHI Kaiyu , ZHANG Dongxia , HAN Xiaoqing , et al . Digital twin model of photovoltaic power generation prediction based on LSTM and transfer learning
[J]. Power System Technology , 2022 , 46 (4 ): 1363 -1372 .
[本文引用: 3]
[10]
魏泽涛 , 刘友波 , 沈晓东 , 等 . 基于样本数据迁移学习的贫资料地区小水电超短期出力建模及发电预测
[J]. 中国电机工程学报 , 2023 , 43 (7 ): 2652 -2666 .
[本文引用: 1]
WEI Zetao , LIU Youbo , SHEN Xiaodong , et al . Ultra-short-term power generation modeling and prediction for small hydropower in data-scarce areas based on sample data transfer learning
[J]. Proceedings of the CSEE , 2023 , 43 (7 ): 2652 -2666 .
[本文引用: 1]
[11]
LUO X , ZHANG D X , ZHU X . Combining transfer learning and constrained long short-term memory for power generation forecasting of newly-constructed photovoltaic plants
[J]. Renewable Energy , 2022 , 185 : 1062 -1077 .
[本文引用: 1]
[12]
程凯 , 彭小圣 , 徐其友 , 等 . 基于特征选择与多层级深度迁移学习的风电场短期功率预测
[J]. 高电压技术 , 2022 , 48 (2 ): 497 -503 .
[本文引用: 1]
CHENG Kai , PENG Xiaosheng , XU Qiyou , et al . Short-term wind power prediction based on feature selection and multi-level deep transfer learning
[J]. High Voltage Engineering , 2022 , 48 (2 ): 497 -503 .
[本文引用: 1]
[13]
张童彦 , 廖清芬 , 唐飞 , 等 . 基于气象资源插值与迁移学习的广域分布式光伏功率预测方法
[J]. 中国电机工程学报 , 2023 , 43 (20 ): 7929 -7940 .
[本文引用: 1]
ZHANG Tongyan , LIAO Qingfen , TANG Fei , et al . Wide-area distributed photovoltaic power forecast method based on meteorological resource interpolation and transfer learning
[J]. Proceedings of the CSEE , 2023 , 43 (20 ): 7929 -7940 .
[本文引用: 1]
[14]
米阳 , 彭建伟 , 陈博洋 , 等 . 基于一致性原理和梯度下降法的微电网完全分布式优化调度
[J]. 电力系统保护与控制 , 2022 , 50 (15 ): 1 -10 .
[本文引用: 1]
[28]
SHAO Zhenguo , ZHANG Chengsheng , CHEN Fei-xiong , et al . A review on generative adversarial networks for power system applications
[J]. Proceedings of the CSEE , 2023 , 43 (3 ): 987 -1004 .
[本文引用: 1]
[29]
史加荣 , 王丹 , 尚凡华 , 等 . 随机梯度下降算法研究进展
[J]. 自动化学报 , 2021 , 47 (9 ): 2103 -2119 .
[本文引用: 1]
SHI Jiarong , WANG Dan , SHANG Fanhua , et al . Research advances on stochastic gradient descent algorithms
[J]. Acta Automatica Sinica , 2021 , 47 (9 ): 2103 -2119 .
[本文引用: 1]
[30]
何颖源 , 陈永翀 , 刘勇 , 等 . 储能的度电成本和里程成本分析
[J]. 电工电能新技术 , 2019 , 38 (9 ): 1 -10 .
DOI:10.12067/ATEEE1907045
[本文引用: 1]
储能是促进可再生能源消纳和提升电网韧性的重要手段,而储能成本是决定储能技术应用和产业发展规模的重要参数。本文针对典型的容量型和功率型储能应用场景,结合产业调研数据和储能全生命周期技术分析,对储能度电成本和里程成本进行测算。结果表明,电化学储能目前的度电成本大致在0.6~0.9元/(kW·h),距离规模应用的目标成本0.3~0.4元/(kW·h)还有相当的差距。因此,储能技术的发展需要围绕“低成本、长寿命、高安全和易回收”的目标,在综合考虑系统制造、系统寿命、系统安全和回收再生的基础上,开发变革性的储能技术和产品。本文工作对于构建市场导向的绿色储能技术创新体系具有重要参考意义。
HE Yingyuan , CHEN Yongchong , LIU Yong , et al . Analysis of cost per kilowatt-hour and cost per mileage for energy storage technologies
[J]. Advanced Technology of Electrical Engineering & Energy , 2019 , 38 (9 ): 1 -10 .
[本文引用: 1]
[31]
冯斌 , 胡轶婕 , 黄刚 , 等 . 基于深度强化学习的新型电力系统调度优化方法综述
[J]. 电力系统自动化 , 2023 , 47 (17 ): 187 -199 .
[本文引用: 1]
FENG Bin , HU Yijie , HUANG Gang , et al . Review on optimization methods for new power system dispatch based on deep reinforcement learning
[J]. Automation of Electric Power Systems , 2023 , 47 (17 ): 187 -199 .
[本文引用: 1]
[32]
FUJIMOTO S , VAN HOOF H , MEGER D . Addressing function approximation error in actor-critic methods
[C]// Proceedings of the 35th International Conference on Machine Learning . Stockholm, Sweden : PMLR , 2018 : 1587 -1596 .
[本文引用: 3]
[33]
PAPATHANASSIOU S , HATZIARGYRIOU N , STRUNZ K . A benchmark low voltage microgrid network
[C]// Proceedings of the CIGRE Symposium: Power Systems with Dispersed Generation . Athens, Greece : CIGRE , 2005 : 1 -8 .
[本文引用: 1]
[34]
PAN S J , YANG Q . A survey on transfer learning
[J]. IEEE Transactions on Knowledge & Data Engineering , 2010 , 22 (10 ): 1345 -1359 .
[本文引用: 1]
[35]
CCE . California ISO open access same-time information system (OASIS)
[DB/OL]. (2022-12-02 )[2023-07-28 ]. https://www.energyfreedomco.org/elec-system.php.
URL
[本文引用: 1]
[14]
MI Yang , PENG Jianwei , CHEN Boyang , et al . Fully distributed optimal dispatch of a microgrid based on consensus principle and gradient descent
[J]. Power System Protection & Control , 2022 , 50 (15 ): 1 -10 .
[本文引用: 1]
[15]
陆秋瑜 , 于珍 , 杨银国 , 等 . 考虑源荷功率不确定性的海上风力发电多微网两阶段优化调度
[J]. 上海交通大学学报 , 2022 , 56 (10 ): 1308 -1316 .
DOI:10.16183/j.cnki.jsjtu.2021.409
针对海上风力发电多微网源荷功率不确定性大、经济效益低的问题,提出考虑源荷不确定性的海上风力发电多微网两阶段优化调度方法,以提升海上风力发电多微网的日运行收益.所提两阶段优化调度方法包括日前和时前两个阶段.在日前阶段,所提方法基于风力发电出力和负荷需求预测数据,考虑预测误差的分布特征,建立随机优化模型,制定燃油发电机组组合计划和电池储能荷电状态值,从而最大化日运行收益的期望值.在日前优化的基础上,依托时前风力发电出力和负荷需求的预测数据,建立确定性优化模型,通过调节燃油发电机组出力、风力发电出力和电池储能充放电功率,最大化每小时的运行收益.以实际工程中的海上风力发电多微网源荷预测数据为基础,建立仿真模型,对所提方法进行验证.仿真结果表明,与传统调度方法相比,所提两阶段优化调度方法可以提高运行收益和风力发电资源整体消纳率.
LU Qiuyu , YU Zhen , YANG Yinguo , et al . Two-stage optimal schedule of offshore wind-power-integrated multi-microgrid considering uncertain power of sources and loads
[J]. Journal of Shanghai Jiao Tong University , 2022 , 56 (10 ): 1308 -1316 .
[16]
夏超英 , 苗海丽 . 基于二次型最优控制的微电网实时能量管理策略
[J]. 中国电机工程学报 , 2019 , 39 (3 ): 721 -730 .
[本文引用: 1]
XIA Chaoying , MIAO Haili . Real-time energy management strategy for micro-grid based on the quadratic optimal control theory
[J]. Proceedings of the CSEE , 2019 , 39 (3 ): 721 -730 .
[本文引用: 1]
[17]
姚建国 , 余涛 , 杨胜春 , 等 . 提升电网调度中人工智能可用性的混合增强智能知识演化技术
[J]. 电力系统自动化 , 2022 , 46 (20 ): 1 -12 .
[本文引用: 1]
YAO Jianguo , YU Tao , YANG Shengchun , et al . Knowledge evolution technology based on hybrid-augmented intelligence for improving practicability of artificial intelligence in power grid dispatch
[J]. Automation of Electric Power Systems , 2022 , 46 (20 ): 1 -12 .
[本文引用: 1]
[18]
陈亭轩 , 徐潇源 , 严正 , 等 . 基于深度强化学习的光储充电站储能系统优化运行
[J]. 电力自动化设备 , 2021 , 41 (10 ): 90 -98 .
CHEN Tingxuan , XU Xiaoyuan , YAN Zheng , et al . Optimal operation based on deep reinforcement learning for energy storage system in photovoltaic-storage charging station
[J]. Electric Power Automation Equipment , 2021 , 41 (10 ): 90 -98 .
[19]
杨挺 , 赵黎媛 , 王成山 . 人工智能在电力系统及综合能源系统中的应用综述
[J]. 电力系统自动化 , 2019 , 43 (1 ): 2 -14 .
YANG Ting , ZHAO Liyuan , WANG Chengshan . Review on application of artificial intelligence in power system and integrated energy system
[J]. Automation of Electric Power Systems , 2019 , 43 (1 ): 2 -14 .
[20]
吴倩红 , 韩蓓 , 冯琳 , 等 . “人工智能+” 时代下的智能电网预测分析
[J]. 上海交通大学学报 , 2018 , 52 (10 ): 1206 -1219 .
DOI:10.16183/j.cnki.jsjtu.2018.10.008
智能电网预测分析是保证智能电网经济、安全运行的基础.借助人工智能的突破性技术以及智能电网的大数据环境,实现基于人工智能的智能电网预测分析对电力系统发展具有重大意义,为此提出了“人工智能+”预测.首先介绍了人工智能与智能电网预测分析的背景及所涉及的问题;然后根据应用的不同侧重点,展开人工智能在新能源预测、负荷预测、静态电压稳定预测及其相关预防性措施三个方面的研究综述及研究展望,并对预测中所涉及的其他相关技术(数据样本产生、不平衡样本、特征提取)进行了总结;最后对人工智能局限性及发展进行了讨论,并提出了一些建议与设想.
WU Qianhong , HAN Bei , FENG Lin , et al . “AI+” based smart grid prediction analysis
[J]. Journal of Shanghai Jiao Tong University , 2018 , 52 (10 ): 1206 -1219 .
[21]
CHEN S , LIU Y H , GUO Z W , et al . Deep reinforcement learning based research on low-carbon scheduling with distribution network schedulable resources
[J]. IET Generation, Transmission & Distribution , 2023 , 17 (10 ): 2289 -2300 .
[本文引用: 1]
[22]
梁宏 , 李鸿鑫 , 张华赢 , 等 . 基于深度强化学习的微网储能系统控制策略研究
[J]. 电网技术 , 2021 , 45 (10 ): 3869 -3877 .
[本文引用: 1]
“双碳” 背景下微网分布式电能交易绩效评价指标与方法
1
2022
... “双碳”背景下风光等可再生能源在传统电网中的渗透率不断提高.微电网能够解决分布式电源的灵活高效应用问题,实现对负荷多种能源形式的高可靠供给,近年来发展迅速[1 ] .但微电网中可再生能源出力波动性和不确定性严重影响能源供需平衡[2 ] 、储能系统能量管理[3 ] 、需求响应管理[4 ] ,对其出力进行精确预测能够有效提高微电网日前调度计划制定科学性[5 ] .大量新建的微电网投入运行时间短,其中可再生能源缺少历史数据而更难以建立高精度的出力预测模型,因此在小样本数据条件下实现新建微电网的日前优化调度运行成为一个亟待解决的问题. ...
Performance evaluation index and method of micro-grid distributed electricity trading under the background of “carbon peaking and carbon neutrality”
1
2022
... “双碳”背景下风光等可再生能源在传统电网中的渗透率不断提高.微电网能够解决分布式电源的灵活高效应用问题,实现对负荷多种能源形式的高可靠供给,近年来发展迅速[1 ] .但微电网中可再生能源出力波动性和不确定性严重影响能源供需平衡[2 ] 、储能系统能量管理[3 ] 、需求响应管理[4 ] ,对其出力进行精确预测能够有效提高微电网日前调度计划制定科学性[5 ] .大量新建的微电网投入运行时间短,其中可再生能源缺少历史数据而更难以建立高精度的出力预测模型,因此在小样本数据条件下实现新建微电网的日前优化调度运行成为一个亟待解决的问题. ...
A survey on deep learning methods for power load and renewable energy forecasting in smart microgrids
1
2021
... “双碳”背景下风光等可再生能源在传统电网中的渗透率不断提高.微电网能够解决分布式电源的灵活高效应用问题,实现对负荷多种能源形式的高可靠供给,近年来发展迅速[1 ] .但微电网中可再生能源出力波动性和不确定性严重影响能源供需平衡[2 ] 、储能系统能量管理[3 ] 、需求响应管理[4 ] ,对其出力进行精确预测能够有效提高微电网日前调度计划制定科学性[5 ] .大量新建的微电网投入运行时间短,其中可再生能源缺少历史数据而更难以建立高精度的出力预测模型,因此在小样本数据条件下实现新建微电网的日前优化调度运行成为一个亟待解决的问题. ...
考虑可再生能源出力不确定的孤岛型微电网优化调度
1
2021
... “双碳”背景下风光等可再生能源在传统电网中的渗透率不断提高.微电网能够解决分布式电源的灵活高效应用问题,实现对负荷多种能源形式的高可靠供给,近年来发展迅速[1 ] .但微电网中可再生能源出力波动性和不确定性严重影响能源供需平衡[2 ] 、储能系统能量管理[3 ] 、需求响应管理[4 ] ,对其出力进行精确预测能够有效提高微电网日前调度计划制定科学性[5 ] .大量新建的微电网投入运行时间短,其中可再生能源缺少历史数据而更难以建立高精度的出力预测模型,因此在小样本数据条件下实现新建微电网的日前优化调度运行成为一个亟待解决的问题. ...
Optimal scheduling of islanded microgrid considering uncertain output of renewable energy
1
2021
... “双碳”背景下风光等可再生能源在传统电网中的渗透率不断提高.微电网能够解决分布式电源的灵活高效应用问题,实现对负荷多种能源形式的高可靠供给,近年来发展迅速[1 ] .但微电网中可再生能源出力波动性和不确定性严重影响能源供需平衡[2 ] 、储能系统能量管理[3 ] 、需求响应管理[4 ] ,对其出力进行精确预测能够有效提高微电网日前调度计划制定科学性[5 ] .大量新建的微电网投入运行时间短,其中可再生能源缺少历史数据而更难以建立高精度的出力预测模型,因此在小样本数据条件下实现新建微电网的日前优化调度运行成为一个亟待解决的问题. ...
Optimal multi-objective power scheduling of a residential microgrid considering renewable sources and demand response technique
1
2022
... “双碳”背景下风光等可再生能源在传统电网中的渗透率不断提高.微电网能够解决分布式电源的灵活高效应用问题,实现对负荷多种能源形式的高可靠供给,近年来发展迅速[1 ] .但微电网中可再生能源出力波动性和不确定性严重影响能源供需平衡[2 ] 、储能系统能量管理[3 ] 、需求响应管理[4 ] ,对其出力进行精确预测能够有效提高微电网日前调度计划制定科学性[5 ] .大量新建的微电网投入运行时间短,其中可再生能源缺少历史数据而更难以建立高精度的出力预测模型,因此在小样本数据条件下实现新建微电网的日前优化调度运行成为一个亟待解决的问题. ...
Short term photovoltaic power prediction based on transfer learning and considering sequence uncertainty
1
2023
... “双碳”背景下风光等可再生能源在传统电网中的渗透率不断提高.微电网能够解决分布式电源的灵活高效应用问题,实现对负荷多种能源形式的高可靠供给,近年来发展迅速[1 ] .但微电网中可再生能源出力波动性和不确定性严重影响能源供需平衡[2 ] 、储能系统能量管理[3 ] 、需求响应管理[4 ] ,对其出力进行精确预测能够有效提高微电网日前调度计划制定科学性[5 ] .大量新建的微电网投入运行时间短,其中可再生能源缺少历史数据而更难以建立高精度的出力预测模型,因此在小样本数据条件下实现新建微电网的日前优化调度运行成为一个亟待解决的问题. ...
基于数据增强的分布式光伏电站群短期功率预测(一): 方法框架与数据增强
1
2021
... 针对小样本条件下可再生能源出力预测问题研究方法可归纳为以下两类,一是利用数据增强的方法对少量历史数据进行扩充[6 -8 ] 来增加参与预测任务的数据量,进而提高预测精度.然而基于数据增强的方法从相似域抽取样本时存在人为随机性,难以表现出可再生能源发电的时序特性.二是基于模型迁移的方法利用公共知识进行泛化,该方法首先在大数据集上训练得到一个具有强泛化能力的模型,然后使用少量目标可再生能源出力数据对该模型进行参数微调,避免数据扩充方法中人为抽取样本的过程,提升预测精度同时减少计算时间.文献[9 -10 ]中分别对出力数据丰富的光伏电站和水电站出力进行建模并将该模型外推至目标电站的出力预测任务.文献[11 ]中将带物理约束性的长短期记忆网络(long short-term memory,LSTM)作为预训练网络,在多种天气条件下验证了新建光伏(photovoltaic,PV)电站的功率预测效果.文献[12 ]中提出目标风电(wind turbine,WT)出力的多层级迁移学习模型,验证了迁移层数对出力预测精度的影响.文献[13 ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低. ...
Distributed photovoltaic station cluster gridding short-term power forecasting part I: Methodology and data augmentation
1
2021
... 针对小样本条件下可再生能源出力预测问题研究方法可归纳为以下两类,一是利用数据增强的方法对少量历史数据进行扩充[6 -8 ] 来增加参与预测任务的数据量,进而提高预测精度.然而基于数据增强的方法从相似域抽取样本时存在人为随机性,难以表现出可再生能源发电的时序特性.二是基于模型迁移的方法利用公共知识进行泛化,该方法首先在大数据集上训练得到一个具有强泛化能力的模型,然后使用少量目标可再生能源出力数据对该模型进行参数微调,避免数据扩充方法中人为抽取样本的过程,提升预测精度同时减少计算时间.文献[9 -10 ]中分别对出力数据丰富的光伏电站和水电站出力进行建模并将该模型外推至目标电站的出力预测任务.文献[11 ]中将带物理约束性的长短期记忆网络(long short-term memory,LSTM)作为预训练网络,在多种天气条件下验证了新建光伏(photovoltaic,PV)电站的功率预测效果.文献[12 ]中提出目标风电(wind turbine,WT)出力的多层级迁移学习模型,验证了迁移层数对出力预测精度的影响.文献[13 ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低. ...
采用历史数据扩充方法的风力发电量月度预测
0
2021
Monthly forecast of wind power generation using historical data expansion method
0
2021
Control strategy of microgrid energy storage system based on deep reinforcement learning
1
2021
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
基于改进竞争深度Q网络算法的微电网能量管理与优化策略
1
2022
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
Energy management and optimization strategy for microgrid based on improved dueling deep Q network algorithm
1
2022
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
基于深度期望Q网络算法的微电网能量管理策略
1
2022
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
Energy management strategy for microgrid based on deep expected Q network algorithm
1
2022
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
抑制柔性负荷过响应的微网分散式调控参数优化
1
2022
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
Decentralized coordination parameters optimization in microgrids mitigating demand response synchronization effect of flexible loads
1
2022
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
基于深度强化学习的微电网优化运行策略
1
2022
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
Optimal operation strategy of microgrid based on deep reinforcement learning
1
2022
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
Domain-adversarial training of neural networks
1
2016
... 为了提高模型迁移的方法在目标域小样本条件下可再生能源出力数据上的泛化性能进而降低预测误差,文献[27 ]中基于生成对抗网络(generative adversarial network,GAN)的思想提出一种较为新颖的DANN,该网络可以有效提高目标域可再生能源出力数据在小样本条件下的学习效果进而提升预测精度. ...
生成对抗网络及其在电力系统中的应用综述
1
2023
... 在数据正向映射完成后,DANN-LSTM进行误差反向传播过程.误差反向传播是进行网络参数优化的过程.由式(1)和式(2)可知预测器和域分类器的输入都来自特征提取器,然而域分类器和预测器的损失函数寻优方向相反,导致特征提取器进行参数更新时,域分类损失的梯度与预测损失梯度更新方向相反.常规GAN的做法是以分别固定生成器与鉴别器参数的方式进行分阶段训练[28 ] ,这会削弱两个网络间的耦合效果,限制信息交互能力,进而影响生成高质量出力预测数据的能力.DANN在特征提取器和域分类器之间加入梯度翻转层增强各个网络之间的协调性和一致性,将特征提取器、域分类器和预测器作为一个整体实现“端对端”训练,从而可以在目标域上获得更好的性能.具体做法是在域分类损失反向传播过程中加入梯度反转层使梯度方向自动取反并乘以平衡系数λ ,提升模型的域适应能力.DANN-LSTM的总优化函数为 ...
Super-resolution perception for wind power forecasting by enhancing historical data
1
2022
... 针对小样本条件下可再生能源出力预测问题研究方法可归纳为以下两类,一是利用数据增强的方法对少量历史数据进行扩充[6 -8 ] 来增加参与预测任务的数据量,进而提高预测精度.然而基于数据增强的方法从相似域抽取样本时存在人为随机性,难以表现出可再生能源发电的时序特性.二是基于模型迁移的方法利用公共知识进行泛化,该方法首先在大数据集上训练得到一个具有强泛化能力的模型,然后使用少量目标可再生能源出力数据对该模型进行参数微调,避免数据扩充方法中人为抽取样本的过程,提升预测精度同时减少计算时间.文献[9 -10 ]中分别对出力数据丰富的光伏电站和水电站出力进行建模并将该模型外推至目标电站的出力预测任务.文献[11 ]中将带物理约束性的长短期记忆网络(long short-term memory,LSTM)作为预训练网络,在多种天气条件下验证了新建光伏(photovoltaic,PV)电站的功率预测效果.文献[12 ]中提出目标风电(wind turbine,WT)出力的多层级迁移学习模型,验证了迁移层数对出力预测精度的影响.文献[13 ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低. ...
基于LSTM与迁移学习的光伏发电功率预测数字孪生模型
3
2022
... 针对小样本条件下可再生能源出力预测问题研究方法可归纳为以下两类,一是利用数据增强的方法对少量历史数据进行扩充[6 -8 ] 来增加参与预测任务的数据量,进而提高预测精度.然而基于数据增强的方法从相似域抽取样本时存在人为随机性,难以表现出可再生能源发电的时序特性.二是基于模型迁移的方法利用公共知识进行泛化,该方法首先在大数据集上训练得到一个具有强泛化能力的模型,然后使用少量目标可再生能源出力数据对该模型进行参数微调,避免数据扩充方法中人为抽取样本的过程,提升预测精度同时减少计算时间.文献[9 -10 ]中分别对出力数据丰富的光伏电站和水电站出力进行建模并将该模型外推至目标电站的出力预测任务.文献[11 ]中将带物理约束性的长短期记忆网络(long short-term memory,LSTM)作为预训练网络,在多种天气条件下验证了新建光伏(photovoltaic,PV)电站的功率预测效果.文献[12 ]中提出目标风电(wind turbine,WT)出力的多层级迁移学习模型,验证了迁移层数对出力预测精度的影响.文献[13 ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低. ...
... ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低. ...
... 可再生能源出力通常表现出较强的时序特性,而传统DANN模型使用少量神经元构造的特征提取器由于结构单一,难以处理时序数据间的长期依赖关系.LSTM通过引入门机制[9 ] ,能够有效捕捉到长时序可再生能源数据随时间变化的特征,因此将其用作特征提取器来对长期的源域和目标域少量数据进行特征提取.综上,本文将LSTM引入DANN中,设计出改进的DANN-LSTM网络结构,其能够适用于小样本条件下可再生能源长时序数据出力预测任务. ...
Digital twin model of photovoltaic power generation prediction based on LSTM and transfer learning
3
2022
... 针对小样本条件下可再生能源出力预测问题研究方法可归纳为以下两类,一是利用数据增强的方法对少量历史数据进行扩充[6 -8 ] 来增加参与预测任务的数据量,进而提高预测精度.然而基于数据增强的方法从相似域抽取样本时存在人为随机性,难以表现出可再生能源发电的时序特性.二是基于模型迁移的方法利用公共知识进行泛化,该方法首先在大数据集上训练得到一个具有强泛化能力的模型,然后使用少量目标可再生能源出力数据对该模型进行参数微调,避免数据扩充方法中人为抽取样本的过程,提升预测精度同时减少计算时间.文献[9 -10 ]中分别对出力数据丰富的光伏电站和水电站出力进行建模并将该模型外推至目标电站的出力预测任务.文献[11 ]中将带物理约束性的长短期记忆网络(long short-term memory,LSTM)作为预训练网络,在多种天气条件下验证了新建光伏(photovoltaic,PV)电站的功率预测效果.文献[12 ]中提出目标风电(wind turbine,WT)出力的多层级迁移学习模型,验证了迁移层数对出力预测精度的影响.文献[13 ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低. ...
... ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低. ...
... 可再生能源出力通常表现出较强的时序特性,而传统DANN模型使用少量神经元构造的特征提取器由于结构单一,难以处理时序数据间的长期依赖关系.LSTM通过引入门机制[9 ] ,能够有效捕捉到长时序可再生能源数据随时间变化的特征,因此将其用作特征提取器来对长期的源域和目标域少量数据进行特征提取.综上,本文将LSTM引入DANN中,设计出改进的DANN-LSTM网络结构,其能够适用于小样本条件下可再生能源长时序数据出力预测任务. ...
基于样本数据迁移学习的贫资料地区小水电超短期出力建模及发电预测
1
2023
... 针对小样本条件下可再生能源出力预测问题研究方法可归纳为以下两类,一是利用数据增强的方法对少量历史数据进行扩充[6 -8 ] 来增加参与预测任务的数据量,进而提高预测精度.然而基于数据增强的方法从相似域抽取样本时存在人为随机性,难以表现出可再生能源发电的时序特性.二是基于模型迁移的方法利用公共知识进行泛化,该方法首先在大数据集上训练得到一个具有强泛化能力的模型,然后使用少量目标可再生能源出力数据对该模型进行参数微调,避免数据扩充方法中人为抽取样本的过程,提升预测精度同时减少计算时间.文献[9 -10 ]中分别对出力数据丰富的光伏电站和水电站出力进行建模并将该模型外推至目标电站的出力预测任务.文献[11 ]中将带物理约束性的长短期记忆网络(long short-term memory,LSTM)作为预训练网络,在多种天气条件下验证了新建光伏(photovoltaic,PV)电站的功率预测效果.文献[12 ]中提出目标风电(wind turbine,WT)出力的多层级迁移学习模型,验证了迁移层数对出力预测精度的影响.文献[13 ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低. ...
Ultra-short-term power generation modeling and prediction for small hydropower in data-scarce areas based on sample data transfer learning
1
2023
... 针对小样本条件下可再生能源出力预测问题研究方法可归纳为以下两类,一是利用数据增强的方法对少量历史数据进行扩充[6 -8 ] 来增加参与预测任务的数据量,进而提高预测精度.然而基于数据增强的方法从相似域抽取样本时存在人为随机性,难以表现出可再生能源发电的时序特性.二是基于模型迁移的方法利用公共知识进行泛化,该方法首先在大数据集上训练得到一个具有强泛化能力的模型,然后使用少量目标可再生能源出力数据对该模型进行参数微调,避免数据扩充方法中人为抽取样本的过程,提升预测精度同时减少计算时间.文献[9 -10 ]中分别对出力数据丰富的光伏电站和水电站出力进行建模并将该模型外推至目标电站的出力预测任务.文献[11 ]中将带物理约束性的长短期记忆网络(long short-term memory,LSTM)作为预训练网络,在多种天气条件下验证了新建光伏(photovoltaic,PV)电站的功率预测效果.文献[12 ]中提出目标风电(wind turbine,WT)出力的多层级迁移学习模型,验证了迁移层数对出力预测精度的影响.文献[13 ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低. ...
Combining transfer learning and constrained long short-term memory for power generation forecasting of newly-constructed photovoltaic plants
1
2022
... 针对小样本条件下可再生能源出力预测问题研究方法可归纳为以下两类,一是利用数据增强的方法对少量历史数据进行扩充[6 -8 ] 来增加参与预测任务的数据量,进而提高预测精度.然而基于数据增强的方法从相似域抽取样本时存在人为随机性,难以表现出可再生能源发电的时序特性.二是基于模型迁移的方法利用公共知识进行泛化,该方法首先在大数据集上训练得到一个具有强泛化能力的模型,然后使用少量目标可再生能源出力数据对该模型进行参数微调,避免数据扩充方法中人为抽取样本的过程,提升预测精度同时减少计算时间.文献[9 -10 ]中分别对出力数据丰富的光伏电站和水电站出力进行建模并将该模型外推至目标电站的出力预测任务.文献[11 ]中将带物理约束性的长短期记忆网络(long short-term memory,LSTM)作为预训练网络,在多种天气条件下验证了新建光伏(photovoltaic,PV)电站的功率预测效果.文献[12 ]中提出目标风电(wind turbine,WT)出力的多层级迁移学习模型,验证了迁移层数对出力预测精度的影响.文献[13 ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低. ...
基于特征选择与多层级深度迁移学习的风电场短期功率预测
1
2022
... 针对小样本条件下可再生能源出力预测问题研究方法可归纳为以下两类,一是利用数据增强的方法对少量历史数据进行扩充[6 -8 ] 来增加参与预测任务的数据量,进而提高预测精度.然而基于数据增强的方法从相似域抽取样本时存在人为随机性,难以表现出可再生能源发电的时序特性.二是基于模型迁移的方法利用公共知识进行泛化,该方法首先在大数据集上训练得到一个具有强泛化能力的模型,然后使用少量目标可再生能源出力数据对该模型进行参数微调,避免数据扩充方法中人为抽取样本的过程,提升预测精度同时减少计算时间.文献[9 -10 ]中分别对出力数据丰富的光伏电站和水电站出力进行建模并将该模型外推至目标电站的出力预测任务.文献[11 ]中将带物理约束性的长短期记忆网络(long short-term memory,LSTM)作为预训练网络,在多种天气条件下验证了新建光伏(photovoltaic,PV)电站的功率预测效果.文献[12 ]中提出目标风电(wind turbine,WT)出力的多层级迁移学习模型,验证了迁移层数对出力预测精度的影响.文献[13 ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低. ...
Short-term wind power prediction based on feature selection and multi-level deep transfer learning
1
2022
... 针对小样本条件下可再生能源出力预测问题研究方法可归纳为以下两类,一是利用数据增强的方法对少量历史数据进行扩充[6 -8 ] 来增加参与预测任务的数据量,进而提高预测精度.然而基于数据增强的方法从相似域抽取样本时存在人为随机性,难以表现出可再生能源发电的时序特性.二是基于模型迁移的方法利用公共知识进行泛化,该方法首先在大数据集上训练得到一个具有强泛化能力的模型,然后使用少量目标可再生能源出力数据对该模型进行参数微调,避免数据扩充方法中人为抽取样本的过程,提升预测精度同时减少计算时间.文献[9 -10 ]中分别对出力数据丰富的光伏电站和水电站出力进行建模并将该模型外推至目标电站的出力预测任务.文献[11 ]中将带物理约束性的长短期记忆网络(long short-term memory,LSTM)作为预训练网络,在多种天气条件下验证了新建光伏(photovoltaic,PV)电站的功率预测效果.文献[12 ]中提出目标风电(wind turbine,WT)出力的多层级迁移学习模型,验证了迁移层数对出力预测精度的影响.文献[13 ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低. ...
基于气象资源插值与迁移学习的广域分布式光伏功率预测方法
1
2023
... 针对小样本条件下可再生能源出力预测问题研究方法可归纳为以下两类,一是利用数据增强的方法对少量历史数据进行扩充[6 -8 ] 来增加参与预测任务的数据量,进而提高预测精度.然而基于数据增强的方法从相似域抽取样本时存在人为随机性,难以表现出可再生能源发电的时序特性.二是基于模型迁移的方法利用公共知识进行泛化,该方法首先在大数据集上训练得到一个具有强泛化能力的模型,然后使用少量目标可再生能源出力数据对该模型进行参数微调,避免数据扩充方法中人为抽取样本的过程,提升预测精度同时减少计算时间.文献[9 -10 ]中分别对出力数据丰富的光伏电站和水电站出力进行建模并将该模型外推至目标电站的出力预测任务.文献[11 ]中将带物理约束性的长短期记忆网络(long short-term memory,LSTM)作为预训练网络,在多种天气条件下验证了新建光伏(photovoltaic,PV)电站的功率预测效果.文献[12 ]中提出目标风电(wind turbine,WT)出力的多层级迁移学习模型,验证了迁移层数对出力预测精度的影响.文献[13 ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低. ...
Wide-area distributed photovoltaic power forecast method based on meteorological resource interpolation and transfer learning
1
2023
... 针对小样本条件下可再生能源出力预测问题研究方法可归纳为以下两类,一是利用数据增强的方法对少量历史数据进行扩充[6 -8 ] 来增加参与预测任务的数据量,进而提高预测精度.然而基于数据增强的方法从相似域抽取样本时存在人为随机性,难以表现出可再生能源发电的时序特性.二是基于模型迁移的方法利用公共知识进行泛化,该方法首先在大数据集上训练得到一个具有强泛化能力的模型,然后使用少量目标可再生能源出力数据对该模型进行参数微调,避免数据扩充方法中人为抽取样本的过程,提升预测精度同时减少计算时间.文献[9 -10 ]中分别对出力数据丰富的光伏电站和水电站出力进行建模并将该模型外推至目标电站的出力预测任务.文献[11 ]中将带物理约束性的长短期记忆网络(long short-term memory,LSTM)作为预训练网络,在多种天气条件下验证了新建光伏(photovoltaic,PV)电站的功率预测效果.文献[12 ]中提出目标风电(wind turbine,WT)出力的多层级迁移学习模型,验证了迁移层数对出力预测精度的影响.文献[13 ]在文献[9 ]的基础上提出针对广域范围分布式光伏电站的功率预测方法,引入误差修正环节构建双迁移模型提高预测精度.考虑到真实环境中每个电站具有自身独特的特点和运行环境,基于模型迁移的方法提取到的公共知识可能无法充分适应目标任务,模型可能出现过拟合,在特定时间尺度上预测精度较低. ...
基于一致性原理和梯度下降法的微电网完全分布式优化调度
1
2022
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
A review on generative adversarial networks for power system applications
1
2023
... 在数据正向映射完成后,DANN-LSTM进行误差反向传播过程.误差反向传播是进行网络参数优化的过程.由式(1)和式(2)可知预测器和域分类器的输入都来自特征提取器,然而域分类器和预测器的损失函数寻优方向相反,导致特征提取器进行参数更新时,域分类损失的梯度与预测损失梯度更新方向相反.常规GAN的做法是以分别固定生成器与鉴别器参数的方式进行分阶段训练[28 ] ,这会削弱两个网络间的耦合效果,限制信息交互能力,进而影响生成高质量出力预测数据的能力.DANN在特征提取器和域分类器之间加入梯度翻转层增强各个网络之间的协调性和一致性,将特征提取器、域分类器和预测器作为一个整体实现“端对端”训练,从而可以在目标域上获得更好的性能.具体做法是在域分类损失反向传播过程中加入梯度反转层使梯度方向自动取反并乘以平衡系数λ ,提升模型的域适应能力.DANN-LSTM的总优化函数为 ...
随机梯度下降算法研究进展
1
2021
... 使用随机梯度下降算法[29 ] 优化DANN-LSTM的模型参数,梯度更新公式为 ...
Research advances on stochastic gradient descent algorithms
1
2021
... 使用随机梯度下降算法[29 ] 优化DANN-LSTM的模型参数,梯度更新公式为 ...
储能的度电成本和里程成本分析
1
2019
... 式中:ct 为t 时段的实时电价;p grid, t 为t 时段微电网与主网之间的交互功率;L bat 、L cap 分别为蓄电池和电容器的度电成本,取值参考文献[30 ];p bat, t 、p cap, t 分别为t 时段蓄电池和超级电容的有功功率. ...
Analysis of cost per kilowatt-hour and cost per mileage for energy storage technologies
1
2019
... 式中:ct 为t 时段的实时电价;p grid, t 为t 时段微电网与主网之间的交互功率;L bat 、L cap 分别为蓄电池和电容器的度电成本,取值参考文献[30 ];p bat, t 、p cap, t 分别为t 时段蓄电池和超级电容的有功功率. ...
基于深度强化学习的新型电力系统调度优化方法综述
1
2023
... 深度强化学习能够有效地处理复杂的输入和输出空间并从大量的数据中进行学习,使智能体能够做出高质量的决策[31 ] .TD3是DRL当前较为优秀的算法,将其应用于上述微电网优化调度的马尔可夫决策过程求解,通过对微电网储能系统充放电动作寻优来降低微电网日运行成本. ...
Review on optimization methods for new power system dispatch based on deep reinforcement learning
1
2023
... 深度强化学习能够有效地处理复杂的输入和输出空间并从大量的数据中进行学习,使智能体能够做出高质量的决策[31 ] .TD3是DRL当前较为优秀的算法,将其应用于上述微电网优化调度的马尔可夫决策过程求解,通过对微电网储能系统充放电动作寻优来降低微电网日运行成本. ...
Addressing function approximation error in actor-critic methods
3
2018
... TD3是一种基于执行器-评判器(Actor-Critic)结构的算法[32 ] ,具体结构见图2 右侧TD3算法框架.Critic网络以微电网环境在t 时段的可再生能源出力、负荷、复合储能系统和实时电价等状态st 以及储能系统动作at 作为输入,输出Q 值函数 Q ω C r i ( st ,at ),该函数表示微电网在状态下st 储能系统采取动作at 所获得的预期累积奖励,用来评估储能系统在该状态下采取充放电动作at 的优劣程度,其中ω Cri 为Critic 网络参数.Actor 网络将t时段的微电网环境状态st 作为输入,输出储能系统动作策略 μ ω A c t ,微电网获得储能系统动作策略后,根据策略信息对潮流分布结果进行更新并将更新后的状态st +1 发送给储能系统以确保储能系统获得最新的状态信息,根据Q 值函数对储能系统动作策略进行更新,其中ω Act 为Actor 网络参数. ...
... TD3通过构建双评判器网络结构、目标策略平滑和策略更新延迟技术使Q 值估计更加准确,具体做法详见文献[32 ].微电网智能体通过反复与环境进行交互获得动作策略的同时,利用算法更新Critic网络和Actor网络参数直至奖励值收敛,得到微电网最优日前调度策略. ...
... 为了展现所提方法的最优动作空间探索能力,分别将LSTM、LSTM-TL和传统DANN这3种方法与所提方法DANN-LSTM预测所得可再生能源出力作为状态空间进行训练,并将TD3算法与DDPG算法在4种状态空间下所得奖励值进行对比,选取在TD3算法中奖励值最高的两种结果和DDPG算法训练结果中奖励值最高的结果及对应的日运行成本进行展示.图8 和图9 分别给出智能体训练过程中的奖励值和日运行成本变化.由图可见,在初始阶段,由于训练不充分,所以智能体抽取到低奖励值经验的概率较高;随着智能体不断与环境交互并使用高奖励值经验改进策略,在后续训练过程中能够做出更优秀的调度决策并获得更高奖励值,最终学习到日运行成本最低的调度策略.DDPG算法在 2 400 回合奖励函数出现异常值,其原因是神经网络发生“网络退化”现象[32 ] .DDPG算法使用确定性策略,倾向于根据当前的最优动作选择策略.在初始训练阶段,随机性较大的探索有助于探索更多状态-动作对,并发现更好的储能系统充放电策略.但随着训练进行,随机性减少,模型趋向于利用已知的最优充放电动作,可能导致陷入局部最优解.在某些情况下,模型可能会重新探索先前被认为是次优的动作,即输出的策略朝着奖励值较低的轨迹上前进而导致奖励值骤降,随着经验回放缓冲区的更新和样本的变化,模型将有机会学习到更多高奖励的样本,从而使奖励值回到原来的收敛值.与DDPG算法相比,TD3通过在动作策略中加入噪声避免储能动作陷入局部最优,增大最优动作被探索到的概率,并通过值函数的双重更新减小值函数的估计误差,提高智能体控制储能系统在每一调度时段内做出最优充放电动作的决策能力. ...
A benchmark low voltage microgrid network
1
2005
... 选择欧洲CIGRE 14节点低压微电网系统作为实验对象,并做相应调整,如图3 所示.微电网系统包括一个蓄电池和一个超级电容器的2个储能单元、4个光伏电站、3个风电机组以及若干负荷.每个可再生能源电站装机容量均为1 MW,微网中其他元件和线路阻值参考文献[33 ]. ...
A survey on transfer learning
1
2010
... 基于模型迁移的方法预测精度受迁移层数的精度的影响.图6 和图7 展示了不同迁移层数下的预测精度与所提方法的对比.图中:TL-fixed-n 表示固定的前n 层LSTM层数.由图可知,在理想天气条件下,光伏和风电的出力预测精度随着固定的网络层数增加先升后降,且选择固定前两层网络参数时精度最高:光伏出力预测结果RMSE分别为8.26%、7.89%,风电出力预测结果RMSE分别为23.12%和24.15%.固定前4层参数时误差最高,其原因可能在于:理想天气情况下,光伏和风电的出力随相应气象特征间的知识较易提取,只需要两层LSTM层便可充分知识提取;当固定的层数增加时,预训练模型更加关注提高源域电站上的出力预测精度,忽略了目标域电站上的特定出力特征,同时,随着固定的层数增加,模型的参数量也随之增加.过多参数可能导致模型在小数据集上过拟合,进而造成目标域上小样本条件下可再生能源出力预测精度下降,这是迁移学习中的一个常见问题,称为“迁移性能不匹配”[34 ] .而在非理想天气条件下,由于可再生能源的出力随相应气象特征之间的关系较为复杂,所以需要保留更高的LSTM层数进行充分的知识提取.因此,选取固定前4层LSTM层,只对全连接层进行参数微调时预测精度最高. ...
California ISO open access same-time information system (OASIS)
1
... 微电网的风光出力数据由DANN-LSTM预测得到,负荷和实时电价来自美国加州电力系统CASIO[35 ] 真实的运行数据.实验中仿真步长取为1 h,每次参与训练样本数设置为128,其他参数设置及仿真环境详见附录表A1. ...
Fully distributed optimal dispatch of a microgrid based on consensus principle and gradient descent
1
2022
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
考虑源荷功率不确定性的海上风力发电多微网两阶段优化调度
0
2022
Two-stage optimal schedule of offshore wind-power-integrated multi-microgrid considering uncertain power of sources and loads
0
2022
基于二次型最优控制的微电网实时能量管理策略
1
2019
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
Real-time energy management strategy for micro-grid based on the quadratic optimal control theory
1
2019
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
提升电网调度中人工智能可用性的混合增强智能知识演化技术
1
2022
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
Knowledge evolution technology based on hybrid-augmented intelligence for improving practicability of artificial intelligence in power grid dispatch
1
2022
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
基于深度强化学习的光储充电站储能系统优化运行
0
2021
Optimal operation based on deep reinforcement learning for energy storage system in photovoltaic-storage charging station
0
2021
人工智能在电力系统及综合能源系统中的应用综述
0
2019
Review on application of artificial intelligence in power system and integrated energy system
0
2019
“人工智能+” 时代下的智能电网预测分析
0
2018
“AI+” based smart grid prediction analysis
0
2018
Deep reinforcement learning based research on low-carbon scheduling with distribution network schedulable resources
1
2023
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...
基于深度强化学习的微网储能系统控制策略研究
1
2021
... 在可再生能源出力预测基础上制定的微电网日前调度策略包括基于数学模型的经典优化算法[14 -16 ] 和基于人工智能的数据驱动算法[17 -21 ] .经典的优化方法依赖明确的目标函数,需要对微电网中发电组件和调度过程建立精确的数学模型.由于可再生能源出力具有不确定性,最初建立的模型和选定的参数必须随时间的改变而重新建立,增加计算成本的同时削弱了模型的鲁棒性.以深度强化学习(deep reinforcement learning,DRL)为代表的新一代人工智能算法是求解的另一个有效途径,其用奖惩函数对调度指令好坏作出评价来代替数学模型;同时,因其在处理大规模数据时表现出优良性能而广泛用于微电网的优化调度策略.文献[22 ]中采用微电网实时运行数据,使用双重深度Q 学习算法降低微电网的日运行成本.文献[23 ]中提出基于改进竞争深度Q 网络算法来优化神经网络结构,提高了微电网最优调度策略的稳定性.文献[24 ]中引入贝叶斯神经网络预测光伏出力,提出双深度期望Q 网络算法解决含高比例光伏发电的微电网能量管理问题.上述文献适用于求解离散动作空间的优化问题,但微电网调度控制对象种类繁多,既有离散动作也有连续动作,基于Q 学习的算法在连续动作场景下会出现维数灾[25 ] ,无法求解最优调度策略.深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法[26 ] 可用于动作空间连续的场景,然而该算法存在对可控单元动作Q 值过估计的现象,过度依赖当前策略选择动作,导致全局寻优能力较弱.双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法是目前深度强化学习中的优秀算法,其通过构建双评判器网络结构,使用目标策略平滑和策略更新延迟技术提高Q 值估计能力,适用于连续动作的同时可以有效扩大调度策略寻优空间,因此可用于求解微电网的日前最优调度策略以提高经济性. ...