基于互信息理论与递归神经网络的短期风速预测模型
Short-Term Wind Speed Forecasting Model Based on Mutual Information and Recursive Neural Network
通讯作者: 周 岱,男,教授,博士生导师,电话(Tel.):18964941977;E-mail:zhoudai@sjtu.edu.cn
责任编辑: 孙伟
收稿日期: 2020-12-25
基金资助: |
|
Received: 2020-12-25
作者简介 About authors
王岩(1994-),男,河北省保定市人,硕士生,研究方向为机器学习在风电中的应用 。
风速的波动性和随机性为风电并网造成安全隐患,提高风速预测精度对于风电系统的稳定和风能发展十分重要.提出一种基于互信息(MI)理论和递归神经网络(RNN)的短期风速预测组合新模型(MI-RNN).该模型利用MI理论选择最优的历史风速序列长度(τ),通过每τ步预测下一时间点风速的方式,将历史风速数据输入RNN中进行模型训练,并由训练后的RNN模型输出最终的风速预测结果.将MI-RNN模型应用于风电场的风速数据集中,与传统机器学习风速预测模型进行比较,以验证模型的预测精度.结果显示,MI-RNN模型的预测精度更高,预测稳定性更强,并且能够准确预测未来风向,有望应用于含空间维度的风电场的风速预测.
关键词:
The volatility and randomness of wind speed have caused potential safety hazards to wind power grid integration. Improving wind speed forecasting is crucial to the stability of wind power systems and the development of wind energy. A novel short-term wind speed forecasting model (MI-RNN) was proposed based on mutual information (MI) and recursive neural network (RNN). In this model, the MI theory was introduced to select the optimal length of historical wind speed sequence (τ), and the method of using each τ step to forecast wind speed at the next time point was adopted to input the historical wind speed data into RNN for model training. The final wind speed forecasting result was output by the trained RNN model. Besides, the MI-RNN model was applied to the wind speed dataset collected from a wind farm and the forecasting accuracy was compared with that of the traditional wind forecasting methods. The results show that the MI-RNN model has achieved a higher forecasting accuracy compared with the commonly used wind farm wind speed forecasting methods, and can accurately forecast the future wind direction, which is expected to be applied to wind speed forecasting of wind farms with spatial dimensions.
Keywords:
本文引用格式
王岩, 陈耀然, 韩兆龙, 周岱, 包艳.
WANG Yan, CHEN Yaoran, HAN Zhaolong, ZHOU Dai, BAO Yan.
机器学习是人工智能的一个分支,其在风速预测方面具有较强的非线性建模能力.人工神经网络(ANN)是典型的机器学习方法,其从信息处理的角度对人脑神经元网络进行抽象表达,进而建立非线性数学模型[6].Santhosh等[7]利用经验模态分解,将原始风速分解为多个子序列,并利用ANN分别对子序列进行建模预测.结果显示,相较于基于时间序列法的风速预测模型,基于ANN的模型的预测误差显著降低.支持向量机(SVM)作为另一种机器学习方法,其主要思想为先利用一个预设函数将原始输入和输出数据映射到高维特征空间,然后在该空间进行线性回归,使误差最小化.范曼萍等[8]利用SVM建立历史风速与未来风速之间的数学模型,并利用改进粒子群算法优化SVM的参数,通过收缩因子改进粒子速度更新方式.结果显示,基于SVM风速预测结果的平均相对误差为3.72%,预测精度显著提高.然而,ANN和SVM等传统机器学习方法模型仅将历史数据进行统一输入,而未充分考虑风速序列随时间的变化趋势,因此难以得到关于时间序列问题的高精度风速预测结果.
针对上述问题,提出一种风电场短期风速预测组合新模型,即基于互信息(MI)和递归神经网络(RNN)的短期风速预测模型(MI-RNN).将该模型应用于美国加利福尼亚州某风电场的2个风速数据集,进行数值实验,并与ANN和SVM进行比较分析,评价模型的预测精度.不同于上述机器学习方法,该模型中RNN加入t时刻的隐藏状态作为记忆单元,该隐藏状态中记录着t时刻的输出值,同时作为下一时刻的输入值,由此可以更有效地解决时间序列问题[9].该模型的创新点包括:①利用MI选择用于预测未来风速的历史风速长度,能够更有效地利用历史信息且无冗余数据,进而显著提高预测精度;②利用带记忆单元的RNN提取历史风速数据与未来风速之间的映射关系,历史信息提取能力更高.
1 理论方法
1.1 输入变量选择与MI理论
输入变量的选择对模型的预测能力有重要影响.针对建立的风速预测模型,给定历史风速序列(Ft-1, Ft-2, …, Ft-τ),进行下一时刻风速(Ft)的预测,历史风速序列的长度(τ)由选择的输入变量决定.若τ太短,则历史数据中包含的信息太少,模型精度低;若τ太长,则模型参数优化困难且包含冗余历史信息,模型精度低且训练时间长.
MI理论能够衡量一个随机变量中包含另一个随机变量的信息量.假设2个随机变量(X1, Y1)的联合分布为p(x1, y1),边缘分布为p(x1)和p(y1),则互信息I(x1;y1)为联合分布和边缘分布的相对熵[10]:
I(x1;y1)=
1.2 递归神经网络
RNN是用于解决时间序列问题的机器学习模型,一个时间序列中的时间点对应一个普通前馈神经网络,并在每个时间点加入一个记忆单元记录其输出值,将输出值传递给下一时刻[11],数学表达式为
ht=σ(UXt+Wht-1)
Ot=f(ht)
式中:h为状态值;σ(·)为状态激活函数;U为t时刻输入的权重;W为t-1时刻状态的权重;X和O为神经网络的输入值和输出值;f(·)为生成神经网络输出值的函数.
图1为τ=3的RNN模型图,时间序列中共包括3个时刻(t-1, t, t+1)的神经网络.本文将风速作为神经网络的输入值,Ot+1为RNN的最终预测值.每个时刻计算得到的隐藏层状态Ot-1均将传给下一时刻,从而保证前一时刻提取的历史信息可以传递到下一时刻.因此,图中Ot-1应为Xt的预测值,当采用每τ个风速预测一步时,则会产生τ个输出值,只保留最后一个输出值作为最终预测值.
图1
模型的训练过程即确定参数W和U的过程.训练过程的本质为优化,优化目标为缩小预测值与观测值的误差.利用误差函数对W和U求梯度,训练过程中逐渐降低梯度值至0附近,从而确定模型参数.然后,将历史数据输入到RNN中并输出最终预测结果.
2 MI-RNN模型
2.1 模型基本信息
图2为MI-RNN流程图.其中,上标x和y表示经分解后的风速方向,下标表示时刻;F为风速观测值,θ为风向观测值,
图2
为了实现带有风向的风电场风速预测,将风速数据进行正交分解:
式中:i=1, 2, …, t-1.然后使用MI-RNN模型预测t-1+β时刻的风速并进行组合:
2.2 基于MI理论选择时间步长
图3为I(τ)-τ变化曲线.其中,I(τ)为Ft和Ft-τ之间的互信息,是一个递减函数.可以通过选择互信息阈值(IC)来确定τ值大小.通常依据经验选择IC,本文选择IC=2,确定时间步长τ = 6.
图3
2.3 RNN模型训练
将历史风速观测值数据以某时刻为界划分为训练集和测试集,训练集用于训练RNN模型,测试集用于测试模型的预测结果是否准确.当模型训练完成后,输入τ个新历史风速序列,RNN模型将输出新的风速预测值.
3 数值算例
3.1 算例1
图4
表1 观测间隔为15 min的风速数据集统计信息
Tab.1
数据量/个 | (m·s-1) | σF/ (m·s-1) | Fmin/ (m·s-1) | Fmax/ (m·s-1) | |
---|---|---|---|---|---|
训练集 | 测试集 | ||||
384 | 96 | 8.451 | 2.438 | 2.481 | 14.642 |
3.1.2 模型评估指标 模型评估指标能够评价模型预测结果的精度.分别利用均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2)对模型点预测结果进行统计.
RMSE=
MAE=
R2=1-
式中:Te为总观测量.RMSE和MAE越接近0,R2越接近于1,则模型的预测精度越高.
3.1.3 结果与讨论 为加强模型预测结果的可视化,对3个模型的预测和评估结果作图,如图5~8所示.
图5
图6
图6
观测间隔为15 min的风速预测结果
Fig.6
Wind speed forecasting results at an interval of 15 min
图7
图7
模型在不同指标下的评估结果
Fig.7
Evaluation results of the models at different indicators
图8
图5中,MI-RNN模型的预测误差平均值的绝对值最小(小于0.1 m/s),SVM模型次之(约为 0.2 m/s),ANN模型最大(大于0.3 m/s).3个模型预测误差的中位数和平均值相差较小,1/4~3/4分位数据范围的宽度相差较小(约为1.2 m/s).MI-RNN 和ANN模型的预测误差均有大于0的离群值,但MI-RNN模型的离群值较少.结果表明:与ANN和SVM模型相比,MI-RNN模型预测结果的平均误差最小,且离群值较少,预测精度更佳.
图6中,MI-RNN模型的预测值与观测值相差较小,且在风速小或大的情况下均能够精准预测.而ANN和SVM模型的预测值与观测值相差较大,存在明显预测误差.其中,SVM模型在风速较小时误差较大,在风速较大时误差更大;ANN模型在风速小或大时误差均较大.结果表明:与ANN和SVM模型相比,MI-RNN模型的预测精度更高,且在不同风速范围下的预测稳定性更佳.
表2 模型在不同指标下的统计结果
Tab.2
模型 | RMSE/(m·s-1) | MAE/(m·s-1) | R2 |
---|---|---|---|
MI-RNN | 0.237 | 0.192 | 0.992 |
ANN | 0.490 | 0.437 | 0.965 |
SVM | 0.299 | 0.325 | 0.977 |
图8中,直线由预测值等于观测值的数据点组成,MI-RNN的预测结果均匀地分布在直线附近,数据点距离直线较近,表明MI-RNN模型的预测结果更接近于观测值,且不受风速大小影响.而ANN模型的预测结果距离直线较远,且在直线下方的数据点较多,说明ANN模型的预测误差较大,且预测结果更容易低于观测值.在风速较大时,SVM模型的数据点更多地集中在直线下方,说明其预测结果在风速较大时更容易低于观测值.
综上所述,相比于ANN和SVM模型,MI-RNN模型能够显著提高风速预测精度,且预测稳定性良好,可以更精准地预测未来风速.
3.2 算例2
探讨不同预报提前量条件下MI-RNN模型的预测效果以及风向预测性能.
3.2.1 间隔5 min的风速数据集 采用美国加利福尼亚州某风电场一年的风速数据作为模型的训练数据和测试数据.每间隔5 min得到一个风速观测值,数据总量为 105120 个,80%的数据用做训练集,20%的数据用作测试集,统计信息如表3所示.其中,
表3 观测间隔为5 min的风速数据集的统计信息
Tab.3
数据量/个 | σF(m·s-1) | σθ/(°) | |||
---|---|---|---|---|---|
训练集 | 测试集 | ||||
84096 | 21024 | 9.74 | 4.42 | 9.74 | 4.42 |
图9
图9
模型在不同预报提前量下的RMSE对比
Fig.9
Comparison of RMSE at different forecasting advances
图10
图10
预测间隔为5 min的风速预测结果
Fig.10
Wind speed forecasting results at an interval of 5 min
图11
4 结论
风速的波动性和随机性给风电并网造成安全隐患,影响风能利用质量,高精度的风速预测是解决该问题的方法之一.本文提出MI-RNN模型,并将MI-RNN模型应用于美国加利福尼亚州某风电场真实数据集,验证模型的预测精度,同时使用RMSE、 MAE和R2等指标评估模型的点预测结果,主要结论如下:
(1) ANN和SVM模型对风速在不同变化区间的预测精度不稳定;在风速较大时,易出现预测值小于观测值的情况.
(2) 相对于ANN和SVM模型,MI-RNN模型在不同预报提前量下的预测结果误差均最小,风速预测精度更高,且风速越大其精度提升越显著;同时能够准确预测未来风向.
(3) MI-RNN模型能够应用于风电场短期(未来1 h内)风速预测,提高风电场输出功率预测精度,降低大规模风电并网安全隐患.
文中研究了单个空间点的风速预测,下一步将研究深度学习方法在含空间维度的风电场风速预测中的应用.
参考文献
Wind speed prediction method using shared weight long short-term memory network and Gaussian process regression
[J].DOI:10.1016/j.apenergy.2019.04.047 URL [本文引用: 1]
Wind speed forecasting using nonlinear-learning ensemble of deep learning time series prediction and extremal optimization
[J].DOI:10.1016/j.enconman.2018.03.098 URL [本文引用: 1]
Time-series prediction of wind speed using machine learning algorithms: A case study Osorio wind farm, Brazil
[J].DOI:10.1016/j.apenergy.2018.05.043 URL [本文引用: 1]
Wind speed forecasting approach based on Singular Spectrum Analysis and Adaptive Neuro Fuzzy Inference System
[J].DOI:10.1016/j.renene.2017.11.089 URL [本文引用: 1]
风电场短期风速预测若干问题研究
[D].
Research on some issues of short-term wind speed forecasting for wind farms
[D].
Short-term wind speed forecasting framework based on stacked denoising auto-encoders with rough ANN
[J].DOI:10.1016/j.seta.2019.100601 URL [本文引用: 1]
Ensemble empirical mode decomposition based adaptive wavelet neural network method for wind speed prediction
[J].DOI:10.1016/j.enconman.2018.04.099 URL [本文引用: 1]
基于改进粒子群优化LS-SVM的短期风速预测
[J].
Shortterm wind speed prediction based on improved particle swarm optimization LS-SVM
[J].
Long short-term memory
[J].DOI:10.1162/neco.1997.9.8.1735 URL [本文引用: 1]
Input variable selection: Mutual information and linear mixing measures
[J].DOI:10.1109/TKDE.2006.11 URL [本文引用: 1]
Smart multi-step deep learning model for wind speed forecasting based on variational mode decomposition, singular spectrum analysis, LSTM network and ELM
[J].DOI:10.1016/j.enconman.2018.01.010 URL [本文引用: 1]
Scikit-learn: Machine learning in python
[J].
Pytorch: An imperative style, high-performance deep learning library
[C]//
Root mean square error (RMSE) or mean absolute error (MAE)?—Arguments against avoiding RMSE in the literature
[J].DOI:10.5194/gmd-7-1247-2014 URL [本文引用: 1]
Using the coefficient of determination R2 to test the significance of multiple linear regression
[J].DOI:10.1111/test.2013.35.issue-2 URL [本文引用: 1]
/
〈 |
|
〉 |
![](../../../richhtml/1006-2467/richHtml_jats1_1/images/1.png)