基于CNN-RNN组合模型的办公建筑能耗预测
Energy Consumption Prediction of Office Buildings Based on CNN-RNN Combined Model
Received: 2021-05-23
作者简介 About authors
曾国治(1998-),男,四川省泸州市人,硕士生,主要从事智慧建筑与建筑节能研究.
为准确反映办公建筑的运行特性,利用卷积神经网络(CNN)良好的特征提取能力与循环神经网络(RNN)良好的时序学习能力,提出用于预测办公建筑能耗的CNN-RNN组合模型,并对应设计了适用于深度学习模型的二维矩阵数据输入结构.案例分析结果表明,相较于简单循环神经网络和长短期记忆网络,CNN-RNN组合模型的预测精度与计算效率均显著提升,模型泛化性好.
关键词:
In order to accurately reflect the operation characteristics of office buildings, a convolutional neural network(CNN)-recurrent neural network(RNN)combined model for energy consumption prediction of office buildings is proposed by using the good feature extraction ability of CNN and the good time series learning ability of RNN. Besides, a two-dimensional matrix data input structure suitable for the deep learning model is designed. The case study results show that compared with the simple recurrent neural network and long short term memory network, both the prediction accuracy and computational efficiency of CNN-RNN combined model are significantly improved, and the generalization of the model is also good.
Keywords:
本文引用格式
曾国治, 魏子清, 岳宝, 丁云霄, 郑春元, 翟晓强.
ZENG Guozhi, WEI Ziqing, YUE Bao, DING Yunxiao, ZHENG Chunyuan, ZHAI Xiaoqiang.
随着数据量增多以及算力增长,数据模型逐渐由浅层机器学习发展到深度学习.深度学习通过多个网络层直接从数据中进行特征的提取与学习,有着较强的模型表达能力.相较于传统机器学习,深度学习模型预测精度随着训练数据量增长而不断提高[7].目前,应用于建筑能耗预测领域的深度学习算法主要包括自动编码器(AE)[8]、循环神经网络(RNN)、长短期记忆网络(LSTM)[9]、生成对抗网络(GAN)[10]等模型,而卷积神经网络(CNN)目前应用较少[11],CNN网络具有极强的局部特征捕捉能力,应用到建筑能耗预测领域中能够通过构建高维特征,有效地学习到影响能耗的变量之间的非线性相互作用关系.此外,基于深度学习的组合模型在建筑能耗预测中的应用也鲜有报道.
本文利用卷积神经网络良好的特征提取能力与循环神经网络良好的时序学习能力,提出用于预测办公建筑能耗的CNN-RNN组合模型,在办公建筑数据集下验证模型性能,并与简单循环神经网络(SRNN)和LSTM模型进行综合比较.该研究可为数据驱动的建筑能耗预测建模提供理论指导,准确预测结果可为办公建筑的运行优化和节能管理提供数据支持.
1 模型原理
1.1 卷积神经网络
图1
卷积神经网络一般包含卷积层、激活层、池化层和全连接层.卷积层从输入的数据中获取信息,根据沿输入特征扫描方向的不同,可以分为逐行扫描(R-CNN) 和逐列扫描(C-CNN).R-CNN是先通过卷积神经网络逐行扫描,将所有单个时刻点的输入特征进行组合,之后对时序上的所有组合特征进行学习.在输入数据训练模型时,通过转置二维的输入数据,可实现C-CNN对列方向的扫描.卷积层利用卷积核从数据中提取特征形成特征映射图.这些特征通过一个非线性激活函数传递,该激活函数加速CNN理解数据间的复杂关系.
1.2 循环神经网络
循环神经网络是一种用于从时间序列数据中捕获信息的网络.与只建立层与层之间权重联系的基本神经网络相比,RNN最显著的特征在于层内的神经元之间也建立了权连接.作为最基本的循环神经网络,简单循环神经网络结构如图2所示.其中:
图2
1.3 CNN-RNN模型结构
针对建筑能耗预测领域,在CNN模型中,R-CNN可以提取建筑能耗数据中同一时刻不同特征之间的非线性关系,通过卷积核构成高维特征;在RNN模型中,SRNN在时域上对建筑能耗变化趋势的预测更加精准,能够准确地表达建筑能耗的非线性特征.利用SRNN层从R-CNN层的输出信息中提取高维抽象特征,构成CNN-RNN组合模型,对于建筑能耗数据具有良好的适应性,模型顺序构成如表1所示.通过一维卷积核(Conv_1D)提取同时刻数据的组合特征之后,再使用SRNN层学习数据的时序特性,最后通过全连接层(Dense层)实现回归预测.R-CNN层与全连接层选用深度学习中常用的ReLU激活函数,对小于0的值全部抑制为0,对于正数则直接输出;而在SRNN层中,为了防止其出现梯度消失等问题,其激活函数采用ELU,对于小于0的值可以取负值,使单元激活均值接近于0.
表1 CNN-RNN模型顺序构成
Tab.1
网络层序号 | 类型 | 神经元个数 | 激活函数 |
---|---|---|---|
1 | Conv_1D | 64 | ReLU |
2 | Conv_1D | 64 | ReLU |
3 | SRNN(返回序列) | 64 | ELU |
4 | SRNN | 32 | ELU |
5 | Dense | 32 | ReLU |
6 | Dense | 16 | ReLU |
7 | Dense | 8 | ReLU |
除了模型中间层,还需要设置模型输入、输出层.其中,模型输入层维度与输入数据维度相同,输出层为仅有一个神经元的全连接层,使模型最终能够输出预测能耗值.同时为提升模型泛化能力,在第一层全连接层后加入随机失活层,减少中间特征的数量,从而减少冗余.
2 模型性能分析及模型验证
2.1 数据分析
2.1.1 数据获取及预处理
图3
图3
办公建筑2018年能耗曲线
Fig.3
Energy consumption curves of an office building in 2018
为了对数据异常值进行筛选,以能耗值95%分位点作为基准值,以基准值的2倍作为合理能耗区间,区间外的数据认定为是异常值.删除异常值后使用线性插值进行补全,然后采用Min-Max方法对数据进行标准化处理,以消除不同量纲及量纲单位对预测性能的影响,如下式所示:
式中: x*为归一化后的变量值;x为输入变量的当前值;xmax为输入变量的最大值;xmin为输入变量的最小值.
2.1.2 输入数据结构
传统机器学习模型中输入数据按照一维向量格式进行保存,随着深度学习对数据量需求的增加,一维向量结构作为输入无法体现数据特征的特性差异,不利于深度学习模型自动提取数据特征.为此,本文提出适用于深度学习的数据结构,如表2所示. 其中:Tt为室外气温;φt为相对湿度;Dt为工作日与否;Ht为24 h时刻; 考虑到建筑运行的周期性,加入前48 h的历史输入数据,使模型可以学习更为长期的趋势,获得更精准的预测值.相比于一维向量数据结构,增添了所有变量的历史数据,将输入数据重组为二维矩阵.对于表2所示结构,组合模型可以通过横向扫描对单个时刻的输入进行组合,同时可以对时序上的所有组合特征进行学习,充分发挥了深度学习的特征提取能力.
表2 用于深度学习的建筑能耗数据结构
Tab.2
时间 轴 | 模型输出 能耗数据/ (kW·h) | 模型输入 | ||||
---|---|---|---|---|---|---|
室外 气温/℃ | 相对 湿度/% | 工作日 | 时刻 | 历史 序列 | ||
t+1 | Wt+1 | Tt+1 | φt+1 | Dt+1 | Ht+1 | Wt-23 |
t | Tt | φt | Dt | Ht | Wt-24 | |
t-1 | Tt-1 | φt-1 | Dt-1 | Ht-1 | Wt-25 | |
t-2 | Tt-2 | φt-2 | Dt-2 | Ht-2 | Wt-26 | |
… | … | … | … | … | … | |
t-45 | Tt-45 | φt-45 | Dt-45 | Ht-45 | Wt-69 | |
t-46 | Tt-46 | φt-46 | Dt-46 | Ht-46 | Wt-70 | |
t-47 | Tt-47 | φt-47 | Dt-47 | Ht-47 | Wt-71 |
注:“空白”表示不适用.
2.2 模型计算效率分析
计算效率是评价模型的重要指标之一.以GTX1050作为训练模型的GPU,对深度学习模型可训练参数的数目与模型训练时间进行统计,如表3所示.SRNN可训练参数为 17596,训练耗时为 1193 s.LSTM模型由于加入了记忆门、遗忘门,可训练参数达到 65089,训练耗时增长到 1745 s.训练耗时主要与模型结构有关,表明LSTM模型结构比SRNN模型更加复杂.对于本文所提出的 CNN-RNN组合模型,使用CNN层对特征进行提取后,RNN层输入张量减小;尽管层数增加,模型复杂度并没有大幅度提升.模型初始化后可训练参数个数为 17633,训练耗时848 s,训练耗时相较于SRNN与LSTM模型分别减少了28.9%和51.4%.
表3 3种模型计算效率
Tab.3
模型 | 可训练参数 | 训练时间/s |
---|---|---|
SRNN | 17596 | 1193 |
LSTM | 65089 | 1745 |
CNN-RNN | 17633 | 848 |
2.3 模型验证及预测性能分析
本文采用了平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和拟合优度(R2)作为评价指标.一般而言,较小的平均绝对误差和平均绝对百分比误差以及较大的拟合优度表明模型具有较高的预测精度.评价指标如下式所示:
式中:
将全年数据集按照比例随机划分为训练集与测试集,其中,80%的数据作为训练集,20%的数据作为测试集,各模型训练集与测试集的评价指标如表4所示.SRNN与LSTM模型的MAPE指标均高于15%,其中LSTM模型的性能指标出现了较大幅度下降,表明模型对数据中隐含规律的学习能力较差.相比与SRNN与LSTM模型,CNN-RNN组合模型在测试集上的MAPE指标分别降低了13.8%和48.3%,表明在经过CNN层提取特征之后,组合模型的RNN层学习能力明显提升.组合模型在训练集与测试集上的MAPE指标接近,表明模型对新数据拟合能力强,模型泛化性好.
表4 模型预测精度对比
Tab.4
模型 | 数据集 | MAE/(kW·h) | MAPE/% | R2 |
---|---|---|---|---|
SRNN | 训练集 | 28.2 | 15.38 | 0.956 |
测试集 | 31.3 | 15.93 | 0.946 | |
LSTM | 训练集 | 51.8 | 25.92 | 0.859 |
测试集 | 56.2 | 26.54 | 0842 | |
CNN-RNN | 训练集 | 32.4 | 12.97 | 0.934 |
测试集 | 36.1 | 13.73 | 0.918 |
从全年数据中,分别选取供暖季1月、过渡季4月和供冷季7月的前8天作为典型,查看历史能耗数据与预测数据,结果如图4~6所示.
图4
图5
图6
SRNN模型在1月供暖季和7月供冷季均取得了较好的预测表现,而在4月过渡季表现较差.LSTM模型仅在7月具有较好的预测性能,另外两个工况精度均较差,未能有效学习到建筑全部的运行能耗变化规律.表明过渡季的换季特性导致办公建筑运行规律不稳定,使得SRNN模型与LSTM模型预测出现异常结果.且尽管LSTM模型具有更多的训练参数,但模型结构过于复杂,在基于当前的能耗数据训练时,容易出现训练不充分现象.
CNN-RNN组合模型整体能耗预测曲线较为平滑,相较于SRNN与LSTM模型,该组合模型能够较好地学习到办公建筑中相对稳定的能耗变化规律.组合模型在1月与7月的预测结果与SRNN模型接近,均能较好地反映办公建筑运行规律;而在4月的预测曲线拟合度明显优于SRNN与LSTM模型,表明经过CNN层提取特征后,不仅降低了数据复杂度,缩短模型训练时间,同时将提取后的特征作为RNN层输入,有效降低了过渡季时序性不足对预测结果的干扰,有助于模型学习到能耗变化规律,从而验证了该组合模型能有效提高办公建筑能耗的整体预测效果.
3 结论
本文建立了CNN-RNN组合模型实现建筑能耗预测,并利用办公建筑能耗实测数据进行验证与分析,得到的主要结论如下:
(1) 基于CNN算法对局部关联特征的提取能力与RNN算法对时序特性的学习能力,提出了CNN-RNN组合模型,实现深度学习在建筑能耗预测领域的有效利用.
(2) 基于CNN和RNN两类神经网络层特性,提出了适用于深度学习的二维矩阵输入数据结构.通过增加各变量的历史数据,构成新的维度,使得输入数据结构同时包含了变量的同时刻特征与历史规律,充分发挥了深度学习算法的特征提取能力.
(3) 分析结果表明,相较于简单循环神经网络模型,CNN-RNN组合模型预测曲线更为平滑,在拟合优度相近的情况下,计算效率取得了显著提升,计算时间和MAPE分别下降了28.9%和13.8%.
参考文献
中国建筑能耗研究报告2020
[J].
China building energy consumption annual report 2020
[J].
State of the art in building modelling and energy performances prediction: A review
[J].DOI:10.1016/j.rser.2013.03.004 URL [本文引用: 1]
Energy prediction techniques for large-scale buildings towards a sustainable built environment: A review
[J].
Clustering-based short-term load forecasting for residential electricity under the increasing-block pricing tariffs in China
[J].DOI:10.1016/j.energy.2018.09.156 URL [本文引用: 1]
Forecasting the energy consumption of an actual air handling unit and absorption chiller using ANN models
[J].
Machine learning approaches for estimating commercial building energy consumption
[J].DOI:10.1016/j.apenergy.2017.09.060 URL [本文引用: 1]
A review on deep learning models for forecasting time series data of solar irradiance and photovoltaic power
[J].DOI:10.3390/en13246623 URL [本文引用: 1]
Deep learning-based feature engineering methods for improved building energy prediction
[J].DOI:10.1016/j.apenergy.2019.02.052 URL [本文引用: 1]
基于深度学习的建筑能耗短期预测方法研究
[C]//
Research on short-term building energy consumption prediction method based on deep-learning
[C]//
基于生成对抗网络的深度学习能耗预测算法
[J].
Deep learning energy consumption prediction algorithms based on generative adversarial networks
[J].
A review of deep learning techniques for forecasting energy use in buildings
[J].DOI:10.3390/en14030608 URL [本文引用: 1]
Convolutional neural networks: An overview and application in radiology
[J].
DOI:10.1007/s13244-018-0639-9
PMID:29934920
[本文引用: 1]
Convolutional neural network (CNN), a class of artificial neural networks that has become dominant in various computer vision tasks, is attracting interest across a variety of domains, including radiology. CNN is designed to automatically and adaptively learn spatial hierarchies of features through backpropagation by using multiple building blocks, such as convolution layers, pooling layers, and fully connected layers. This review article offers a perspective on the basic concepts of CNN and its application to various radiological tasks, and discusses its challenges and future directions in the field of radiology. Two challenges in applying CNN to radiological tasks, small dataset and overfitting, will also be covered in this article, as well as techniques to minimize them. Being familiar with the concepts and advantages, as well as limitations, of CNN is essential to leverage its potential in diagnostic radiology, with the goal of augmenting the performance of radiologists and improving patient care. KEY POINTS: • Convolutional neural network is a class of deep learning methods which has become dominant in various computer vision tasks and is attracting interest across a variety of domains, including radiology. • Convolutional neural network is composed of multiple building blocks, such as convolution layers, pooling layers, and fully connected layers, and is designed to automatically and adaptively learn spatial hierarchies of features through a backpropagation algorithm. • Familiarity with the concepts and advantages, as well as limitations, of convolutional neural network is essential to leverage its potential to improve radiologist performance and, eventually, patient care.
Recent advances in deep learning techniques and its applications: An overview
[C]//
/
〈 |
|
〉 |
![](../../../richhtml/1006-2467/richHtml_jats1_1/images/1.png)