基于CNN-RNN组合模型的办公建筑能耗预测

图1 卷积神经网络示意图

Fig.1 Schematic diagram of CNN

卷积神经网络一般包含卷积层、激活层、池化层和全连接层.卷积层从输入的数据中获取信息,根据沿输入特征扫描方向的不同,可以分为逐行扫描(R-CNN) 和逐列扫描(C-CNN).R-CNN是先通过卷积神经网络逐行扫描,将所有单个时刻点的输入特征进行组合,之后对时序上的所有组合特征进行学习.在输入数据训练模型时,通过转置二维的输入数据,可实现C-CNN对列方向的扫描.卷积层利用卷积核从数据中提取特征形成特征映射图.这些特征通过一个非线性激活函数传递,该激活函数加速CNN理解数据间的复杂关系.

1.2 循环神经网络

循环神经网络是一种用于从时间序列数据中捕获信息的网络.与只建立层与层之间权重联系的基本神经网络相比,RNN最显著的特征在于层内的神经元之间也建立了权连接.作为最基本的循环神经网络,简单循环神经网络结构如图2所示.其中: $x_{t}$ 为t时刻输入; $S_{t}$ 为t时刻隐层单元; $y_{t}$ 为t时刻输出;O为权重矩阵;U为输入变换矩阵;V为输出变换矩阵,与U在序列的不同时间点上共享,可以视为学习序列中固定的状态转移矩阵.长短期记忆网络是一种改良的循环神经网络,通过在每个神经元内提供反馈,在一定程度上解决了梯度消失的问题.SRNN在每次误差反馈过程中都会丢失部分信息,LSTM通过控制新信息对神经元存储信息的干扰程度,提取信号特征中的长期相关性,以提高识别精度^[13].

图2

图2 简单循环神经网络示意图

Fig.2 Schematic diagram of SRNN

1.3 CNN-RNN模型结构

针对建筑能耗预测领域,在CNN模型中,R-CNN可以提取建筑能耗数据中同一时刻不同特征之间的非线性关系,通过卷积核构成高维特征;在RNN模型中,SRNN在时域上对建筑能耗变化趋势的预测更加精准,能够准确地表达建筑能耗的非线性特征.利用SRNN层从R-CNN层的输出信息中提取高维抽象特征,构成CNN-RNN组合模型,对于建筑能耗数据具有良好的适应性,模型顺序构成如表1所示.通过一维卷积核(Conv_1D)提取同时刻数据的组合特征之后,再使用SRNN层学习数据的时序特性,最后通过全连接层(Dense层)实现回归预测.R-CNN层与全连接层选用深度学习中常用的ReLU激活函数,对小于0的值全部抑制为0,对于正数则直接输出;而在SRNN层中,为了防止其出现梯度消失等问题,其激活函数采用ELU,对于小于0的值可以取负值,使单元激活均值接近于0.

表1 CNN-RNN模型顺序构成

Tab.1 Sequential structure of CNN-RNN model

网络层序号	类型	神经元个数	激活函数
1	Conv_1D	64	ReLU
2	Conv_1D	64	ReLU
3	SRNN(返回序列)	64	ELU
4	SRNN	32	ELU
5	Dense	32	ReLU
6	Dense	16	ReLU
7	Dense	8	ReLU

除了模型中间层,还需要设置模型输入、输出层.其中,模型输入层维度与输入数据维度相同,输出层为仅有一个神经元的全连接层,使模型最终能够输出预测能耗值.同时为提升模型泛化能力,在第一层全连接层后加入随机失活层,减少中间特征的数量,从而减少冗余.

2 模型性能分析及模型验证

2.1 数据分析

2.1.1 数据获取及预处理

选取上海市某办公建筑作为研究对象,该建筑总面积1.9×10⁴ m².通过能耗监测系统获得了2018年的历史逐时能耗数据(W_t),能耗曲线如图3所示.由图3可以看出,办公建筑能耗与季节和建筑运营规律有着明显的相关性.因此,模型的输入参数包括两大类:① 时间变量,包括月、日、时、分、工作日与否;② 室外变量,包括室外气温(OAT)、相对湿度(ORH).气象数据由Iowa Environmental Mesonet的ASOS数据库^[14]获得.

图3

图3 办公建筑2018年能耗曲线

Fig.3 Energy consumption curves of an office building in 2018

为了对数据异常值进行筛选,以能耗值95%分位点作为基准值,以基准值的2倍作为合理能耗区间,区间外的数据认定为是异常值.删除异常值后使用线性插值进行补全,然后采用Min-Max方法对数据进行标准化处理,以消除不同量纲及量纲单位对预测性能的影响,如下式所示:

$\begin{matrix} x^{*} = \frac{x - x_{m i n}}{x_{m a x} - x_{m i n}} \end{matrix}$

(1)

式中: x^*为归一化后的变量值;x为输入变量的当前值;x_max为输入变量的最大值;x_min为输入变量的最小值.

2.1.2 输入数据结构

传统机器学习模型中输入数据按照一维向量格式进行保存,随着深度学习对数据量需求的增加,一维向量结构作为输入无法体现数据特征的特性差异,不利于深度学习模型自动提取数据特征.为此,本文提出适用于深度学习的数据结构,如表2所示. 其中:T_t为室外气温;φ_t为相对湿度;D_t为工作日与否;H_t为24 h时刻; 考虑到建筑运行的周期性,加入前48 h的历史输入数据,使模型可以学习更为长期的趋势,获得更精准的预测值.相比于一维向量数据结构,增添了所有变量的历史数据,将输入数据重组为二维矩阵.对于表2所示结构,组合模型可以通过横向扫描对单个时刻的输入进行组合,同时可以对时序上的所有组合特征进行学习,充分发挥了深度学习的特征提取能力.

表2 用于深度学习的建筑能耗数据结构

Tab.2 Building energy consumption data structure for deep learning

时间轴	模型输出能耗数据/ (kW·h)	模型输入
时间轴	模型输出能耗数据/ (kW·h)	室外气温/℃	相对湿度/%	工作日	时刻	历史序列
t+1	W_t₊₁	T_t₊₁	φ_t₊₁	D_t₊₁	H_t₊₁	W_t_-23
t		T_t	φ_t	D_t	H_t	W_t_-24
t-1		T_t_-1	φ_t_-1	D_t_-1	H_t_-1	W_t_-25
t-2		T_t_-2	φ_t_-2	D_t_-2	H_t_-2	W_t_-26
…		…	…	…	…	…
t-45		T_t_-45	φ_t_-45	D_t_-45	H_t_-45	W_t_-69
t-46		T_t_-46	φ_t_-46	D_t_-46	H_t_-46	W_t_-70
t-47		T_t_-47	φ_t_-47	D_t_-47	H_t_-47	W_t_-71

注:“空白”表示不适用.

2.2 模型计算效率分析

计算效率是评价模型的重要指标之一.以GTX1050作为训练模型的GPU,对深度学习模型可训练参数的数目与模型训练时间进行统计,如表3所示.SRNN可训练参数为 17596,训练耗时为 1193 s.LSTM模型由于加入了记忆门、遗忘门,可训练参数达到 65089,训练耗时增长到 1745 s.训练耗时主要与模型结构有关,表明LSTM模型结构比SRNN模型更加复杂.对于本文所提出的 CNN-RNN组合模型,使用CNN层对特征进行提取后,RNN层输入张量减小;尽管层数增加,模型复杂度并没有大幅度提升.模型初始化后可训练参数个数为 17633,训练耗时848 s,训练耗时相较于SRNN与LSTM模型分别减少了28.9%和51.4%.

表3 3种模型计算效率

Tab.3 Calculation efficiency of three models

模型	可训练参数	训练时间/s
SRNN	17596	1193
LSTM	65089	1745
CNN-RNN	17633	848

2.3 模型验证及预测性能分析

本文采用了平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和拟合优度(R²)作为评价指标.一般而言,较小的平均绝对误差和平均绝对百分比误差以及较大的拟合优度表明模型具有较高的预测精度.评价指标如下式所示:

$\begin{matrix} M A E = \frac{1}{N} \overset{N}{\sum_{i = 1}} | {\hat{y}}_{i} - y_{i} | \end{matrix}$

(2)

$M A P E = \frac{1}{N} \overset{N}{\sum_{i = 1}} \frac{| {\hat{y}}_{i} - y_{i} |}{y_{i}}$

(3)

$R^{2} = \frac{\overset{N}{\sum_{i = 1}} ({\hat{y}}_{i} - y_{i})^{2}}{\overset{N}{\sum_{i = 1}} (y_{i} {- \bar{y})}^{2}}$

(4)

式中: ${\hat{y}}_{i}$ 为第i个样本预测值; $y_{i}$ 为第i个样本真实值; ${\bar{y}}_{i}$ 为样本均值;N为样本数.

将全年数据集按照比例随机划分为训练集与测试集,其中,80%的数据作为训练集,20%的数据作为测试集,各模型训练集与测试集的评价指标如表4所示.SRNN与LSTM模型的MAPE指标均高于15%,其中LSTM模型的性能指标出现了较大幅度下降,表明模型对数据中隐含规律的学习能力较差.相比与SRNN与LSTM模型,CNN-RNN组合模型在测试集上的MAPE指标分别降低了13.8%和48.3%,表明在经过CNN层提取特征之后,组合模型的RNN层学习能力明显提升.组合模型在训练集与测试集上的MAPE指标接近,表明模型对新数据拟合能力强,模型泛化性好.

表4 模型预测精度对比

Tab.4 Comparison of model prediction accuracy

模型	数据集	MAE/(kW·h)	MAPE/%	R²
SRNN	训练集	28.2	15.38	0.956
	测试集	31.3	15.93	0.946
LSTM	训练集	51.8	25.92	0.859
	测试集	56.2	26.54	0842
CNN-RNN	训练集	32.4	12.97	0.934
	测试集	36.1	13.73	0.918

从全年数据中,分别选取供暖季1月、过渡季4月和供冷季7月的前8天作为典型,查看历史能耗数据与预测数据,结果如图4~6所示.

图4

图4 3种模型1月份预测曲线

Fig.4 Prediction curves of three models in January

图5

图5 3种模型4月份预测曲线

Fig.5 Prediction curves of three models in April

图6

图6 3种模型7月份预测曲线

Fig.6 Prediction curves of three models in July

SRNN模型在1月供暖季和7月供冷季均取得了较好的预测表现,而在4月过渡季表现较差.LSTM模型仅在7月具有较好的预测性能,另外两个工况精度均较差,未能有效学习到建筑全部的运行能耗变化规律.表明过渡季的换季特性导致办公建筑运行规律不稳定,使得SRNN模型与LSTM模型预测出现异常结果.且尽管LSTM模型具有更多的训练参数,但模型结构过于复杂,在基于当前的能耗数据训练时,容易出现训练不充分现象.

CNN-RNN组合模型整体能耗预测曲线较为平滑,相较于SRNN与LSTM模型,该组合模型能够较好地学习到办公建筑中相对稳定的能耗变化规律.组合模型在1月与7月的预测结果与SRNN模型接近,均能较好地反映办公建筑运行规律;而在4月的预测曲线拟合度明显优于SRNN与LSTM模型,表明经过CNN层提取特征后,不仅降低了数据复杂度,缩短模型训练时间,同时将提取后的特征作为RNN层输入,有效降低了过渡季时序性不足对预测结果的干扰,有助于模型学习到能耗变化规律,从而验证了该组合模型能有效提高办公建筑能耗的整体预测效果.

3 结论

本文建立了CNN-RNN组合模型实现建筑能耗预测,并利用办公建筑能耗实测数据进行验证与分析,得到的主要结论如下:

(1) 基于CNN算法对局部关联特征的提取能力与RNN算法对时序特性的学习能力,提出了CNN-RNN组合模型,实现深度学习在建筑能耗预测领域的有效利用.

(2) 基于CNN和RNN两类神经网络层特性,提出了适用于深度学习的二维矩阵输入数据结构.通过增加各变量的历史数据,构成新的维度,使得输入数据结构同时包含了变量的同时刻特征与历史规律,充分发挥了深度学习算法的特征提取能力.

(3) 分析结果表明,相较于简单循环神经网络模型,CNN-RNN组合模型预测曲线更为平滑,在拟合优度相近的情况下,计算效率取得了显著提升,计算时间和MAPE分别下降了28.9%和13.8%.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

中国建筑节能协会.

中国建筑能耗研究报告2020

[J]. 建筑节能, 2021, 49(2): 1-6.

China Association of Building Energy Efficiency.

China building energy consumption annual report 2020

[J]. Building Energy Efficiency, 2021, 49(2): 1-6.

DOI:10.1016/j.rser.2013.03.004 URL [本文引用: 1]

[2]

FOUCQUIER

, ROBERT

, SUARD

, et al.

State of the art in building modelling and energy performances prediction: A review

[J]. Renewable and Sustainable Energy Reviews, 2013, 23: 272-288.

[3]

GASSAR

A A A

, CHA

S H

Energy prediction techniques for large-scale buildings towards a sustainable built environment: A review

[J]. Energy and Buildings, 2020, 224: 110238.

DOI:10.1016/j.energy.2018.09.156 URL [本文引用: 1]

[4]

, ZENG

X J

, FENG

P P

, et al.

Clustering-based short-term load forecasting for residential electricity under the increasing-block pricing tariffs in China

[J]. Energy, 2018, 165: 76-89.

[5]

KIM

J H

, SEONG

N C

, CHOI

Forecasting the energy consumption of an actual air handling unit and absorption chiller using ANN models

[J]. Energies, 2020, 13(17): 4361.

DOI:10.1016/j.apenergy.2017.09.060 URL [本文引用: 1]

[6]

ROBINSON

, DILKINA

, HUBBS

, et al.

Machine learning approaches for estimating commercial building energy consumption

[J]. Applied Energy, 2017, 208: 889-904.

[7]

RAJAGUKGUK

R A

, RAMADHAN

R A A

, LEE

H J

A review on deep learning models for forecasting time series data of solar irradiance and photovoltaic power

[J]. Energies, 2020, 13(24): 6623.

DOI:10.3390/en13246623 URL [本文引用: 1]

[8]

FAN

, SUN

Y J

, ZHAO

, et al.

Deep learning-based feature engineering methods for improved building energy prediction

[J]. Applied Energy, 2019, 240: 35-45.

DOI:10.1016/j.apenergy.2019.02.052 URL [本文引用: 1]

[9]

廖文强, 王江宇, 陈焕新, 等.

基于深度学习的建筑能耗短期预测方法研究

[C]// 2019年中国家用电器技术大会论文集. 佛山: 电器杂志社, 2019: 1173-1178

LIAO

Wenqiang

, WANG

Jiangyu

, Chen

Huanxin

, et al.

Research on short-term building energy consumption prediction method based on deep-learning

[C]// Proceeding of 2019 China Household Electrical Appliances Technical Conference. Foshan, China: Appliance, 2019: 1173-1178.

[10]

邹锋, 田大伟, 王悦, 等.

基于生成对抗网络的深度学习能耗预测算法

[J]. 电脑知识与技术, 2019, 15(2): 198-200.

ZOU

Feng

, TIAN

Dawei

, WANG

Yue

, et al.

Deep learning energy consumption prediction algorithms based on generative adversarial networks

[J]. Computer Knowledge and Technology, 2019, 15(2): 198-200.

DOI:10.3390/en14030608 URL [本文引用: 1]

[11]

RUNGE

, ZMEUREANU

A review of deep learning techniques for forecasting energy use in buildings

[J]. Energies, 2021, 14(3): 608.

[12]

YAMASHITA

, NISHIO

, DO

R K G

, et al.

Convolutional neural networks: An overview and application in radiology

[J]. Insights into Imaging, 2018, 9(4): 611-629.

DOI:10.1007/s13244-018-0639-9 PMID:29934920 [本文引用: 1]

Convolutional neural network (CNN), a class of artificial neural networks that has become dominant in various computer vision tasks, is attracting interest across a variety of domains, including radiology. CNN is designed to automatically and adaptively learn spatial hierarchies of features through backpropagation by using multiple building blocks, such as convolution layers, pooling layers, and fully connected layers. This review article offers a perspective on the basic concepts of CNN and its application to various radiological tasks, and discusses its challenges and future directions in the field of radiology. Two challenges in applying CNN to radiological tasks, small dataset and overfitting, will also be covered in this article, as well as techniques to minimize them. Being familiar with the concepts and advantages, as well as limitations, of CNN is essential to leverage its potential in diagnostic radiology, with the goal of augmenting the performance of radiologists and improving patient care. KEY POINTS: • Convolutional neural network is a class of deep learning methods which has become dominant in various computer vision tasks and is attracting interest across a variety of domains, including radiology. • Convolutional neural network is composed of multiple building blocks, such as convolution layers, pooling layers, and fully connected layers, and is designed to automatically and adaptively learn spatial hierarchies of features through a backpropagation algorithm. • Familiarity with the concepts and advantages, as well as limitations, of convolutional neural network is essential to leverage its potential to improve radiologist performance and, eventually, patient care.

[13]

HAZRA

, CHOUDHARY

, SHEETAL

S M

Recent advances in deep learning techniques and its applications: An overview

[C]// Advances in Biomedical Engineering and Technology. Singapore: Springer, 2020: 103-122.