上海交通大学学报, 2022, 56(9): 1256-1261 doi: 10.16183/j.cnki.jsjtu.2021.192

机械与动力工程

基于CNN-RNN组合模型的办公建筑能耗预测

曾国治1, 魏子清1, 岳宝2, 丁云霄2, 郑春元2, 翟晓强,1

1.上海交通大学 机械与动力工程学院,上海 200240

2.广东美的暖通设备有限公司,广东 佛山 528311

Energy Consumption Prediction of Office Buildings Based on CNN-RNN Combined Model

ZENG Guozhi1, WEI Ziqing1, YUE Bao2, DING Yunxiao2, ZHENG Chunyuan2, ZHAI Xiaoqiang,1

1. School of Mechanical Engineering, Shanghai Jiao Tong University, Shanghai 200240, China

2. Guangdong Midea HVAC Equipment Co., Ltd., Foshan 528311, Guangdong, China

通讯作者: 翟晓强,男,教授,博士生导师,电话(Tel.):021-34206296;E-mail:xqzhai@sjtu.edu.cn.

责任编辑: 石易文

收稿日期: 2021-05-23  

Received: 2021-05-23  

作者简介 About authors

曾国治(1998-),男,四川省泸州市人,硕士生,主要从事智慧建筑与建筑节能研究.

摘要

为准确反映办公建筑的运行特性,利用卷积神经网络(CNN)良好的特征提取能力与循环神经网络(RNN)良好的时序学习能力,提出用于预测办公建筑能耗的CNN-RNN组合模型,并对应设计了适用于深度学习模型的二维矩阵数据输入结构.案例分析结果表明,相较于简单循环神经网络和长短期记忆网络,CNN-RNN组合模型的预测精度与计算效率均显著提升,模型泛化性好.

关键词: 建筑能耗预测; 卷积神经网络; 循环神经网络; 深度学习

Abstract

In order to accurately reflect the operation characteristics of office buildings, a convolutional neural network(CNN)-recurrent neural network(RNN)combined model for energy consumption prediction of office buildings is proposed by using the good feature extraction ability of CNN and the good time series learning ability of RNN. Besides, a two-dimensional matrix data input structure suitable for the deep learning model is designed. The case study results show that compared with the simple recurrent neural network and long short term memory network, both the prediction accuracy and computational efficiency of CNN-RNN combined model are significantly improved, and the generalization of the model is also good.

Keywords: prediction of building energy consumption; convolutional neural network (CNN); recurrent neural network(RNN); deep learning

PDF (2358KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

曾国治, 魏子清, 岳宝, 丁云霄, 郑春元, 翟晓强. 基于CNN-RNN组合模型的办公建筑能耗预测[J]. 上海交通大学学报, 2022, 56(9): 1256-1261 doi:10.16183/j.cnki.jsjtu.2021.192

ZENG Guozhi, WEI Ziqing, YUE Bao, DING Yunxiao, ZHENG Chunyuan, ZHAI Xiaoqiang. Energy Consumption Prediction of Office Buildings Based on CNN-RNN Combined Model[J]. Journal of Shanghai Jiaotong University, 2022, 56(9): 1256-1261 doi:10.16183/j.cnki.jsjtu.2021.192

建筑运行阶段能耗在中国能源消耗中占比21.7%[1],是温室气体排放的重要来源.随着经济发展和人民生活水平的提高,建筑能源消耗比例呈现出不断上升的趋势.因此,对建筑能耗进行预测以指导建筑运行模式和节能评估,对建筑节能有着重要意义.目前,建筑能耗预测方法主要可分为基于热力学规则的物理模型和基于机器学习算法的数据模型[2].由于物理模型耗时较长且需要详尽的建筑信息与环境参数(如建筑构造细节、运行时间表、物性参数等),在实际应用中常因为缺少准确的输入数据,导致能耗模拟结果不佳[3].

数据模型能够根据建筑的历史能耗数据和建筑业态,在缺少建筑物理参数的情况下快速精准地对建筑能耗进行预测,近年来得到了广泛的应用.目前,常用的机器学习算法有支持向量回归(SVR)[4]、人工神经网络(ANN)[5]以及梯度渐进回归树(GBRT)[6]等.然而,这些传统的机器学习算法仍然需要大量的人工操作来提取数据中的特征,以降低数据的复杂性.

随着数据量增多以及算力增长,数据模型逐渐由浅层机器学习发展到深度学习.深度学习通过多个网络层直接从数据中进行特征的提取与学习,有着较强的模型表达能力.相较于传统机器学习,深度学习模型预测精度随着训练数据量增长而不断提高[7].目前,应用于建筑能耗预测领域的深度学习算法主要包括自动编码器(AE)[8]、循环神经网络(RNN)、长短期记忆网络(LSTM)[9]、生成对抗网络(GAN)[10]等模型,而卷积神经网络(CNN)目前应用较少[11],CNN网络具有极强的局部特征捕捉能力,应用到建筑能耗预测领域中能够通过构建高维特征,有效地学习到影响能耗的变量之间的非线性相互作用关系.此外,基于深度学习的组合模型在建筑能耗预测中的应用也鲜有报道.

本文利用卷积神经网络良好的特征提取能力与循环神经网络良好的时序学习能力,提出用于预测办公建筑能耗的CNN-RNN组合模型,在办公建筑数据集下验证模型性能,并与简单循环神经网络(SRNN)和LSTM模型进行综合比较.该研究可为数据驱动的建筑能耗预测建模提供理论指导,准确预测结果可为办公建筑的运行优化和节能管理提供数据支持.

1 模型原理

1.1 卷积神经网络

卷积神经网络通过处理输入数据的局部关联,避免因为输入数据维度过大而导致的模型参数过多.卷积运算的关键特征是权值共享[12],当卷积核扫描提取数据中的局部特征时,该卷积核移动一定步长后提取局部特征的模式不变,通过不断移动卷积核,完成对数据的扫描并得到较少的参数.卷积神经网络结构如图1所示,其中:x1,x2,…,x5为输入变量;t+1,t,…,t-47为时间序列,t+1表示t时刻后1时刻,t-1表示t时刻前1时刻.

图1

图1   卷积神经网络示意图

Fig.1   Schematic diagram of CNN


卷积神经网络一般包含卷积层、激活层、池化层和全连接层.卷积层从输入的数据中获取信息,根据沿输入特征扫描方向的不同,可以分为逐行扫描(R-CNN) 和逐列扫描(C-CNN).R-CNN是先通过卷积神经网络逐行扫描,将所有单个时刻点的输入特征进行组合,之后对时序上的所有组合特征进行学习.在输入数据训练模型时,通过转置二维的输入数据,可实现C-CNN对列方向的扫描.卷积层利用卷积核从数据中提取特征形成特征映射图.这些特征通过一个非线性激活函数传递,该激活函数加速CNN理解数据间的复杂关系.

1.2 循环神经网络

循环神经网络是一种用于从时间序列数据中捕获信息的网络.与只建立层与层之间权重联系的基本神经网络相比,RNN最显著的特征在于层内的神经元之间也建立了权连接.作为最基本的循环神经网络,简单循环神经网络结构如图2所示.其中:xt为t时刻输入;St为t时刻隐层单元;yt为t时刻输出;O为权重矩阵;U为输入变换矩阵;V为输出变换矩阵,与U在序列的不同时间点上共享,可以视为学习序列中固定的状态转移矩阵.长短期记忆网络是一种改良的循环神经网络,通过在每个神经元内提供反馈,在一定程度上解决了梯度消失的问题.SRNN在每次误差反馈过程中都会丢失部分信息,LSTM通过控制新信息对神经元存储信息的干扰程度,提取信号特征中的长期相关性,以提高识别精度[13].

图2

图2   简单循环神经网络示意图

Fig.2   Schematic diagram of SRNN


1.3 CNN-RNN模型结构

针对建筑能耗预测领域,在CNN模型中,R-CNN可以提取建筑能耗数据中同一时刻不同特征之间的非线性关系,通过卷积核构成高维特征;在RNN模型中,SRNN在时域上对建筑能耗变化趋势的预测更加精准,能够准确地表达建筑能耗的非线性特征.利用SRNN层从R-CNN层的输出信息中提取高维抽象特征,构成CNN-RNN组合模型,对于建筑能耗数据具有良好的适应性,模型顺序构成如表1所示.通过一维卷积核(Conv_1D)提取同时刻数据的组合特征之后,再使用SRNN层学习数据的时序特性,最后通过全连接层(Dense层)实现回归预测.R-CNN层与全连接层选用深度学习中常用的ReLU激活函数,对小于0的值全部抑制为0,对于正数则直接输出;而在SRNN层中,为了防止其出现梯度消失等问题,其激活函数采用ELU,对于小于0的值可以取负值,使单元激活均值接近于0.

表1   CNN-RNN模型顺序构成

Tab.1  Sequential structure of CNN-RNN model

网络层序号类型神经元个数激活函数
1Conv_1D64ReLU
2Conv_1D64ReLU
3SRNN(返回序列)64ELU
4SRNN32ELU
5Dense32ReLU
6Dense16ReLU
7Dense8ReLU

新窗口打开| 下载CSV


除了模型中间层,还需要设置模型输入、输出层.其中,模型输入层维度与输入数据维度相同,输出层为仅有一个神经元的全连接层,使模型最终能够输出预测能耗值.同时为提升模型泛化能力,在第一层全连接层后加入随机失活层,减少中间特征的数量,从而减少冗余.

2 模型性能分析及模型验证

2.1 数据分析

2.1.1 数据获取及预处理

选取上海市某办公建筑作为研究对象,该建筑总面积1.9×104 m2.通过能耗监测系统获得了2018年的历史逐时能耗数据(Wt),能耗曲线如图3所示.由图3可以看出,办公建筑能耗与季节和建筑运营规律有着明显的相关性.因此,模型的输入参数包括两大类:① 时间变量,包括月、日、时、分、工作日与否;② 室外变量,包括室外气温(OAT)、相对湿度(ORH).气象数据由Iowa Environmental Mesonet的ASOS数据库[14]获得.

图3

图3   办公建筑2018年能耗曲线

Fig.3   Energy consumption curves of an office building in 2018


为了对数据异常值进行筛选,以能耗值95%分位点作为基准值,以基准值的2倍作为合理能耗区间,区间外的数据认定为是异常值.删除异常值后使用线性插值进行补全,然后采用Min-Max方法对数据进行标准化处理,以消除不同量纲及量纲单位对预测性能的影响,如下式所示:

x*=x-xminxmax-xmin

式中: x*为归一化后的变量值;x为输入变量的当前值;xmax为输入变量的最大值;xmin为输入变量的最小值.

2.1.2 输入数据结构

传统机器学习模型中输入数据按照一维向量格式进行保存,随着深度学习对数据量需求的增加,一维向量结构作为输入无法体现数据特征的特性差异,不利于深度学习模型自动提取数据特征.为此,本文提出适用于深度学习的数据结构,如表2所示. 其中:Tt为室外气温;φt为相对湿度;Dt为工作日与否;Ht为24 h时刻; 考虑到建筑运行的周期性,加入前48 h的历史输入数据,使模型可以学习更为长期的趋势,获得更精准的预测值.相比于一维向量数据结构,增添了所有变量的历史数据,将输入数据重组为二维矩阵.对于表2所示结构,组合模型可以通过横向扫描对单个时刻的输入进行组合,同时可以对时序上的所有组合特征进行学习,充分发挥了深度学习的特征提取能力.

表2   用于深度学习的建筑能耗数据结构

Tab.2  Building energy consumption data structure for deep learning

时间
模型输出
能耗数据/
(kW·h)
模型输入
室外
气温/℃
相对
湿度/%
工作日时刻历史
序列
t+1Wt+1Tt+1φt+1Dt+1Ht+1Wt-23
tTtφtDtHtWt-24
t-1Tt-1φt-1Dt-1Ht-1Wt-25
t-2Tt-2φt-2Dt-2Ht-2Wt-26
t-45Tt-45φt-45Dt-45Ht-45Wt-69
t-46Tt-46φt-46Dt-46Ht-46Wt-70
t-47Tt-47φt-47Dt-47Ht-47Wt-71

注:“空白”表示不适用.

新窗口打开| 下载CSV


2.2 模型计算效率分析

计算效率是评价模型的重要指标之一.以GTX1050作为训练模型的GPU,对深度学习模型可训练参数的数目与模型训练时间进行统计,如表3所示.SRNN可训练参数为 17596,训练耗时为 1193 s.LSTM模型由于加入了记忆门、遗忘门,可训练参数达到 65089,训练耗时增长到 1745 s.训练耗时主要与模型结构有关,表明LSTM模型结构比SRNN模型更加复杂.对于本文所提出的 CNN-RNN组合模型,使用CNN层对特征进行提取后,RNN层输入张量减小;尽管层数增加,模型复杂度并没有大幅度提升.模型初始化后可训练参数个数为 17633,训练耗时848 s,训练耗时相较于SRNN与LSTM模型分别减少了28.9%和51.4%.

表3   3种模型计算效率

Tab.3  Calculation efficiency of three models

模型可训练参数训练时间/s
SRNN175961193
LSTM650891745
CNN-RNN17633848

新窗口打开| 下载CSV


2.3 模型验证及预测性能分析

本文采用了平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和拟合优度(R2)作为评价指标.一般而言,较小的平均绝对误差和平均绝对百分比误差以及较大的拟合优度表明模型具有较高的预测精度.评价指标如下式所示:

MAE=1Ni=1N|y^i-yi|
MAPE=1Ni=1N|y^i-yi|yi
R2=i=1N(y^i-yi)2i=1N(yi-y-)2

式中:y^i为第i个样本预测值;yi为第i个样本真实值;y-i为样本均值;N为样本数.

将全年数据集按照比例随机划分为训练集与测试集,其中,80%的数据作为训练集,20%的数据作为测试集,各模型训练集与测试集的评价指标如表4所示.SRNN与LSTM模型的MAPE指标均高于15%,其中LSTM模型的性能指标出现了较大幅度下降,表明模型对数据中隐含规律的学习能力较差.相比与SRNN与LSTM模型,CNN-RNN组合模型在测试集上的MAPE指标分别降低了13.8%和48.3%,表明在经过CNN层提取特征之后,组合模型的RNN层学习能力明显提升.组合模型在训练集与测试集上的MAPE指标接近,表明模型对新数据拟合能力强,模型泛化性好.

表4   模型预测精度对比

Tab.4  Comparison of model prediction accuracy

模型数据集MAE/(kW·h)MAPE/%R2
SRNN训练集28.215.380.956
测试集31.315.930.946
LSTM训练集51.825.920.859
测试集56.226.540842
CNN-RNN训练集32.412.970.934
测试集36.113.730.918

新窗口打开| 下载CSV


从全年数据中,分别选取供暖季1月、过渡季4月和供冷季7月的前8天作为典型,查看历史能耗数据与预测数据,结果如图4~6所示.

图4

图4   3种模型1月份预测曲线

Fig.4   Prediction curves of three models in January


图5

图5   3种模型4月份预测曲线

Fig.5   Prediction curves of three models in April


图6

图6   3种模型7月份预测曲线

Fig.6   Prediction curves of three models in July


SRNN模型在1月供暖季和7月供冷季均取得了较好的预测表现,而在4月过渡季表现较差.LSTM模型仅在7月具有较好的预测性能,另外两个工况精度均较差,未能有效学习到建筑全部的运行能耗变化规律.表明过渡季的换季特性导致办公建筑运行规律不稳定,使得SRNN模型与LSTM模型预测出现异常结果.且尽管LSTM模型具有更多的训练参数,但模型结构过于复杂,在基于当前的能耗数据训练时,容易出现训练不充分现象.

CNN-RNN组合模型整体能耗预测曲线较为平滑,相较于SRNN与LSTM模型,该组合模型能够较好地学习到办公建筑中相对稳定的能耗变化规律.组合模型在1月与7月的预测结果与SRNN模型接近,均能较好地反映办公建筑运行规律;而在4月的预测曲线拟合度明显优于SRNN与LSTM模型,表明经过CNN层提取特征后,不仅降低了数据复杂度,缩短模型训练时间,同时将提取后的特征作为RNN层输入,有效降低了过渡季时序性不足对预测结果的干扰,有助于模型学习到能耗变化规律,从而验证了该组合模型能有效提高办公建筑能耗的整体预测效果.

3 结论

本文建立了CNN-RNN组合模型实现建筑能耗预测,并利用办公建筑能耗实测数据进行验证与分析,得到的主要结论如下:

(1) 基于CNN算法对局部关联特征的提取能力与RNN算法对时序特性的学习能力,提出了CNN-RNN组合模型,实现深度学习在建筑能耗预测领域的有效利用.

(2) 基于CNN和RNN两类神经网络层特性,提出了适用于深度学习的二维矩阵输入数据结构.通过增加各变量的历史数据,构成新的维度,使得输入数据结构同时包含了变量的同时刻特征与历史规律,充分发挥了深度学习算法的特征提取能力.

(3) 分析结果表明,相较于简单循环神经网络模型,CNN-RNN组合模型预测曲线更为平滑,在拟合优度相近的情况下,计算效率取得了显著提升,计算时间和MAPE分别下降了28.9%和13.8%.

参考文献

中国建筑节能协会.

中国建筑能耗研究报告2020

[J]. 建筑节能, 2021, 49(2): 1-6.

[本文引用: 1]

China Association of Building Energy Efficiency.

China building energy consumption annual report 2020

[J]. Building Energy Efficiency, 2021, 49(2): 1-6.

[本文引用: 1]

FOUCQUIER A, ROBERT S, SUARD F, et al.

State of the art in building modelling and energy performances prediction: A review

[J]. Renewable and Sustainable Energy Reviews, 2013, 23: 272-288.

DOI:10.1016/j.rser.2013.03.004      URL     [本文引用: 1]

GASSAR A A A, CHA S H.

Energy prediction techniques for large-scale buildings towards a sustainable built environment: A review

[J]. Energy and Buildings, 2020, 224: 110238.

[本文引用: 1]

FU X, ZENG X J, FENG P P, et al.

Clustering-based short-term load forecasting for residential electricity under the increasing-block pricing tariffs in China

[J]. Energy, 2018, 165: 76-89.

DOI:10.1016/j.energy.2018.09.156      URL     [本文引用: 1]

KIM J H, SEONG N C, CHOI W.

Forecasting the energy consumption of an actual air handling unit and absorption chiller using ANN models

[J]. Energies, 2020, 13(17): 4361.

[本文引用: 1]

ROBINSON C, DILKINA B, HUBBS J, et al.

Machine learning approaches for estimating commercial building energy consumption

[J]. Applied Energy, 2017, 208: 889-904.

DOI:10.1016/j.apenergy.2017.09.060      URL     [本文引用: 1]

RAJAGUKGUK R A, RAMADHAN R A A, LEE H J.

A review on deep learning models for forecasting time series data of solar irradiance and photovoltaic power

[J]. Energies, 2020, 13(24): 6623.

DOI:10.3390/en13246623      URL     [本文引用: 1]

FAN C, SUN Y J, ZHAO Y, et al.

Deep learning-based feature engineering methods for improved building energy prediction

[J]. Applied Energy, 2019, 240: 35-45.

DOI:10.1016/j.apenergy.2019.02.052      URL     [本文引用: 1]

廖文强, 王江宇, 陈焕新, .

基于深度学习的建筑能耗短期预测方法研究

[C]// 2019年中国家用电器技术大会论文集. 佛山: 电器杂志社, 2019: 1173-1178

[本文引用: 1]

LIAO Wenqiang, WANG Jiangyu, Chen Huanxin, et al.

Research on short-term building energy consumption prediction method based on deep-learning

[C]// Proceeding of 2019 China Household Electrical Appliances Technical Conference. Foshan, China: Appliance, 2019: 1173-1178.

[本文引用: 1]

邹锋, 田大伟, 王悦, .

基于生成对抗网络的深度学习能耗预测算法

[J]. 电脑知识与技术, 2019, 15(2): 198-200.

[本文引用: 1]

ZOU Feng, TIAN Dawei, WANG Yue, et al.

Deep learning energy consumption prediction algorithms based on generative adversarial networks

[J]. Computer Knowledge and Technology, 2019, 15(2): 198-200.

[本文引用: 1]

RUNGE J, ZMEUREANU R.

A review of deep learning techniques for forecasting energy use in buildings

[J]. Energies, 2021, 14(3): 608.

DOI:10.3390/en14030608      URL     [本文引用: 1]

YAMASHITA R, NISHIO M, DO R K G, et al.

Convolutional neural networks: An overview and application in radiology

[J]. Insights into Imaging, 2018, 9(4): 611-629.

DOI:10.1007/s13244-018-0639-9      PMID:29934920      [本文引用: 1]

Convolutional neural network (CNN), a class of artificial neural networks that has become dominant in various computer vision tasks, is attracting interest across a variety of domains, including radiology. CNN is designed to automatically and adaptively learn spatial hierarchies of features through backpropagation by using multiple building blocks, such as convolution layers, pooling layers, and fully connected layers. This review article offers a perspective on the basic concepts of CNN and its application to various radiological tasks, and discusses its challenges and future directions in the field of radiology. Two challenges in applying CNN to radiological tasks, small dataset and overfitting, will also be covered in this article, as well as techniques to minimize them. Being familiar with the concepts and advantages, as well as limitations, of CNN is essential to leverage its potential in diagnostic radiology, with the goal of augmenting the performance of radiologists and improving patient care. KEY POINTS: • Convolutional neural network is a class of deep learning methods which has become dominant in various computer vision tasks and is attracting interest across a variety of domains, including radiology. • Convolutional neural network is composed of multiple building blocks, such as convolution layers, pooling layers, and fully connected layers, and is designed to automatically and adaptively learn spatial hierarchies of features through a backpropagation algorithm. • Familiarity with the concepts and advantages, as well as limitations, of convolutional neural network is essential to leverage its potential to improve radiologist performance and, eventually, patient care.

HAZRA A, CHOUDHARY P, SHEETAL S M.

Recent advances in deep learning techniques and its applications: An overview

[C]// Advances in Biomedical Engineering and Technology. Singapore: Springer, 2020: 103-122.

[本文引用: 1]

Iowa State University. Iowa environmental mesonet[DB/OL]. (2019-10-22) [2021-03-16]. http://mesonet.agron.iastate.edu/request/download.phtml?network=CN__ASOS#.

URL     [本文引用: 1]

/