一种基于可解释神经网络模型的压缩机功率软测量方法

doi:10.16183/j.cnki.jsjtu.2020.086

一种基于可解释神经网络模型的压缩机功率软测量方法

王煜林, 周登极^,, 郝佳瑞, 黄大文

上海交通大学机械与动力工程学院, 上海 200240

A Compressor Power Soft-Sensing Method Based on Interpretable Neural Network Model

WANG Yulin, ZHOU Dengji^,, HAO Jiarui, HUANG Dawen

School of Mechanical Engineering, Shanghai Jiao Tong University, Shanghai 200240, China

通讯作者: 周登极,男,助理教授,博士生导师;E-mail:1516761299@sjtu.edu.cn.

责任编辑: 石易文

收稿日期: 2020-04-3

基金资助:

国家自然科学基金资助项目(51706132)

Received: 2020-04-3

作者简介 About authors

王煜林(1997-),男,辽宁省大连市人,硕士生,主要研究方向为动力系统数据驱动建模

摘要

为在保证测量的准确性和高效性的同时,降低软测量方法对数据集的依赖性,提出一种基于可解释神经网络的压缩机功率软测量方法.实验中,在使用泛化性良好的数据集进行训练时,可解释神经网络模型在测试集上的均方根误差为 0.0094,相比反向传播(BP)神经网络模型降低了1.1%.在使用泛化性较差的数据集进行训练时,可解释神经网络模型在测试集上的均方根误差为 0.0128,相比BP神经网络模型降低了79.8%.实验结果表明,基于可解释神经网络的压缩机功率软测量方法不但具有较高的准确率,且在使用泛化性较差的数据集进行训练时,依然能够保持较高的测量性能.

关键词： 可解释性; 神经网络; 软测量方法; 压缩机

Abstract

In order to ensure the accuracy and efficiency of measurement, and reduce the dependence of the soft sensing on dataset, a soft-sensing method of compressor power based on interpretable neural network is proposed. When training on a dataset with good generalization in the experiment, the root mean squared error(RMSE) of the interpretable neural network model on the test set is 0.0094, which is 1.1% lower than that of the back propagation(BP) neural network model. When training on a dataset with poor generalization, the RMSE of the interpretable neural network model on the test set is 0.0128, which is 79.8% lower than that of the BP neural network model. The experimental results show that the soft-sensing method based on interpretable neural network not only has a high accuracy rate, but also can maintain a good measurement performance when training on a dataset with poor generalization.

Keywords： interpretability; neural network; soft-sensing method; compressor

PDF (1586KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

王煜林, 周登极, 郝佳瑞, 黄大文. 一种基于可解释神经网络模型的压缩机功率软测量方法[J]. 上海交通大学学报（自然版）, 2021, 55(6): 774-780 doi:10.16183/j.cnki.jsjtu.2020.086

WANG Yulin, ZHOU Dengji, HAO Jiarui, HUANG Dawen. A Compressor Power Soft-Sensing Method Based on Interpretable Neural Network Model[J]. Journal of shanghai Jiaotong University, 2021, 55(6): 774-780 doi:10.16183/j.cnki.jsjtu.2020.086

压缩机是燃气轮机中的主要耗能部件.为实现压缩机组的能耗监测、提升压缩机组控制策略,需要对其功率进行准确、实时的测量.压缩机功率测量依靠扭矩仪实现,其造价高昂且大型扭矩仪尚未实现国产化.同时,为压缩机安装扭矩仪将增加压缩机的轴系长度,降低系统的可靠性.因此,目前大多采用软测量技术对压缩机功率进行计算.

软测量是指对于系统中难以测量的重要变量,选择一组既与该变量有密切联系又容易测量的二次变量,通过构造某种数学关系实现对该变量的估计^[1].软测量方法的研究目前有两种方向,一种基于机理,一种基于数据.基于机理的软测量方法研究目标系统的结构及其运行过程,并通过机理公式搭建目标变量的计算模型以实现对变量的估计.早在2005年便有研究通过对滑片式压缩机的结构和受力过程进行分析,对其功率软测量模型进行改进^[2].近年来的研究通过分析不同工况下压缩机的机理公式,已将其功率测量的相对误差降低至2.74%^[3].上述测量方法的优势在于其普适性,对于任意系统,只要明确参数的计算机理,便可以对该参数进行测量.但其计算速度较慢,其预测难以具备实时性.同时,由于实际生产中的多种环境扰动,机理模型的准确率往往较低.

基于数据的软测量方法直接根据系统的输入输出搭建机器学习模型,并使用已有数据对模型进行训练拟合,从而使模型具备对未知输入的预测能力.文献[4]中提出一种使用等度量映射算法的软测量建模方法.文献[5]中使用改进的径向基(RBF)神经网络搭建软测量模型对污水中的化学需氧量进行计算,并将测量的相对误差降低至1.25%以内.相比于基于机理的方法,基于数据的软测量方法拥有更高的准确率和计算效率,其无需具备对象的先验知识,而根据对象的输入输出直接建模,在解决高度非线性和严重不确定性系统的测量上具有巨大潜力^[6].但是,机器学习模型本身对数据集的依赖程度较大,模型的准确率极大程度上取决于数据集的泛化能力,而许多工业系统中由于生产需要、测量手段单一等问题,高泛化性的数据集往往难以获取.对数据集较大的依赖性限制了基于数据的软测量方法在较多场合的应用.

为弥补两种软测量方法的不足,文献[7]中提出一种融合机理模型和数据的软测量方法,其使用机理模型对目标参数进行计算,并使用神经网络作为补偿器对测量结果进行矫正,取得了优于机理模型的测量结果.然而,由于该方法中的主要计算模块仍为机理模型,其运行效率并未得到有效提高;同时,由于该方法的结果仍然依赖于神经网络的矫正,虽然能够在一定程度上降低软测量对数据集的依赖程度,但其准确率仍然低于传统基于数据的软测量方法.

基于以上研究现状,本文提出一种基于可解释神经网络的压缩机功率软测量方法,将机理关系预置于神经网络之中,不但能使软测量模型具备神经网络模型的快速性以及准确性,而且能降低模型对数据集的依赖程度.在对压缩机功率的测量中,搭建3种软测量模型,分别为反向传播(BP)神经网络模型和两种融入不同程度机理的可解释神经网络模型,并对比三者在不同泛化能力数据集上的表现,验证了可解释神经网络模型在压缩机功率测量上的有效性.

1 BP神经网络模型搭建

BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络,亦是应用最广泛的神经网络之一.逆向传播算法可参考文献[8],本文仅对网络前馈结构进行简述.

一个多层BP神经网络前馈结构包括输入层、输出层和若干隐藏层.每层的任意节点和下一层的所有节点相连,连接权重组成权值矩阵w.网络相邻两层之间的前向传递关系如下式所示:

$x'_{j} = f (\overset{n}{\sum_{i = 1}} w_{ij} x_{i} + b_{j})$

(1)

式中: $x_{i}$ 为当前层中第i个节点的输出数值; $x'_{j}$ 为下一层第j个节点的输出数值; $w_{ij}$ 为当前层中第i个节点到下一层第j个节点的连接权重; $b_{j}$ 为下一层第j个节点的偏置值;f为激活函数,用于向神经网络模型中加入非线性因子.常用的激活函数已在文献[9]中列出并分析比较.

BP神经网络的输入、输出根据实际系统的输入、输出参数确定.实验中,测得5组与压缩机功率P_C相关的二次变量分别为压缩机转速n, 压缩机进口温度T_in,压缩机出口温度T_out,压缩机进口压强p_in,压缩机出口压强p_out,作为神经网络的输入.

根据模型的输入、输出,搭建BP神经网络模型.将该模型作为模型A,其结构如图1所示.

图1

新窗口打开| 下载原图ZIP| 生成PPT

图1 模型A前馈结构

Fig.1 Feed-forward structure of Model A

2 融入机理的BP神经网络模型搭建方法

机理BP神经网络模型的搭建在模型A的基础上进行,并融入压缩机的部分机理公式.根据能量守恒可知,若压缩机损耗不计,压缩机功率等于压缩机中气体质量流量和单位质量气体焓增的乘积,则有:

$P_{C} = q_{m} (h_{out} - h_{in})$

(2)

式中: $q_{m}$ 为压缩机气体质量流量;h_in为压缩机进口气体比焓;h_out为压缩机出口气体比焓.

气体质量流量取决于压缩机转速和入口气体的热力学状态.因此,可以得到如下函数关系f₁:

$q_{m} = f_{1} (n, p_{in}, T_{in})$

(3)

压缩机中单位质量的气体焓增取决于进出口气体的热力学状态,气体的热力学状态可由气体的温度、压强、比体积中任意二者决定.因此,可以得到如下函数关系:

$h_{out} - h_{in} = f_{2} (p_{in}, p_{out}, T_{in}, T_{out})$

(4)

$Δ h = h_{out} - h_{in}$

(5)

$P_{C} = f_{1} (n, p_{in}, T_{in}) f_{2} (p_{in}, p_{out}, T_{in}, T_{out})$

(6)

根据式(6)在神经网络模型中融入乘法运算,搭建可解释神经网络模型,作为模型B,其网络结构如图2所示.

图2

新窗口打开| 下载原图ZIP| 生成PPT

图2 模型B前馈结构

Fig.2 Feed-forward structure of Model B

上述可解释神经网络模型由两部分组成,一部分以转速、压缩机进口气体的温度、压力作为输入,计算压缩机中的气体流量;另一部分以压缩机进出口气体状态作为输入,计算压缩机中单位质量气体的焓变.将这两部分计算结果相乘并作为模型最终的输出.

由于压缩机在实际运行过程中,其损耗不可忽略,引入压缩机效率η_C,可表示为

$η_{C} P_{C} = q_{m} Δ h$

(7)

压缩机的运行效率η_C可由压气机的压比π_C和折合转速n_C确定,详细推导过程参考文献[10],可表示为

$π_{C} = \frac{p_{out}}{p_{in}}$

(8)

$n_{C} = \frac{n}{\sqrt[]{T_{in}}}$

(9)

可以得到如下函数关系:

$η_{C} = f_{3} (π_{C}, n, T_{in})$

(10)

压缩机功率计算公式可改写为

$P_{C} = \frac{f_{1} (n, p_{in}, T_{in}) f_{2} (p_{in}, p_{out}, T_{in}, T_{out})}{f_{3} (π_{C}, n, T_{in})}$

(11)

依照上述机理,在模型B中增加效率计算模块,得到模型C,其结构如图3所示.

图3

新窗口打开| 下载原图ZIP| 生成PPT

图3 模型C前馈结构

Fig.3 Feed-forward structure of Model C

相比于模型B,模型C新增了一部分网络结构,用于计算压缩机的效率.该部分网络将p_in、p_out整合为压比,与T_in、n共同作为输入计算得到效率.由于反向传播过程中除法的求导过程较为繁琐,令该部分网络计算效率的倒数1/η_C,并将其结果和q_m、Δh相乘,最终获得压缩机的输入功率.

综上所述,实验中搭建了3种软测量模型.其中,模型A为BP神经网络模型;模型B为融入少量机理的可解释神经网络模型;模型C为融入较多机理的可解释神经网络模型.

3 实验设计

实验数据来源于一台PCL803型号压缩机.采用美国KOP-FLEX高性能扭矩仪联轴器,连接于动力涡轮和压缩机中间,用于功率测量.实验中,令压缩机持续运行8.5 h,每隔1 s进行一次功率采样,并记录相应的压缩机转速、进出口温度及压力.实验共测得 30602 组时序数据.数据集中,P_C随时间t的变化曲线如图4所示.

图4

新窗口打开| 下载原图ZIP| 生成PPT

图4 数据集中压缩机功率随时间的变化曲线

Fig.4 Compressor power versus time in dataset

首先,使用前2.1×10⁴个时间节点的数据(以下简称为数据集(D)1)作为训练集训练模型A、B、C,并对后 9602 个时间节点的功率进行预测.数据集1作为训练集几乎包括了所有可能产生的功率数值,能够保证数据集的泛化能力.该组研究的目的在于验证机理BP神经网络模型的有效性,同时为可解释神经网络模型在泛化性较差数据集上的预测结果提供对照.

降低数据集的泛化能力,仅使用前1.8×10⁴个时间节点的数据(以下简称为数据集2)作为训练集训练模型A、B、C,以验证可解释神经网络模型在泛化性较差数据集上的有效性.实验中,设定训练簇大小为300,最大迭代次数为400,采用Adam算法^[11]对模型进行优化,以模型在验证集上的误差趋于稳定作为收敛依据.采用均方根误差(RMSE),平均绝对误差(MAE)作为模型准确率评价依据.其计算公式如下所示:

$RMSE = \sqrt[]{\frac{1}{N} \overset{N}{\sum_{n = 1}} (y_{n} - {\hat{y}}_{n})^{2}}$

(12)

$MAE = \frac{1}{N} \overset{n}{\sum_{n = 1}} |y_{n} - {\hat{y}}_{n}|$

(13)

式中: $N$ 为样本容量; $y_{n}$ 为真实值; ${\hat{y}}_{n}$ 为模型计算值.实验所涉及的其他重要模型参数如表1所示.

表1 模型参数设置

Tab.1 Setting of model parameters

模型	隐藏层1节点数	隐藏层2节点数	隐藏层3节点数	训练簇大小	优化算法	初始学习率	损失函数
A	15	30	15	300	Adam	0.01	MSE
B	10	20	10	300	Adam	0.005	MSE
C	10	20	10	300	Adam	0.005	MSE

新窗口打开| 下载CSV

4 结果分析

模型A、B、C在数据集1和2上的拟合及预测结果如图5~7所示;表2所示为压缩机输入功率预测值.由于数据集1的泛化性良好,A、B、C模型在数据集1上具有相似的、良好的表现,其均方根误差、平均绝对误差均在1%以下.其中,模型C在测试集上的均方根误差为0.94%,相比模型A降低了1.1%;平均绝对误差为0.49%,相比模型A降低了41.0%.3种模型的功率预测曲线和实际曲线基本重合,仅在某些功率突变的时间段内有小幅度的偏离.

图5

新窗口打开| 下载原图ZIP| 生成PPT

图5 模型A在D1和D2上的训练及其预测曲线

Fig.5 Training and prediction curves of Model A on D1 and D2

图6

新窗口打开| 下载原图ZIP| 生成PPT

图6 模型B在数据集1和 2上的训练及预测曲线

Fig.6 Training and prediction curves of Model B on D1 and D2

图7

新窗口打开| 下载原图ZIP| 生成PPT

图7 模型C在数据集1和 2上的训练及预测曲线

Fig.7 Training and prediction curves of Model C on D1 and D2

表2 压缩机输入功率预测准确率

Tab.2 Accuracy of input power prediction of compressor

训练样本	模型A		模型B		模型C
训练样本	RMSE/%	MAE/%	RMSE/%	MAE/%	RMSE/%	MAE/%
数据集1	0.95	0.83	0.99	0.81	0.94	0.49
数据集2	6.35	5.27	2.14	1.94	1.28	0.73

新窗口打开| 下载CSV

而在泛化性较差的数据集2上,模型A、B、C的预测偏差均有一定程度的增加,但模型B和C具有远好于模型A的预测表现.其中,模型C在测试集上的均方根误差为1.28%,相比模型A降低了79.8%;平均绝对误差为0.73%,相比模型A降低了86.1%.而对于仅融入较少机理的模型B,其表现虽然不及模型C,但也展现出远好于模型A的预测能力.在实际预测曲线上也可以看到,模型A在预测1.9×10⁴~2.7×10⁴时间段以及2.9×10⁴~3×10⁴时间段内的功率变化时产生了较大的偏差,而模型C在各个时间段上的预测结果均良好.

综合以上实验结果,认为可解释神经网络模型在使用泛化性良好的数据集训练时,具有不弱于BP神经网络模型的准确率和稳定性;在使用泛化性较差的数据集进行训练时,可解释神经网络模型相比BP神经网络模型具有更强的预测能力.基于可解释神经网络的软测量模型,不但具有传统神经网络模型的准确性和高效性,同时还降低了模型训练过程对数据集的依赖程度,是一种有效的压缩机功率软测量方法.

5 结论

本文提出一种基于可解释神经网络的压缩机功率软测量方法并对其进行验证.搭建了BP神经网络模型和融入不同程度机理的可解释模型,并基于压缩机实际运行数据构建不同泛化性的数据集对模型进行训练和测试,以验证可解释模型在压缩机功率软测量上的可行性.通过对模型的准确率加以评估和比较,获得以下结论.

(1) BP神经网络模型和融入不同程度机理的可解释神经网络模型在压缩机功率测量上表现良好,在数据集泛化能力得到保证的情况下,模型在测试集上的误差均在1%以下.可解释神经网络相比BP神经网络,在准确率方面有微小幅度的提高.该方法能够对压缩机功率进行有效测量.

(2) 当数据集的泛化能力较差时,可解释神经网络在压缩机功率测量方面具有较大的优势,且其准确率和融入机理与实际的契合程度呈正相关.机理约束降低了训练过程对数据集的依赖程度,使得该软测量方法具有更强的适应性.

(3) 可解释神经网络模型降低了传统神经网络模型对数据集的依赖程度,在许多工业数据不易获取、数据集泛化能力难以评估的场合中,该方法可以使用泛化性较低的数据集训练出高准确率的模型,具有良好的应用价值.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

于静江, 周春晖.

过程控制中的软测量技术

[J]. 控制理论与应用, 1996, 13(2):137-144.