上海交通大学学报(自然版), 2021, 55(6): 774-780 doi: 10.16183/j.cnki.jsjtu.2020.086

一种基于可解释神经网络模型的压缩机功率软测量方法

王煜林, 周登极,, 郝佳瑞, 黄大文

上海交通大学 机械与动力工程学院, 上海 200240

A Compressor Power Soft-Sensing Method Based on Interpretable Neural Network Model

WANG Yulin, ZHOU Dengji,, HAO Jiarui, HUANG Dawen

School of Mechanical Engineering, Shanghai Jiao Tong University, Shanghai 200240, China

通讯作者: 周登极,男,助理教授,博士生导师;E-mail:1516761299@sjtu.edu.cn.

责任编辑: 石易文

收稿日期: 2020-04-3  

基金资助: 国家自然科学基金资助项目(51706132)

Received: 2020-04-3  

作者简介 About authors

王煜林(1997-),男,辽宁省大连市人,硕士生,主要研究方向为动力系统数据驱动建模

摘要

为在保证测量的准确性和高效性的同时,降低软测量方法对数据集的依赖性,提出一种基于可解释神经网络的压缩机功率软测量方法.实验中,在使用泛化性良好的数据集进行训练时,可解释神经网络模型在测试集上的均方根误差为 0.0094,相比反向传播(BP)神经网络模型降低了1.1%.在使用泛化性较差的数据集进行训练时,可解释神经网络模型在测试集上的均方根误差为 0.0128,相比BP神经网络模型降低了79.8%.实验结果表明,基于可解释神经网络的压缩机功率软测量方法不但具有较高的准确率,且在使用泛化性较差的数据集进行训练时,依然能够保持较高的测量性能.

关键词: 可解释性; 神经网络; 软测量方法; 压缩机

Abstract

In order to ensure the accuracy and efficiency of measurement, and reduce the dependence of the soft sensing on dataset, a soft-sensing method of compressor power based on interpretable neural network is proposed. When training on a dataset with good generalization in the experiment, the root mean squared error(RMSE) of the interpretable neural network model on the test set is 0.0094, which is 1.1% lower than that of the back propagation(BP) neural network model. When training on a dataset with poor generalization, the RMSE of the interpretable neural network model on the test set is 0.0128, which is 79.8% lower than that of the BP neural network model. The experimental results show that the soft-sensing method based on interpretable neural network not only has a high accuracy rate, but also can maintain a good measurement performance when training on a dataset with poor generalization.

Keywords: interpretability; neural network; soft-sensing method; compressor

PDF (1586KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王煜林, 周登极, 郝佳瑞, 黄大文. 一种基于可解释神经网络模型的压缩机功率软测量方法[J]. 上海交通大学学报(自然版), 2021, 55(6): 774-780 doi:10.16183/j.cnki.jsjtu.2020.086

WANG Yulin, ZHOU Dengji, HAO Jiarui, HUANG Dawen. A Compressor Power Soft-Sensing Method Based on Interpretable Neural Network Model[J]. Journal of shanghai Jiaotong University, 2021, 55(6): 774-780 doi:10.16183/j.cnki.jsjtu.2020.086

压缩机是燃气轮机中的主要耗能部件.为实现压缩机组的能耗监测、提升压缩机组控制策略,需要对其功率进行准确、实时的测量.压缩机功率测量依靠扭矩仪实现,其造价高昂且大型扭矩仪尚未实现国产化.同时,为压缩机安装扭矩仪将增加压缩机的轴系长度,降低系统的可靠性.因此,目前大多采用软测量技术对压缩机功率进行计算.

软测量是指对于系统中难以测量的重要变量,选择一组既与该变量有密切联系又容易测量的二次变量,通过构造某种数学关系实现对该变量的估计[1].软测量方法的研究目前有两种方向,一种基于机理,一种基于数据.基于机理的软测量方法研究目标系统的结构及其运行过程,并通过机理公式搭建目标变量的计算模型以实现对变量的估计.早在2005年便有研究通过对滑片式压缩机的结构和受力过程进行分析,对其功率软测量模型进行改进[2].近年来的研究通过分析不同工况下压缩机的机理公式,已将其功率测量的相对误差降低至2.74%[3].上述测量方法的优势在于其普适性,对于任意系统,只要明确参数的计算机理,便可以对该参数进行测量.但其计算速度较慢,其预测难以具备实时性.同时,由于实际生产中的多种环境扰动,机理模型的准确率往往较低.

基于数据的软测量方法直接根据系统的输入输出搭建机器学习模型,并使用已有数据对模型进行训练拟合,从而使模型具备对未知输入的预测能力.文献[4]中提出一种使用等度量映射算法的软测量建模方法.文献[5]中使用改进的径向基(RBF)神经网络搭建软测量模型对污水中的化学需氧量进行计算,并将测量的相对误差降低至1.25%以内.相比于基于机理的方法,基于数据的软测量方法拥有更高的准确率和计算效率,其无需具备对象的先验知识,而根据对象的输入输出直接建模,在解决高度非线性和严重不确定性系统的测量上具有巨大潜力[6].但是,机器学习模型本身对数据集的依赖程度较大,模型的准确率极大程度上取决于数据集的泛化能力,而许多工业系统中由于生产需要、测量手段单一等问题,高泛化性的数据集往往难以获取.对数据集较大的依赖性限制了基于数据的软测量方法在较多场合的应用.

为弥补两种软测量方法的不足,文献[7]中提出一种融合机理模型和数据的软测量方法,其使用机理模型对目标参数进行计算,并使用神经网络作为补偿器对测量结果进行矫正,取得了优于机理模型的测量结果.然而,由于该方法中的主要计算模块仍为机理模型,其运行效率并未得到有效提高;同时,由于该方法的结果仍然依赖于神经网络的矫正,虽然能够在一定程度上降低软测量对数据集的依赖程度,但其准确率仍然低于传统基于数据的软测量方法.

基于以上研究现状,本文提出一种基于可解释神经网络的压缩机功率软测量方法,将机理关系预置于神经网络之中,不但能使软测量模型具备神经网络模型的快速性以及准确性,而且能降低模型对数据集的依赖程度.在对压缩机功率的测量中,搭建3种软测量模型,分别为反向传播(BP)神经网络模型和两种融入不同程度机理的可解释神经网络模型,并对比三者在不同泛化能力数据集上的表现,验证了可解释神经网络模型在压缩机功率测量上的有效性.

1 BP神经网络模型搭建

BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络,亦是应用最广泛的神经网络之一.逆向传播算法可参考文献[8],本文仅对网络前馈结构进行简述.

一个多层BP神经网络前馈结构包括输入层、输出层和若干隐藏层.每层的任意节点和下一层的所有节点相连,连接权重组成权值矩阵w.网络相邻两层之间的前向传递关系如下式所示:

x'j=fi=1nwijxi+bj

式中: xi为当前层中第i个节点的输出数值; x'j为下一层第j个节点的输出数值; wij为当前层中第i个节点到下一层第j个节点的连接权重; bj为下一层第j个节点的偏置值;f为激活函数,用于向神经网络模型中加入非线性因子.常用的激活函数已在文献[9]中列出并分析比较.

BP神经网络的输入、输出根据实际系统的输入、输出参数确定.实验中,测得5组与压缩机功率PC相关的二次变量分别为压缩机转速n, 压缩机进口温度Tin,压缩机出口温度Tout,压缩机进口压强pin,压缩机出口压强pout,作为神经网络的输入.

根据模型的输入、输出,搭建BP神经网络模型.将该模型作为模型A,其结构如图1所示.

图1

图1   模型A前馈结构

Fig.1   Feed-forward structure of Model A


2 融入机理的BP神经网络模型搭建方法

机理BP神经网络模型的搭建在模型A的基础上进行,并融入压缩机的部分机理公式.根据能量守恒可知,若压缩机损耗不计,压缩机功率等于压缩机中气体质量流量和单位质量气体焓增的乘积,则有:

PC=qmhout-hin

式中: qm为压缩机气体质量流量;hin为压缩机进口气体比焓;hout为压缩机出口气体比焓.

气体质量流量取决于压缩机转速和入口气体的热力学状态.因此,可以得到如下函数关系f1:

qm=f1n,pin,Tin

压缩机中单位质量的气体焓增取决于进出口气体的热力学状态,气体的热力学状态可由气体的温度、压强、比体积中任意二者决定.因此,可以得到如下函数关系:

hout-hin=f2pin,pout,Tin,Tout
Δh=hout-hin
PC=f1n,pin,Tinf2pin,pout,Tin,Tout

根据式(6)在神经网络模型中融入乘法运算,搭建可解释神经网络模型,作为模型B,其网络结构如图2所示.

图2

图2   模型B前馈结构

Fig.2   Feed-forward structure of Model B


上述可解释神经网络模型由两部分组成,一部分以转速、压缩机进口气体的温度、压力作为输入,计算压缩机中的气体流量;另一部分以压缩机进出口气体状态作为输入,计算压缩机中单位质量气体的焓变.将这两部分计算结果相乘并作为模型最终的输出.

由于压缩机在实际运行过程中,其损耗不可忽略,引入压缩机效率ηC,可表示为

ηCPC=qmΔh

压缩机的运行效率ηC可由压气机的压比πC和折合转速nC确定,详细推导过程参考文献[10],可表示为

πC=poutpin
nC=nTin

可以得到如下函数关系:

ηC=f3(πC,n,Tin)

压缩机功率计算公式可改写为

PC=f1(n,pin,Tin)f2(pin,pout,Tin,Tout)f3(πC,n,Tin)

依照上述机理,在模型B中增加效率计算模块,得到模型C,其结构如图3所示.

图3

图3   模型C前馈结构

Fig.3   Feed-forward structure of Model C


相比于模型B,模型C新增了一部分网络结构,用于计算压缩机的效率.该部分网络将pinpout整合为压比,与Tinn共同作为输入计算得到效率.由于反向传播过程中除法的求导过程较为繁琐,令该部分网络计算效率的倒数1/ηC,并将其结果和qm、Δh相乘,最终获得压缩机的输入功率.

综上所述,实验中搭建了3种软测量模型.其中,模型A为BP神经网络模型;模型B为融入少量机理的可解释神经网络模型;模型C为融入较多机理的可解释神经网络模型.

3 实验设计

实验数据来源于一台PCL803型号压缩机.采用美国KOP-FLEX高性能扭矩仪联轴器,连接于动力涡轮和压缩机中间,用于功率测量.实验中,令压缩机持续运行8.5 h,每隔1 s进行一次功率采样,并记录相应的压缩机转速、进出口温度及压力.实验共测得 30602 组时序数据.数据集中,PC随时间t的变化曲线如图4所示.

图4

图4   数据集中压缩机功率随时间的变化曲线

Fig.4   Compressor power versus time in dataset


首先,使用前2.1×104个时间节点的数据(以下简称为数据集(D)1)作为训练集训练模型A、B、C,并对后 9602 个时间节点的功率进行预测.数据集1作为训练集几乎包括了所有可能产生的功率数值,能够保证数据集的泛化能力.该组研究的目的在于验证机理BP神经网络模型的有效性,同时为可解释神经网络模型在泛化性较差数据集上的预测结果提供对照.

降低数据集的泛化能力,仅使用前1.8×104个时间节点的数据(以下简称为数据集2)作为训练集训练模型A、B、C,以验证可解释神经网络模型在泛化性较差数据集上的有效性.实验中,设定训练簇大小为300,最大迭代次数为400,采用Adam算法[11]对模型进行优化,以模型在验证集上的误差趋于稳定作为收敛依据.采用均方根误差(RMSE),平均绝对误差(MAE)作为模型准确率评价依据.其计算公式如下所示:

RMSE=1Nn=1N(yn-y^n)2
MAE=1Nn=1nyn-y^n

式中: N为样本容量; yn为真实值; y^n为模型计算值.实验所涉及的其他重要模型参数如表1所示.

表1   模型参数设置

Tab.1  Setting of model parameters

模型隐藏层1节点数隐藏层2节点数隐藏层3节点数训练簇大小优化算法初始学习率损失函数
A153015300Adam0.01MSE
B102010300Adam0.005MSE
C102010300Adam0.005MSE

新窗口打开| 下载CSV


4 结果分析

模型A、B、C在数据集1和2上的拟合及预测结果如图5~7所示;表2所示为压缩机输入功率预测值.由于数据集1的泛化性良好,A、B、C模型在数据集1上具有相似的、良好的表现,其均方根误差、平均绝对误差均在1%以下.其中,模型C在测试集上的均方根误差为0.94%,相比模型A降低了1.1%;平均绝对误差为0.49%,相比模型A降低了41.0%.3种模型的功率预测曲线和实际曲线基本重合,仅在某些功率突变的时间段内有小幅度的偏离.

图5

图5   模型A在D1和D2上的训练及其预测曲线

Fig.5   Training and prediction curves of Model A on D1 and D2


图6

图6   模型B在数据集1和 2上的训练及预测曲线

Fig.6   Training and prediction curves of Model B on D1 and D2


图7

图7   模型C在数据集1和 2上的训练及预测曲线

Fig.7   Training and prediction curves of Model C on D1 and D2


表2   压缩机输入功率预测准确率

Tab.2  Accuracy of input power prediction of compressor

训练样本模型A模型B模型C
RMSE/%MAE/%RMSE/%MAE/%RMSE/%MAE/%
数据集10.950.830.990.810.940.49
数据集26.355.272.141.941.280.73

新窗口打开| 下载CSV


而在泛化性较差的数据集2上,模型A、B、C的预测偏差均有一定程度的增加,但模型B和C具有远好于模型A的预测表现.其中,模型C在测试集上的均方根误差为1.28%,相比模型A降低了79.8%;平均绝对误差为0.73%,相比模型A降低了86.1%.而对于仅融入较少机理的模型B,其表现虽然不及模型C,但也展现出远好于模型A的预测能力.在实际预测曲线上也可以看到,模型A在预测1.9×104~2.7×104时间段以及2.9×104~3×104时间段内的功率变化时产生了较大的偏差,而模型C在各个时间段上的预测结果均良好.

综合以上实验结果,认为可解释神经网络模型在使用泛化性良好的数据集训练时,具有不弱于BP神经网络模型的准确率和稳定性;在使用泛化性较差的数据集进行训练时,可解释神经网络模型相比BP神经网络模型具有更强的预测能力.基于可解释神经网络的软测量模型,不但具有传统神经网络模型的准确性和高效性,同时还降低了模型训练过程对数据集的依赖程度,是一种有效的压缩机功率软测量方法.

5 结论

本文提出一种基于可解释神经网络的压缩机功率软测量方法并对其进行验证.搭建了BP神经网络模型和融入不同程度机理的可解释模型,并基于压缩机实际运行数据构建不同泛化性的数据集对模型进行训练和测试,以验证可解释模型在压缩机功率软测量上的可行性.通过对模型的准确率加以评估和比较,获得以下结论.

(1) BP神经网络模型和融入不同程度机理的可解释神经网络模型在压缩机功率测量上表现良好,在数据集泛化能力得到保证的情况下,模型在测试集上的误差均在1%以下.可解释神经网络相比BP神经网络,在准确率方面有微小幅度的提高.该方法能够对压缩机功率进行有效测量.

(2) 当数据集的泛化能力较差时,可解释神经网络在压缩机功率测量方面具有较大的优势,且其准确率和融入机理与实际的契合程度呈正相关.机理约束降低了训练过程对数据集的依赖程度,使得该软测量方法具有更强的适应性.

(3) 可解释神经网络模型降低了传统神经网络模型对数据集的依赖程度,在许多工业数据不易获取、数据集泛化能力难以评估的场合中,该方法可以使用泛化性较低的数据集训练出高准确率的模型,具有良好的应用价值.

参考文献

于静江, 周春晖.

过程控制中的软测量技术

[J]. 控制理论与应用, 1996, 13(2):137-144.

[本文引用: 1]

YU Jingjiang, ZHOU Chunhui.

Soft-sensing techniques in process control

[J]. Control Theory & Applications, 1996, 13(2):137-144.

[本文引用: 1]

孔祥志, 杨会林, 孙铜生.

滑片式压缩机功率计算模型的研究

[J]. 流体机械, 2005, 33(1):25-27.

[本文引用: 1]

KONG Xiangzhi, YANG Huilin, SUN Tongsheng.

Study on the calculating model of power of vane compressor

[J]. Fluid Machinery, 2005, 33(1):25-27.

[本文引用: 1]

王晓燕, 焦卫东, 朱利民.

变工况运行的制冷压缩机功率消耗的定量关系式研究

[J]. 压缩机技术, 2019(1):6-10.

[本文引用: 1]

WANG Xiaoyan, JIAO Weidong, ZHU Limin.

Study on quantitative relationship formula about refrigeration compressor power consumption based on variable condition running

[J]. Compressor Technology, 2019(1):6-10.

[本文引用: 1]

吉文鹏, 杨慧中.

基于自适应等距映射算法的软测量建模

[J]. 南京理工大学学报, 2019, 43(3):269-274.

[本文引用: 1]

JI Wenpeng, YANG Huizhong.

Soft sensor modeling based on adaptive Isomap algorithm

[J]. Journal of Nanjing University of Science and Technology, 2019, 43(3):269-274.

[本文引用: 1]

廉小亲, 王俐伟, 安飒, .

基于SOM-RBF神经网络的COD软测量方法

[J]. 化工学报, 2019, 70(9):3465-3472.

[本文引用: 1]

LIAN Xiaoqin, WANG Liwei, AN Sa, et al.

On soft sensor of chemical oxygen demand by SOM-RBF neural network

[J]. CIESC Journal, 2019, 70(9):3465-3472.

[本文引用: 1]

徐敏, 俞金寿.

软测量技术

[J]. 石油化工自动化, 1998(2):1-3.

[本文引用: 1]

XU Min, YU Jinshou.

Soft measurement technology

[J]. =Automation in Petro-Chemical Industry, 1998(2):1-3.

[本文引用: 1]

王美琪, 陈恩利, 刘鹏飞, .

融合机理与数据的篦冷机温度软测量模型

[J]. 仪器仪表学报, 2018, 39(6):182-188.

[本文引用: 1]

WANG Meiqi, CHEN Enli, LIU Pengfei, et al.

Soft-testing model for grate cooler temperature measurement with mechanism and data fusion

[J]. Chinese Journal of Scientific Instrument, 2018, 39(6):182-188.

[本文引用: 1]

RUMELHART D E, HINTON G E, WILLIAMS R J.

Learning representations by back-propagating errors

[J]. Nature, 1986, 323(6088):533-536.

DOI:10.1038/323533a0      URL     [本文引用: 1]

倪志伟.

BP网络中激活函数的深入研究

[J]. 安徽大学学报(自然科学版), 1997, 21(3):48-51.

[本文引用: 1]

NI Zhiwei.

Deep study on activation function in BP network

[J]. Journal of Anhui University (Natural Sciences) , 1997, 21(3):48-51.

[本文引用: 1]

张娜, 林汝谋, 蔡睿贤.

压气机特性通用数学表达式

[J]. 工程热物理学报, 1996, 17(1):21-24.

[本文引用: 1]

ZHANG Na, LIN Rumou, CAI Ruixian.

General formulas for axial compressor performance estimation

[J]. Journal of Engineering Thermophysics, 1996, 17(1):21-24.

[本文引用: 1]

KINGMA D P, BA J. Adam: A method for stochastic optimization[EB/OL]. (2017-01-30) [2019-11-21]. https:∥arxiv.org/abs/1412.6980 .

URL     [本文引用: 1]

张田, 潘尔顺.

基于时间序列分析的电容器退化模型

[J]. 上海交通大学学报, 2019, 53(11):1316-1325.

ZHANG Tian, PAN Ershun.

Degradation modeling of capacitors based on time series analysis

[J]. Journal of Shanghai Jiao Tong University, 2019, 53(11):1316-1325.

李军朋, 华长春, 关新平.

基于机理、数据和知识的大型高炉冶炼过程建模研究

[J]. 上海交通大学学报, 2018, 52(10):1142-1154.

LI Junpeng, HUA Changchun, GUAN Xinping.

Modeling research for blast furnace smelting process based on smelting mechanism, operation data and expert knowledge

[J]. Journal of Shanghai Jiao Tong University, 2018, 52(10):1142-1154.

胡晨星, 丁杰, 竺晓程, .

离心压气机蜗壳内非定常流场的动态模态分解

[J]. 上海交通大学学报, 2018, 52(9):1044-1049.

HU Chenxing, DING Jie, ZHU Xiaocheng, et al.

Dynamic mode decomposition of unsteady flow filed in a volute of centrifugal compressor

[J]. Journal of Shanghai Jiao Tong University, 2018, 52(9):1044-1049.

吴军, 黎国强, 吴超勇, .

数据驱动的滚动轴承性能衰退状态监测方法

[J]. 上海交通大学学报, 2018, 52(5):538-544.

WU Jun, LI Guoqiang, WU Chaoyong, et al.

Data-driven performance degradation condition monitoring for rolling bearings

[J]. Journal of Shanghai Jiao Tong University, 2018, 52(5):538-544.

陈进平, 张树生, 何卫平, .

基于驱动参数建模的可行更改路径搜索和优选方法

[J]. 上海交通大学学报, 2017, 51(10):1220-1227.

CHEN Jinping, ZHANG Shusheng, HE Weiping, et al.

Feasible change path search and optimization method based on driving parameter modeling

[J]. Journal of Shanghai Jiao Tong University, 2017, 51(10):1220-1227.

/