Processing math: 100%

上海交通大学学报, 2022, 56(5): 604-610 doi: 10.16183/j.cnki.jsjtu.2021.231

机械与动力工程

基于外推高斯过程回归方法的发动机排放预测

王子垚, 郭凤祥, 陈俐,

上海交通大学 动力装置与自动化研究所; 海洋工程国家重点实验室,上海 200240

Engine Emission Prediction Based on Extrapolated Gaussian Process Regression Method

WANG Ziyao, GUO Fengxiang, CHEN Li,

Institute of Marine Power Plant and Automation; State Key Laboratory of Ocean Engineering, Shanghai Jiao Tong University, Shanghai 200240, China

通讯作者: 陈俐,女,教授,博士生导师,电话(Tel):021-34206196;E-mail:li.h.chen@sjtu.edu.cn.

责任编辑: 石易文

收稿日期: 2021-06-29  

Received: 2021-06-29  

作者简介 About authors

王子垚(1996-),男,河南省郑州市人,硕士生,主要从事发动机排放预测、高斯过程回归等研究.

摘要

为了提高训练集范围之外行驶工况的预测精度,提出外推高斯过程回归(GPR)方法.首先,采用训练集数据对GPR模型进行预训练,然后在正负3个标准差之间均匀采样构建宽域输入集,以该输入集的预测方差均值最小为目标优化GPR模型超参数.某直喷汽油机转毂试验的结果表明,外推GPR的平均绝对误差为0.53411,比传统GPR降低24.27%,比反向传播神经网络降低36.32%.所提方法可为降低试验成本,提高实际行驶过程排放预测精度提供参考.

关键词: 发动机; 排放; 高斯过程回归; 预测; 外推

Abstract

Aimed at improving the prediction accuracy of engine emissions under driving conditions which are not covered by the training set, an extrapolated Gaussian process regression (GPR) method is proposed. First, the training set data is fed to the GPR model for pre-training, and then a wide-area input set is constructed by uniform sampling between plus/minus three standard deviations, and the hyperparameters are optimized for the goal of minimizing the prediction variance of the input set. The test results on a direct injection gasoline engine show that the mean absolute error of emission prediction using the extrapolated GPR is 0.53411, which is 24.27% lower than that of using the traditional GPR and 36.32% lower than that of using the back propagation (BP) neural network, which signifies the effectiveness of the proposed method in terms of reducing test costs and improving the accuracy of emission prediction during real driving.

Keywords: engine; emission; Gaussian process regression (GPR); prediction; extrapolation

PDF (1750KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王子垚, 郭凤祥, 陈俐. 基于外推高斯过程回归方法的发动机排放预测[J]. 上海交通大学学报, 2022, 56(5): 604-610 doi:10.16183/j.cnki.jsjtu.2021.231

WANG Ziyao, GUO Fengxiang, CHEN Li. Engine Emission Prediction Based on Extrapolated Gaussian Process Regression Method[J]. Journal of Shanghai Jiaotong University, 2022, 56(5): 604-610 doi:10.16183/j.cnki.jsjtu.2021.231

随着环保压力不断加大,汽车发动机排放日益受到关注.国六排放标准的强制施行对实际行驶过程的发动机排放提出严格要求,需要开展大量测试,但其周期长、成本高,难以满足汽车产品更新迭代的市场需求[1-2].另一方面,行驶工况复杂多变,实际排放数据难以获得[3].因此,需要研究能便捷且准确预测发动机排放的方法[4].

针对发动机排放的预测,国内外学者进行了大量的研究.基于静态映射的方法需要大量的标定实验,且难以准确映射瞬态工况下的排放.基于发动机燃烧机理的物理模型计算量大,预测精度往往受到难以获取的实际参数的限制.文献[5-6]基于Zeldovich理论预测发动机NOx排放,需要准确的气缸压力信号,而缸内压力传感器价格高昂,限制了实车应用.基于实测数据的经验模型可减少计算量并获得较好的预测精度,但是工况适应性差.文献[7]基于发动机实测数据提出经典的NOx预测方法,适用于高功率工况,但是在低功率工况下精度较低.

数据驱动的机器学习模型具有开发周期短和工况适应性强的优势,逐渐广泛应用于发动机排放预测.其中,神经网络模型应用最早,其瞬态工况的预测误差约为稳态工况的两倍[8].文献[9-10]采用支持向量机模型,得到的预测精度优于神经网络模型,但是数据集维度增大导致复杂度过高[11].长短记忆周期神经网络模型在发动机稳态或瞬态过程的NOx排放均取得较高的预测精度[12].文献[13]提出基于粒子群算法优化的高斯过程回归(GPR)用于预测发动机排放.然而,这些模型的预测精度高度依赖于训练数据集的覆盖性,当测试集数据范围在训练集数据范围之内,则预测精度较高;反之,则预测精度变差.该依赖性导致训练集数据量增大,增加成本与开发周期,并降低实际行驶过程的排放预测精度.

针对上述问题,本文提出一种新的外推GPR算法.按欧氏距离将数据集区分为覆盖域内、外两个区域,以采用覆盖域内的数据集经预训练得到的传统GPR模型为基础,构建覆盖正负3个标准差的宽域输入集,提出以该输入集的预测方差均值最小为目标进行外推训练的新思路,修正传统GPR模型的超参数.对于正态分布输入集,宽域输入集能覆盖99.73%的输入取值[14];对于非正态分布输入集,能覆盖超过88.9%的输入取值[15],也就是说,能覆盖大部分训练数据集覆盖域之外的区域.因此,经外推训练的GPR模型能降低覆盖域外的预测方差,提高预测精度.GPR基于贝叶斯概率框架,通过概率推理预测均值、方差,适用于高维数、非线性复杂系统[16].针对具有周期性特征的数据集,文献[17]结合周期函数与平方指数函数构建新的核函数,提高GPR外推预测精度.文献[18]设计光谱混合核函数,用于大气二氧化碳和航空旅客数据的外推预测.文献[19]证明缩小GPR预测置信区间的宽度可提高外推精度,用于寻找合理采样点,有效减少训练集规模.迄今为止,外推GPR算法尚待深入研究,在发动机排放预测的应用未见报道.

本文以搭载某缸内直喷汽油机的乘用车为对象,采集实际行驶污染物排放(RDE)工况的转毂试验数据,采用本文提出的外推GPR方法,预测训练集覆盖域之外工况的排放.预测结果与传统 GPR 模型和广泛应用的反向传播(BP)神经网络模型相对比.该方法为减少RDE试验成本、提高实际行驶过程排放预测精度提供参考.

1 数据获取及预处理

测试发动机为1.5T缸内直喷汽油机,装载于某乘用车,整车置于转毂试验台架,台架按照《轻型汽车污染物排放限值及测量方法(中国第六阶段)》[20]RDE测试流程运行,分为市区、市郊和高速共3个区间,试验台架在3种工况下依次连续运行,总试验时间为90 min.试验用油为国VI标准#92汽油,采用便携式排放测试系统(PEMS)获取排放数据.试验台架与仪器设备如表1所示.

表1   试验台架及仪器设备表

Tab.1  Test bench and facilities

设备名称型号功能
排放转毂AIP-ECDM 48寸两驱汽车的整车排放测试
PEMSMEXA-7200采集并测量NOx、CH4、总烃(THC)和CO2等排放量

新窗口打开| 下载CSV


测试并记录的参数有10个,其中6个为影响发动机排放的主要因素,即车速、进气温度、空燃比、点火提前角、发动机转速和油门踏板开度,作为GPR模型的输入;4个为CO2、NOx、CH4和THC排放量,作为GPR模型的输出.RDE工况的试验数据如图1所示,其中:φ(CO2)、φ(NOx)、φ(CH4)以及 φ(THC) 分别为该气体的体积分数.

图1

图1   RDE工况的试验数据

Fig.1   Test data of RDE working condition


1.1 数据预处理

数据预处理包括归一化、剔除奇异值和降维.

归一化即将每一组输入、输出参数的均值和标准差分别转换为0和1.剔除奇异值的原则为如果某个数据与其所在组数据的均值偏离超过±2.5倍标准差,则丢弃.然后采用Savitzky-Golay滤波器[21]进行平滑.

采用主成分分析方法将六维输入降低至二维[22],且保留至少80%的数据信息,当每个输入有 2000 个采样点时,总采样数为4×106个.比较降维之前,六维输入所需的总采样数为6.4×1019个.由此可见,通过降维,总采样数大幅缩小.降维后的输入数据如图2所示.

图2

图2   降维后的输入数据

Fig.2   Input data after dimensionality reduction


1.2 数据集分区

首先,计算降维后的二维输入数据距离原点的欧氏距离,然后将输入输出数据按照该欧氏距离进行升序排列.将前80%的数据作为训练数据,后20%的数据作为测试数据.

在以二维输入描述的坐标系中,训练数据集在分界圆圆内,而测试数据集在分界圆外,之间分界为欧氏距离(即半径)为 1.82095 的圆,如图3所示.因此,这里的测试数据集的输入数值范围超出了训练数据集的覆盖范围,本文将设计外推算法提高预测精度.

图3

图3   数据集输入量的数值范围

Fig.3   Input range of data set


2 外推GPR算法

首先为GPR模型选择核函数,然后分两步进行模型训练.第一步采用覆盖域内的训练集,基于传统GPR框架进行预训练,使得预测输出的95%置信区间能覆盖测试数据集,得到GPR模型超参数的预训练值.第二步以宽域输入集作为GPR模型的输入,以预测输出的方差均值最小为目标继续训练,得到超参数的修正值;核函数与超参数共同构成完整GPR模型的数学表达式,采用覆盖域外的测试集进行测试,流程如图4所示.

图4

图4   外推GPR算法的流程图

Fig.4   Flow chart of extrapolated GPR algorithm


2.1 核函数

采用平方指数(SE)核函数和谱混合成分(SM)核函数[18]的线性组合作为GPR模型核函数,可以表示为

kSE+SM(τ)=kSE(τ)+kSM(τ)
(1)
kSE(τ)= l2vexp (-τ22l2h)
(2)
kSM(τ)= q=1Qωqp=1dexp{-2π2τ2pσpq}cos(2πτpμpq)
(3)
q=1, 2, ···, Q; p=1, 2, ···, d

式中:τ=x-x'为两个样本的输入(x,x')之差;hv分别为横向和纵向的尺度系数;τpτ在第p个维度的取值;d为样本输入维数;Q为混合高斯分布的个数;ωqσpqμpq分别为第q个高斯分布的混合权重系数、第q个高斯分布在第p个维度上的方差和第q个高斯分布在第p个维度上的均值.

核函数式(1)的超参数可记为θ=[hvωqσpqμpq]T.

2.2 预训练

与传统GPR相同,采用极大似然估计对超参数θ进行预训练,即以最小化关于θ的负对数边际似然(NLML)函数为目标确定超参数的值.NLML的表达式L(θ)为[16]

L(θ)=-ln P(y|X)=
12yT(K(X, X)+ σ2εI)-1y+
12ln |K(X,X)+σ2εI|+ n2ln 2π
(4)

式中:Xy分别为样本数为n的训练集输入、输出;PyX下的后验概率;K(X, X)∈Rn×n为核函数矩阵,满足Kij(X, X)=k(xi, xj) (i, j=1, 2, ···, n),k(·)为核函数;I为单位矩阵;σ2ε为均值为0的高斯噪声方差.

使用梯度下降法求解式(4)的最小值,将超参数的预训练转化为最优化问题,即可得超参数预训练的解.式(4)的梯度为

L(θ)θ=- 12yTK-1(θ) K(θ)θK-1(θ)y+
12tr (K-1(θ)K(θ)θ)
(5)

式中:tr(·)为矩阵的迹.

2.3 外推训练

首先,在二维输入描述的坐标系中均匀采样产生宽域输入集XW,其中每个维度输入的取值范围在正负3个标准差之间,采样值个数为mW,故XW中样本点数为m2W.显见,XW可以覆盖如图3所示的覆盖域内、外数据集的输入.

为了提高训练集覆盖域外的预测精度,需要减小预测输出的置信区间宽度,即修正超参数θ,使得预测输出的方差最小,据此设计外推训练算法.为了避免陷入局部最优,外推训练以GPR预训练得到的超参数解为初始值.

预测输出的平均方差σ2avg是超参数θ的函数,表达式为

σ2avg= σ2avg(θ)=tr{K(XW, XW)-
K(XW, X)T[K(X, X)+ σ2εI]-1K(X, XW)}/ m2W
(6)

于是,求解使σ2avg最小的超参数转化为迭代求解如下最优化问题:

min σ2avg(θ)
(7)
s.t. θ∈S θ

式中:Sθθ的可行域.

3 实验结果与分析

采用平均绝对误差(MAE)和均方根误差(RMSE)评价预测性能.用同样的训练集进行模型训练,并用同样的处于训练集覆盖域外的测试集进行排放预测,将外推GPR的结果与传统GPR和BP神经网络的结果相比较,预测RDE过程发动机产生的CO2、NOx、CH4和THC.外推GPR与传统GPR均采用式(1)的核函数,其中Q=10,d=2.BP神经网络的层级结构为2-128-128-1,隐藏层激活函数均为LeakyReLU,输出层无激活函数,使用Adam优化器训练.

3个模型的4种排放预测结果如图5所示,其中:φ'(CO2)、φ'(NOx)、φ'(CH4)和φ'(THC)分别为该气体归一化后的体积分数.由图5(a)、(d)、(g)和(j)可知,外推GPR的预测值与实测值吻合程度较好,基本上能反映实测值的变化.由图5(b)、(e)和(h)可知,而传统GPR对CO2、NOx和CH4的预测有明显误差.由图5(f)、(i)和(l)可知,BP神经网络对NOx、CH4和THC的预测有明显误差.

图5

图5   外推GPR、传统GPR、BP神经网络的预测结果比较

Fig.5   Comparison of prediction results of extrapolated GPR, traditional GPR, and BP neural network


3种方法预测的MAE和RMSE评价如图6所示.由图6可知,与传统GPR和BP神经网络方法相比,外推GPR显著降低了预测误差.具体地,外推GPR预测CO2的MAE和RMSE分别为 0.4475 和 0.5825,比传统GPR降低35.68%和35.96%,比BP神经网络降低44.11%和40.01%.对于CH4和THC,外推GPR降低预测误差的程度与CO2相当.对NOx的预测,外推GPR的MAE和RMSE分别为 0.7049 和 0.8896,比传统GPR降低12.23%和16.47%,比BP神经网络降低12.98%和12.21%.NOx的预测误差较大,可能与NOx排放机理相对复杂有关.总体上,将4种排放的预测结果求平均,外推GPR的MAE和RMSE比传统GPR分别降低24.27%和30.72%,比BP神经网络分别降低36.32%和30.72%.

图6

图6   外推GPR、传统GPR、BP神经网络预测的评价指标对比

Fig.6   Comparison of evaluation indexes predicted by extrapolated GPR, traditional GPR, and BP neural network


虽然4种排放的产生机理各不相同,预测精度也有区别,但是由于外推GPR建立的宽域输入集能考虑覆盖域外的输入,对4种排放的预测精度都有一定提升.宽域数据集以常用的平均采样方法对标准化后的输入分布进行采样而构建,不需针对排放输出特性进行特殊处理.因此,本文提出的外推GPR方法具有推广至其他应用领域的潜力.

4 结语

针对实际行驶工况下发动机排放的预测,本文提出外推GPR算法,用于预测训练数据集覆盖域之外工况的排放.预测结果与传统 GPR 模型和广泛应用的BP神经网络模型相比较.CO2、NOx、CH4和THC的预测结果表明,外推GPR的平均MAE和RMSE分别为 0.53411 和 0.71558,比传统GPR分别降低24.27%和30.72%,比BP神经网络分别降低36.32%和30.72%.该方法可为降低实际行驶污染物排放工况的试验成本,提高实际行驶过程排放预测精度提供参考.

参考文献

张文. 基于运行工况的发动机基本标定研究[D]. 上海: 上海交通大学, 2019.

[本文引用: 1]

ZHANG Wen. Research on basic calibration of engine based on operating conditions[D]. Shanghai: Shanghai Jiao Tong University, 2019.

[本文引用: 1]

TURKSON R F, YAN F W, ALI M K A, et al.

Artificial neural network applications in the calibration of spark-ignition engines: An overview

[J]. Engineering Science and Technology, an International Journal, 2016, 19(3): 1346-1359.

DOI:10.1016/j.jestch.2016.03.003      URL     [本文引用: 1]

YU Q, YANG Y, XIONG X, et al.

Assessing the impact of multi-dimensional driving behaviors on link-level emissions based on a portable emission measurement system (PEMS)

[J]. Atmospheric Pollution Research, 2021, 12(1): 414-424.

DOI:10.1016/j.apr.2020.09.022      URL     [本文引用: 1]

陈婷, 倪红, 谷雪景, .

中国移动源下阶段排放法规综述和分析

[J]. 内燃机工程, 2018, 39(6): 24-30.

[本文引用: 1]

CHEN Ting, NI Hong, GU Xuejing, et al.

An update on China’s mobile source emission regulations

[J]. Chinese Internal Combustion Engine Engineering, 2018, 39(6): 24-30.

[本文引用: 1]

RAKOPOULOS C D, RAKOPOULOS D C, GIAKOUMIS E G, et al.

Validation and sensitivity analysis of a two zone Diesel engine model for combustion and emissions prediction

[J]. Energy Conversion and Management, 2004, 45(9/10): 1471-1495.

DOI:10.1016/j.enconman.2003.09.012      URL     [本文引用: 1]

FINESSO R, SPESSA E.

Real-time predictive modeling of combustion and NOx formation in diesel engines under transient conditions

[DB/OL]. (2012-04-16)[2021-06-05]. https://www.sae.org/publications/technical-papers/content/2012-01-0899/.

URL     [本文引用: 1]

LEFEBVRE A H.

Fuel effects on gas turbine combustion-liner temperature, pattern factor, and pollutant emissions

[J]. Journal of Aircraft, 1984, 21(11): 887-898.

DOI:10.2514/3.45059      URL     [本文引用: 1]

HANZEVACK E L, LONG T W, ATKINSON C M, et al.

Virtual sensors for spark ignition engines using neural networks

[C]// Proceedings of the 1997 American Control Conference. Albuquerque, NM, USA: IEEE, 1997: 669-673.

[本文引用: 1]

SHI C, JI C W, WANG H Y, et al.

Comparative evaluation of intelligent regression algorithms for performance and emissions prediction of a hydrogen-enriched Wankel engine

[J]. Fuel, 2021, 290: 120005.

DOI:10.1016/j.fuel.2020.120005      URL     [本文引用: 1]

NIU X X, YANG C L, WANG H C, et al.

Investigation of ANN and SVM based on limited samples for performance and emissions prediction of a CRDI-assisted marine diesel engine

[J]. Applied Thermal Engineering, 2017, 111: 1353-1364.

DOI:10.1016/j.applthermaleng.2016.10.042      URL     [本文引用: 1]

NALEPA J, KAWULOK M.

Selecting training sets for support vector machines: A review

[J]. Artificial Intelligence Review, 2019, 52(2): 857-900.

DOI:10.1007/s10462-017-9611-1      URL     [本文引用: 1]

戴金池, 庞海龙, 俞妍, .

基于LSTM神经网络的柴油机NOx排放预测

[J]. 内燃机学报, 2020, 38(5): 457-463.

[本文引用: 1]

DAI Jinchi, PANG Hailong, YU Yan, et al.

Prediction of diesel engine NOx emissions based on long-short term memory neural network

[J]. Transactions of CSICE, 2020, 38(5): 457-463.

[本文引用: 1]

秦静, 郑德, 裴毅强, .

基于PSO-GPR的发动机性能与排放预测方法

[J/OL]. 吉林大学学报(工学版). ( 2021-04-01)[2021-06-05]. https://doi.org/10.13229/j.cnki.jdxbgxb20210111.

URL     [本文引用: 1]

QIN Jing, ZHENG De, PEI Yiqiang, et al.

Prediction method of engine performance and emission based on PSO-GPR

[J/OL]. Journal of Jilin University (Engineering and Technology Edition). (2021-04-01)[2021-06-05]. https://doi.org/10.13229/j.cnki.jdxbgxb20210111.

URL     [本文引用: 1]

PUKELSHEIM F.

The three sigma rule

[J]. The American Statistician, 1994, 48(2): 88-91.

[本文引用: 1]

盛骤, 谢式千, 潘承毅. 概率论与数理统计[M]. 第5版. 北京: 高等教育出版社, 2019.

[本文引用: 1]

SHENG Zhou, XIE Shiqian, PAN Chengyi. Probability theory and mathematical statistics[M]. 5th ed. Beijing: Higher Education Press, 2019.

[本文引用: 1]

RASMUSSEN C E, WILLIAMS C.

Gaussian processes for machine learning

[M]. Cambridge, MA, USA: The MIT Press, 2005.

[本文引用: 2]

KLENSKE E D, ZEILINGER M N, SCHÖLKOPF B, et al.

Gaussian process-based predictive control for periodic error correction

[J]. IEEE Transactions on Control Systems Technology, 2016, 24(1): 110-121.

DOI:10.1109/TCST.2015.2420629      URL     [本文引用: 1]

WILSON A G, ADAMS R P.

Gaussian process kernels for pattern discovery and extrapolation

[C]// International conference on machine learning. Atlanta, USA: PMLR, 2013: 1067-1075.

[本文引用: 2]

MOHAMAD M A, SAPSIS T P.

Sequential sampling strategy for extreme event statistics in nonlinear dynamical systems

[J]. PNAS, 2018, 115(44): 11138-11143.

DOI:10.1073/pnas.1813263115      URL     [本文引用: 1]

中华人民共和国环境保护部, 中华人民共和国国家质量监督检验检疫总局. 轻型汽车污染物排放限值及测量方法(中国第六阶段): GB 18352.6—2016 北京: 中国环境科学出版社. 2020.

[本文引用: 1]

Ministry of Environmental Protection of the People’s Republic of China, General Administration of Quality Supervision, Inspection and Quarantine of the People’s Republic of China. Limits and measurement methods for emissions from light-duty vehicles(CHINA 6): GB 18352.6—2016[S]. Beijing: China Environment Science Press, 2020.

[本文引用: 1]

STEINIER J, TERMONIA Y, DELTOUR J.

Smoothing and differentiation of data by simplified least square procedure

[J]. Analytical Chemistry, 1972, 44(11): 1906-1909.

DOI:10.1021/ac60319a045      URL     [本文引用: 1]

SHLENS J.

A tutorial on principal component analysis

[EB/OL]. (2014-04-07) [2021-06-05]. https://arxiv.org/abs/1404.1100.

URL     [本文引用: 1]

/