不完备数据下的聚酯熔体特性黏度预测方法
Polyester Melt Characteristic Viscosity Prediction Method Under Incomplete Data
通讯作者: 张 朋,讲师;E-mail:zhangp88@dhu.edu.cn.
责任编辑: 王一凡
收稿日期: 2023-01-10 修回日期: 2023-05-22 接受日期: 2023-06-1
基金资助: |
|
Received: 2023-01-10 Revised: 2023-05-22 Accepted: 2023-06-1
作者简介 About authors
毕金茂(1999-),硕士生,从事聚酯熔体质量预测与优化研究.
特性黏度是衡量聚酯熔体质量的关键指标,对其进行精准预测有利于提前发现聚酯熔体潜在的质量问题,及时调整工艺参数,减少企业损失.考虑到聚酯熔体生产过程的数据不完备性、数据时序性以及高维冗余性,提出了不完备数据下聚酯熔体的特性黏度预测方法.针对聚酯熔体极端生产环境造成的数据不完备问题,设计了以卷积神经网络判别器和注意力长短期记忆神经网络生成器为架构的缺失数据生成对抗网络(MDGAN),通过对抗生成机制实现了缺失数据的填充.针对聚酯熔体生产过程中高维冗余和时序双向因果特性,设计了基于极端梯度提升双向门控循环单元(XGBoost-BiGRU)的特性黏度预测模型,通过极端梯度提升算法进行特征筛选,获取预测模型输入变量,再利用双向门控循环单元捕捉数据的时序双向因果关系,实现特性黏度的精准预测.浙江某聚酯纤维生产企业的实际数据测试结果表明,MDGAN算法在不同缺失率数据集下的填充精度均优于KNN、RF、MICE、GAIN数据填充算法,XGBoost-BiGRU特性黏度预测方法较STL-GPR、CAGRU、BiGRU算法优势显著,结合MDGAN的特性黏度预测方法能有效解决数据不完备下的聚酯熔体特性黏度预测问题.
关键词:
Characteristic viscosity is a key indicator of the quality of polyester melts, whose accurate prediction can help to identify potential quality problems of polyester melts in advance, adjust the process parameters in time and reduce enterprise losses. Considering the data incompleteness, data time series and high dimensional redundancy of the polyester melt production process, a method is proposed to predict the characteristic viscosity of polyester melt under incomplete data. A missing data generative adversarial nets (MDGAN) with a convolutional neural network discriminator and an attention long short-term memory neural network generator is designed to address the data incompleteness problem caused by the extreme production environment of polyester melts, and the missing data is filled by the adversarial generation mechanism. The extreme gradient boosting-bidirectional gated recurrent unit (XGBoost-BiGRU) is designed to predict the viscosity of polyester melts based on high dimensional redundancy and temporal characteristics prediction. The actual data test results of a polyester fiber manufacturer in Zhejiang show that the filling accuracy of the MDGAN algorithm at different missing rate data sets is better than that of data filling algorithms such as KNN,RF,MICE,and GAIN. The XGBoost-BiGRU characteristic viscosity prediction method has significant advantages over STL-GPR, CAGRU, BiGRU. In combination of MDGAN characteristic viscosity prediction, the method proposed can effectively solve the problem of predicting the characteristic viscosity of polyester melts under incomplete data.
Keywords:
本文引用格式
毕金茂, 张朋, 张洁, 赵春财, 崔利.
BI Jinmao, ZHANG Peng, ZHANG Jie, ZHAO Chuncai, CUI Li.
聚酯纤维是我国纺织行业的主要原材料,其中聚酯熔体直接决定了聚酯纤维的强度和耐热性,聚酯熔体的质量通常用特性黏度来评价[1],特性黏度是反映聚酯熔体流动的难易程度,度量聚酯熔体流动阻力的标准单位.当前聚酯车间通过熔体输送泵的出口压力来监测特性黏度.聚酯熔体的合成是典型的连续性生产,它需要经过酯化、预缩聚、终缩聚等工序.上游工艺参数一旦发生波动,熔体输送泵需要经过一段时间才能检测到特性黏度,这种事后监测的方法不利于及时发现熔体质量波动,进而导致聚酯纤维在纺丝卷绕阶段出现飘丝、断丝等诸多严重质量问题[2].通过预测的手段可以提前发现聚酯熔体的特效黏度变化,指导生产技术人员及时调整工艺参数,进而保证特性黏度的稳定性.因此,研究聚酯熔体的特性黏度预测方法具有十分重要的意义.
目前关于聚酯熔体特性黏度预测的研究主要可以分为基于机理的方法和数据驱动的方法两种[3].基于机理的方法需要分析生产过程中复杂的物化反应,其中反应温度、压力、转速等是影响其质量的主要物理因素.文献[4]中通过反应动力学方程、物料平衡方程和气液平衡方程建立了机理模型,实现了特性黏度预测.但是该方法是基于理想状态下建模的,无法考虑到众多的影响因素,不适合实际复杂生产.数据驱动的方法只需要研究数据与数据之间的关系,随着传感器技术的发展,数据驱动的方法已经成为当前特性黏度预测问题的主流研究方向[5].文献[6]中提出一种基于时间卷积和注意力门控神经网络的特性黏度预测方法,强化了提取时序数据特征能力,挖掘了时序数据长期依赖关系.为了提取聚酯聚合过程的时序关系并兼顾数据非线性特点,Geng等[7]提出一种基于组合核函数的特性黏度预测模型,通过分形维数方法提取特征并且将基于局部加权回归的季节性趋势分解过程(Seasonal-Trend decomposition procedure based on Loess,STL)与核函数相结合来提取时序数据的周期性,最终对特性黏度实现有效预测.文献[8]中提出一种基于双流λ门控递归单元网络的特性黏度预测方法,通过设计λ双因子来改变门控递归单元中存在的线性约束并且丰富了时序特征信息,最终提高了网络模型的预测精度.
但是以上这些数据驱动方法并未考虑到聚合过程中存在的数据缺失情况和聚合过程数据存在的双向因果关系,即下游工艺和上游工艺会存在相互影响的关系.针对数据不完备问题,Pan等[9]针对数控加工过程中数据不完备问题,通过使用生成对抗网络(Generative Adversarial Network,GAN)来填充数据再进行能耗预测,最终在能耗预测的精度上取得了更好的效果.Liu等[10]使用感知卷积神经网络来解决数据缺失问题,再使用随机配置网络来预测短期电压稳定性,实验结果表明该方法在预测短期电压稳定性上误差更小.文献[11]中表明,通过对催化石脑油重整过程中的缺失数据进行填充,可以提高辛烷值预测模型的预测性能.以上文献证明了,通过填充缺失数据,再使用基于填充的数据进行预测,能够有效提高模型的预测精度.生成对抗网络作为一种可以生成图像、音频、文本等数据的深度学习模型,它相比于其他的填充方法,如插值、回归等方法,能够更好地保留数据集的统计分布和模式,并且生成的缺失数据可以与真实数据融合得更加自然和逼真[12].此外,GAN还可以通过生成大量的模拟数据来扩充数据集,从而增加数据的多样性和数量.这可以帮助模型更好地进行训练,提高模型的准确性和鲁棒性.因此,采用GAN填充缺失数据更有优势.
针对数据间存在的双向因果关系,肖竹等[13]提出一种基于双向循环神经网络 (Bi-directional Recurrent Neural Network, BiRNN)的车辆轨迹重构算法,利用多源数据融合实现双向加权轨迹重构,解决定位信号中断导致的车辆轨迹数据不准确和不完备问题.Wang等[14]通过双向长短期记忆网络(Bi-directional Long Short-Term Memory, BiLSTM)提取文本前后双向因果关系并融入多特征,实现了中文电力调度文本精准识别.文献[15]中提出一种基于BiLSTM的特性黏度预测方法,通过BiLSTM提取双向的时序因果关系,实现了特性黏度动态预测.以上文献表明了,双向结构的循环神经网络对于解决具有双向因果关系的问题具有优势.
因此,本文提出一种不完备数据下聚酯熔体的特性黏度预测方法.针对数据不完备问题,设计了以卷积神经网络判别器和注意力长短期记忆神经网络生成器为架构的缺失数据生成对抗网络(Missing Data Generative Adversarial Nets, MDGAN),通过对抗生成机制实现了缺失数据的填充.针对聚合过程工业数据的高维冗余和时序双向因果关系,设计了基于极端梯度提升算法和双向门控循环单元的特性黏度预测模型(eXtreme Gradient Boosting-Bidirectional Gated Recurrent Unit, XGBoost-BiGRU),通过极端梯度提升算法进行特征筛选,获取预测模型输入变量,通过双向网络结构捕捉数据的时序关系,实现特性黏度预测.
1 不完备数据下聚酯熔体的特性黏度预测框架
在聚酯熔体实际生产过程中,由于传感器故障、传感器数据采样频率不一致、人为失误等原因,这些缺失的传感器数据会丢失大量有效信息,阻碍模型挖掘数据之间的关联性,降低了模型预测的精度.直接删除空白处或者用平均数、中位数等传统的填补法忽略了聚合过程数据之间的时序关系[16],填补后的数据缺乏连续性和趋势性,使用此类方法填充后的数据进行预测,模型精度不高.因此亟需一种将聚合过程缺失数据高精度填补的方法,提高聚合过程传感器数据的质量和利用率,为后续特性黏度的预测打下夯实的基础.
聚合过程采集的数据可以分为2种类型.第1种是不随生产线上其他因素而改变的独立变量,如各类泵转速、浆料密度、施胶剂注入压力等.当这类数据缺失时,只需复制填充即可.第2种是在生产过程中会发生变化的耦合变量,如预缩聚反应温度、低聚物流量、预缩聚压差等;其次,当数据缺失率过高,数据分布规律难以挖掘,这种情况下无法对缺失数据进行填充.
针对聚合过程实际生产中的数据不完备问题,提出一种不完备数据下特性黏度预测框架,如图1所示,该框架主要包括聚合过程传感器数据获取、不完备数据填充、数据特征筛选和特性黏度预测4个部分.具体步骤如下.
图1
图1
不完备数据下聚酯熔体的特性黏度预测框架
Fig.1
A framework for predicting characteristic viscosity of polyester melts with incomplete data
(1) 聚合过程传感器数据获取:在聚合生产过程中,使用温度、压力、流量等传感器对聚合过程各类工艺参数进行监测,采集各类传感器数据并上传分布式控制系统(Distributed Control System, DCS),为后续聚酯熔体特性黏度预测提供数据.
(2) 不完备数据填充:针对不完备聚合过程数据,通过掩码向量对缺失数据空白位置进行标记,对缺失位置加入噪声,通过GAN的生成对抗机制填充缺失数据,得到完整的聚合过程数据.
(3) 数据特征筛选:通过极端梯度提升算法对完整的聚合过程数据进行特征筛选,选择与特性黏度相关性强的特征作为后续特性黏度预测模型的输入.
(4) 特性黏度预测:将筛选后的数据划分为训练集、测试集,利用训练集对特性黏度预测模型进行迭代训练,通过测试集评估模型的泛化能力,实现聚酯熔体特性黏度的预测.
2 基于GAN的不完备数据填补方法
针对聚酯熔体极端生产环境造成的数据不完备,设计了以生成对抗网络为框架的缺失数据填充方法.该方法采用卷积神经网络(Convolutional Neural Network, CNN)作为判别器,利用卷积层强大的特征提取能力实现数据真伪的精确识别;使用注意力长短期记忆(Long Short Term Memory-Attention, LSTM-Attention)神经网络作为生成器,其中LSTM学习时序数据的周期性,Attention机制解决序列过长导致的遗忘问题.最终,通过对抗生成机制实现了缺失数据的填充.
2.1 基于LSTM-Attention的数据生成器
聚合生产线上的传感器数据表示为X=[x1x2 … xn],每个传感器数据均可表示为xi=[xi,1xi,2 … xi, j nulli,k xi,l … xi,t],xi,j表示第i个传感器数据j时刻的数据点,nulli,k表示第i个传感器k时刻的数据是缺失数据.
填补聚合过程缺失数据过程如图2所示.首先将序列中第1个缺失值nulli,k前的所有数据序列
图2
图2
填补聚合过程缺失数据过程
Fig.2
Filling in missing data processes for aggregation processes
计算公式如下所示:
式中:xi,t和hi,t表示第i个传感器t时刻的输入数据和LSTM的隐藏状态输出;Ci,t-1和hi,t-1表示第i个传感器t-1时刻的单元状态和隐层状态输出;fi,t, gi,t, oi,t, Ci,t, Di,t分别表示第i个传感器t时刻LSTM的遗忘门、输入门、输出门、单元状态、单元状态更新值的输出;wf, wg, wo, wc和bf, bg, bo, bc分别代表对应的权重矩阵和偏置项;σ(·)为sigmoid函数.
将LSTM 的隐藏状态作为注意力层的输入,并设计查询向量q和打分函数J,利用打分函数J得到查询向量与输入向量之间对应的分数,通过softmax函数对分数进行归一化处理,转换为权重之和为1的概率分布.最后,根据加权求和得到注意力值a,以此来保证对重要信息的保留,避免重要信息随着生成器训练次数的增加而消失.具体计算公式如下:
式中:Wa, U, V为参数矩阵;ai表示查询向量在每个输入上的权重大小.
2.2 基于CNN的数据判别器
针对聚合过程中传感器数据高维冗余的特点,利用CNN强大的特征提取能力以及卷积核的权重共享特性,可以解决数据冗余的特点并且降低模型复杂度[19].此外,CNN在处理空间数据也具有优势,通过多个卷积核对数据的局部区域进行局部特征提取,可以提取相邻传感器数据的特征空间关联性.因此将CNN作为判别器可以解决聚合过程数据的高维冗余和空间关联性,对聚合过程数据进行降维,可以快速判断数据的真实性.
假设聚合过程有n种传感器,传感器时间长度为t,则聚合过程传感器数据为X∈Rt×n,对传感器数据集进行卷积操作,卷积核的权重状态与对应的聚合过程数据相乘,并加上偏置项,如图3所示.为了使得模型具有非线性拟合能力,使用激活函数ReLU,公式如下:
式中:f(·)是ReLU激活函数;W是卷积核的状态矩阵;X是卷积核对应的数据矩阵;b是偏置项.
图3
CNN提取图像特征,通常是将卷积核设置成3*3或5*5来提取图像上各个区域的局部信息.而一维卷积通常是提取固定长度的信息特征,一个卷积核对应一段完整的数据.考虑到聚合过程传感器数据时间跨度长并且各个传感器之间具有空间关联性,设置卷积核大小为3*10,每结束一次卷积操作,窗口滑动1个单位距离.使用该大小的卷积核,既可以保证提取各个传感器之间的空间关联性,又可以保证提取传感器数据的趋势性.
通过式(10)计算并将计算结果进行一维展开,把一维向量输入至全连接神经网络,进行二分类预测,以此来判断数据真实与否.
3 基于极端梯度提升算法和双向门控循环单元的特性黏度预测方法
针对聚酯纤维聚合过程中工艺参数的高维冗余和时序双向因果特性,提出一种基于极端梯度提升算法和双向门控循环单元的特性黏度预测模型.如图4所示,该模型中的极端梯度提升算法用于对聚酯聚合过程变量和特性黏度之间的相关性分析,对特征的相关程度从高到低进行排序筛选,并对其进行加权,降低后续预测模型计算复杂度.双向门控循环单元将加权得到的输入变量提取时序特征,最后通过反向传播神经网络(Back Propagation Neural Network,BPNN) 回归层完成对特性黏度的预测.
图4
图4
极端梯度提升算法和双向门控循环单元特性黏度预测模型
Fig.4
XGBoost-BiGRU characteristic viscosity prediction model
3.1 基于极端梯度提升算法的聚合过程特征筛选
方法 聚酯聚合过程采集的数据具有高维冗余的特点,通过极端梯度提升算法计算出每个特征和输出值之间的重要程度,筛除相关性低的特征,从而提高模型精度[20].在极端梯度提升算法中,如果一个特征被划分的次数越多,则表明该特征越重要,因此可以从变量中选出若干个强相关特征.
极端梯度提升算法的目标函数如下:
式中:yS和
T表示叶子节点数量;γ表示节点切分难度;τ表示叶子节点向量;λ表示L2正则化系数.
极端梯度提升算法通过遍历决策树的所有分裂叶子节点,选择分裂后目标函数增益最大的叶子节点进行分裂,经过第z次迭代计算,目标函数公式如下:
式中:fz(xS)是式(12)中对模型改进最大的一项;C是常数项.
最终优化的目标函数表示为
式中:Gp=
式(14)可以被视为评价输入变量与输出值相关性程度的函数.通过该公式对聚酯纤维聚合过程中每个特征在所有提升树中的结果进行加权求和然后取平均值,得到每个特征的重要性得分,以此筛选出相关性较大的输入变量作为特性黏度预测模型的输入.
3.2 双向门控循环单元预测模型
聚合过程中不仅上游工艺会影响下游工艺,下游工艺也会影响上游工艺顺序.例如,在酯化反应中需要不断加入乙二醇和催化剂,而酯化反应会生成水和过量的乙二醇,它们被送入分离塔进行精馏分离,回收其中的乙二醇并用于下一次的酯化反应.传统的循环神经网络,信息的传输是从前往后的,它只能提取来自前一时刻的时序关系,这种单向的传输结构不适用于提取聚合过程的时序数据关系.
图5
双向门控循环单元分别从左边和右边读取聚合过程数据,并依次将2个门控循环单元读取的数据输入到各自对应的方向,最终得到输出.则t时刻状态输出公式更改为
式中:
4 实例验证
4.1 数据来源及实验环境
实验数据来源于浙江新凤鸣集团聚酯纤维生产线,其中聚酯纤维聚合过程生产工艺采用杜邦三釜法进行生产.本文选取聚酯纤维聚合过程车间52种传感器从2018年5月1日至2018年9月1日采集的数据,如图6所示.特性黏度预测选取的52个工艺参数包括: 苯二甲酸(Terephthalicacid, TPA)浆料配置槽转速、浆料密度、乙二醇到浆料配制槽的流量、酯化圆水温、虹吸压力、1223-H03淡化水流量、预缩聚压差、预缩聚输出温度等工艺参数.实验计算机的系统为Windows10,处理器Intel Core i5-73030HQ,内存为8 GB,显卡为Intel Dual Band显卡,实验在Pycharm 2021.3.3软件中实现.
图6
4.2 缺失数据填补实验
实验从缺失数据中筛选出 2 000 条完整数据样本,每条数据时间间隔为1 min,时间跨度为 33.3 h,以确保该算法的长期稳定性.分别对数据进行 5%~30%随机缺失来保证填充算法的可靠性,并使用平均绝对误差(MAE)作为评价标准,来评价模型填补缺失数据的准确性.平均绝对误差的计算公式如下:
式中:m表示样本数量;xi表示原始数据;
表1 填充方法精度对比
Tab.1
缺失 率/% | KNN | RF | MICE | GAIN | MDGAN |
---|---|---|---|---|---|
5 | 0.179 | 0.182 | 0.175 | 0.136 | 0.082 |
10 | 0.236 | 0.221 | 0.223 | 0.169 | 0.113 |
15 | 0.315 | 0.307 | 0.279 | 0.204 | 0.168 |
20 | 0.390 | 0.368 | 0.328 | 0.263 | 0.201 |
25 | 0.488 | 0.447 | 0.364 | 0.313 | 0.257 |
30 | 0.561 | 0.522 | 0.425 | 0.380 | 0.316 |
通过表1可以看出,随着数据集缺失率的不断增加,5种方法的填充精度都开始下降.在以上所有方法中,数据集在时间跨度为33.3 h和缺失率为5%~30%的情况下,本文提出的方法填充精度都优于其他方法,KNN和RF这2种方法的填充精度总体上较差,MICE和GAIN优于前2种方法,但和本文提出的方法在填充精度上有所差距.
4.3 特性黏度预测实验
式中:p表示实际值;
图7
在输入数据不存在数据缺失情况下,STL-GPR误差为0.120,BiGRU的平均绝对误差为0.076,CAGRU的平均绝对误差为0.071,对比其他方法,本文提出的方法预测精度最高,其平均绝对误差为0.043,最大预测误差为 0.062 0,最小预测误差为 0.000 8,可以准确预测特性黏度η的数值.实例数据对比验证如表2所示.
表2 实例数据对比验证
Tab.2
编号 | 误差 | ||||
---|---|---|---|---|---|
η/ (dL·g-1) | STL-GPR | BiGRU | CAGRU | XGBoost- BiGRU | |
1 | 50.44 | 0.108 | 0.077 | 0.087 | 0.047 |
2 | 50.40 | 0.088 | 0.087 | 0.078 | 0.048 |
3 | 50.31 | 0.096 | 0.083 | 0.081 | 0.042 |
4 | 50.21 | 0.097 | 0.078 | 0.061 | 0.055 |
5 | 50.10 | 0.121 | 0.088 | 0.075 | 0.036 |
6 | 50.13 | 0.110 | 0.076 | 0.083 | 0.017 |
7 | 50.16 | 0.103 | 0.071 | 0.070 | 0.040 |
8 | 50.34 | 0.139 | 0.077 | 0.079 | 0.024 |
9 | 49.98 | 0.139 | 0.085 | 0.086 | 0.011 |
︙ | ︙ | ︙ | ︙ | ︙ | ︙ |
91 | 49.74 | 0.149 | 0.099 | 0.072 | 0.014 |
92 | 49.70 | 0.102 | 0.128 | 0.071 | 0.038 |
93 | 50.00 | 0.140 | 0.106 | 0.080 | 0.025 |
94 | 50.13 | 0.146 | 0.123 | 0.076 | 0.039 |
95 | 49.74 | 0.091 | 0.119 | 0.084 | 0.057 |
96 | 49.77 | 0.124 | 0.092 | 0.050 | 0.047 |
97 | 49.99 | 0.116 | 0.121 | 0.056 | 0.042 |
98 | 49.97 | 0.101 | 0.104 | 0.057 | 0.051 |
99 | 50.00 | 0.127 | 0.125 | 0.067 | 0.057 |
100 | 49.83 | 0.103 | 0.102 | 0.042 | 0.055 |
4.4 缺失数据下特性黏度预测实验
为进一步验证本文填充缺失数据方法的有效性,分别从生产数据中截取4组数据,其缺失率分别为4.8%、10.7%、15.6%、20.3%.通过MDGAN模型进行填充后,使用STL-GPR、BiGRU、CAGRU模型对特性黏度预测,其预测精度如图8所示.该实验表明,在缺失率为4.8%、10.7%、15.6%、20.3%的情况下,通过MDGAN算法填充缺失数据生成的完备数据,再使用STL-GPR、BiGRU、CAGRU预测特性黏度,所有预测方法的精度都随着缺失率的提高而下降,但可以实现有效预测,其中BiGRU和CAGRU预测能力相近.
图8
为验证本文提出的模型的有效性,将前一次实验的数据集通过MDGAN模型进行填充后,使用XGBoost-BiGRU模型对特性黏度预测.缺失率为4.8%时实验结果如图9所示,其平均绝对误差为0.045,预测值和大部分真实数据重合,只有在曲线突变处有差异,因此所提出方法在缺失率为4.8%时,可以实现准确预测.缺失率为10.7%时实验结果如图10所示,其平均绝对误差为0.088,预测值和大量真实数据重合,可以较好地拟合真实数据的波动趋势,但是无法与真实数据完全重合.因此所提出方法在缺失率为10.7%时,可以达到较好的预测精度.缺失率为15.6%时实验结果如图11所示,其平均绝对误差为0.150,预测值和部分真实数据重合,只能简单拟合波动趋势,数据波动幅度较小.因此所提出方法在缺失率为15.6%时,预测精度一般. 缺失率为20.3%时实验结果如图12所示,其平均绝对误差为0.226,预测值和少部分真实数据重合,只能拟合部分区间波动趋势,但是与真实数据数值差距不大.因此所提出方法在缺失率为20.3%时,可以实现有效预测.综上所述,本文所提出的算法在数据缺失率小于20%左右时,可以有效地解决特性黏度预测问题,相较于其他预测方法,更加符合实际生产情况.
图9
图9
缺失率4.8%的特性黏度预测精度
Fig.9
Intrinsic viscosity prediction accuracy at a missing rate of 4.8%
图10
图10
缺失率10.7%的特性黏度预测精度
Fig.10
Intrinsic viscosity prediction accuracy at a missing rate of 10.7%
图11
图11
缺失率15.6%的特性黏度预测精度
Fig.11
Intrinsic viscosity prediction accuracy at a missing rate of 15.6%
图12
图12
缺失率20.3%的特性黏度预测精度
Fig.12
Intrinsic viscosity prediction accuracy at a missing rate of 20.3%
5 结语
针对聚酯纤维聚合过程采集的工艺参数数据不完备特性、数据时序双向因果和高维冗余特性,提出了不完备数据下的聚酯纤维聚合过程特性黏度预测方法,设计了MDGAN聚合过程缺失数据插补模型,在此基础上提出了基于极端梯度提升算法和双向门控循环单元的聚合过程特性黏度预测方法.通过缺失数据填充实验、数据完备下特性黏度预测实验以及不同数据缺失率情况下特性黏度预测实验,验证了本文提出的方法在数据小范围缺失情况下,能实现特性黏度的有效预测.
参考文献
Modeling of aggregation process based on feature selection extreme learning machine of atomic Search algorithm
[C]// .
Copula-based JITL for polyester fiber polymerization process modeling
[C]// .
Deep transfer model with source domain segmentation for polyester esterification processes
[C]// .
Modeling of poly (ethylene terephthalate) reactors: 4. A continuous esterification process
[J]. ,DOI:10.1002/pen.v22:10 URL [本文引用: 1]
Parallel interaction spatiotemporal constrained variational autoencoder for soft sensor modeling
[J]. ,DOI:10.1109/TII.2021.3110197 URL [本文引用: 1]
Fractal-based combined kernel function model for the polyester polymerization process
[C]// .
Data-driven modeling based on two-stream λ gated recurrent unit network with soft sensor application
[J]. ,DOI:10.1109/TIE.41 URL [本文引用: 1]
Energy consumption prediction of a CNC machining process with incomplete data
[J]. ,
PV generation forecasting with missing input data: A super-resolution perception approach
[J]. ,DOI:10.1109/TSTE.2020.3029731 URL [本文引用: 1]
Real-time semi-supervised predictive modeling strategy for industrial continuous catalytic reforming process with incomplete data using slow feature analysis
[J]. ,DOI:10.1021/acs.iecr.9b03119 URL [本文引用: 1]
Partial discharge data augmentation based on improved Wasserstein generative adversarial network with gradient penalty
[J]. ,DOI:10.1109/TII.2022.3197839 URL [本文引用: 1]
基于双向RNN的私家车轨迹重构算法
[J]. ,DOI:10.11959/j.issn.1000-436X.2020227 [本文引用: 1]
在复杂的城市环境中,由于存在难以避免的GNSS定位信号中断现象以及车辆行驶过程中的误差累积,易造成所收集的车辆轨迹数据不准确和不完备,因此提出一种基于双向 RNN 的私家车轨迹重构算法,使用了GNSS-OBD轨迹采集设备收集车辆轨迹信息,利用多源数据融合实现双向加权轨迹重构。同时,在轨迹重构模型中引入神经算术逻辑单元(NALU),加强深度网络的外推能力并确保轨迹预测的精度,提高算法在应对城市复杂路段时轨迹重构的稳健性;选取了实际城市路段进行了测试实验,并和现有算法进行了对比分析。通过均方根误差(RMSE)以及Google Earth对重构轨迹进行可视化展示,实验结果验证了所提算法的有效性和可靠性。
Bidirectional RNN-based private car trajectory reconstruction algorithm
[J]. .DOI:10.11959/j.issn.1000-436X.2020227 [本文引用: 1]
To address the problem that in the complex urban environment, due to the inevitable interruption of GNSS positioning signal and the accumulation of errors during vehicle driving, the collected vehicle trajectory data was likely to be inaccurate and incomplete.a bidirectional weighted trajectory reconstruction algorithm was proposed based on RNN neural network.The GNSS-OBD trajectory acquisition device was used to collect vehicle trajectory information, and multi-source data fusion was adopted to achieve bidirectional weighted trajectory reconstruction.Furthermore, the neural arithmetic logic unit (NALU) was leveraged with the purpose of enhancing the extrapolation ability of deep network and ensuring the accuracy of trajectory reconstruction.For the evaluation, real-world experiments were conducted to evaluate the performance of the proposed method in comparison with existing methods.The root mean square error (RMSE) indicator shows the algorithm accuracy and the reconstructed trajectory is visually displayed through Google Earth.Experimental results validate the effectiveness and reliability of the proposed algorithm.
Chinese power dispatching text entity recognition based on a double-layer BiLSTM and multi-feature fusion
[J]. ,
Research on short-term wind power forecasting method based on incomplete data
[J]. ,
Natural language processing (almost) from scratch
[J]. ,
基于LSTM与注意力结构的肺结节多特征抽取方法
[J]. ,DOI:10.16183/j.cnki.jsjtu.2021.113 [本文引用: 1]
对肺结节的形状特征、边缘特征和内部特征进行准确分类,能够辅助影像科医生的日常诊断工作,提高影像报告的书写效率.针对这一问题,提出一种基于长短时记忆(LSTM)结构与注意力结构的多任务分类模型.该模型通过注意力机制融合各个任务间的共享特征,提高当前任务的特征抽取效果.LSTM结构分类器能够有效地筛选任务间的共享特征,提高模型的信息传递效率.实验表明,相较于传统多任务结构,所提模型在公开数据集LIDC-IDRI上能够取得更好的多特征分类效果,辅助医生快捷地获取肺结节特征信息.
Multi feature extraction method for pulmonary nodules based on LSTM and attention structure
[J]. ,
Speech-based Parkinson’s disease prediction using XGBoost-based features selection and the stacked ensemble of classifiers
[J]. ,DOI:10.1007/s40031-022-00851-2 [本文引用: 1]
基于改进SAE和双向LSTM的滚动轴承RUL预测方法
[J]. ,
RUL prediction method of a rolling bearing based on improved SAE and Bi-LSTM
[J]. ,
基于CS-GRU模型的短期负荷预测方法研究
[J]. ,
Study on short-term load forecasting method based on CS-GRU model
[J]. .
An analysis of four missing data treatment methods for supervised learning
[J]. ,DOI:10.1080/713827181 URL [本文引用: 1]
Random forest missing data algorithms
[J]. ,DOI:10.1002/sam.2017.10.issue-6 URL [本文引用: 1]
Model selection to improve multiple imputation for handling high rate missingness in a water quality dataset
[J]. ,DOI:10.1016/j.eswa.2019.04.049 URL [本文引用: 1]
Gain: Missing data imputation using generative adversarial nets
[C]// .
/
〈 | 〉 |