基于长短时记忆的真空预压地基沉降预测
Ground Settlement Prediction by Vacuum Preloading Based on LSTM
通讯作者: 肖朝昀,教授;E-mail:zyxiao@hqu.edu.cn.
责任编辑: 王一凡
收稿日期: 2023-07-24 修回日期: 2023-10-27 接受日期: 2023-11-17
| 基金资助: |
|
Received: 2023-07-24 Revised: 2023-10-27 Accepted: 2023-11-17
作者简介 About authors
梁煜婉(1998—),硕士生,从事地下工程与地基基础研究.
为探寻一种更加准确的真空预压地基处理沉降预测方法,以厦门新机场规划片区东园地块造地二期工程为例,构建基于长短时记忆(LSTM)神经网络的真空预压地基处理沉降预测模型.选取两个区域的实测沉降数据作为数据基础,对比传统沉降预测法(浅岗法、三点法和双曲线法)与LSTM神经网络预测结果.研究结果表明:当真空预压地基处理工况下出现真空膜破损引发沉降量回弹的现象时,相较于传统预测方法,LSTM的均方根误差eRMSE和平均绝对值误差eMAE均下降45%以上,且该方法的预测结果有明显的上升趋势,能够准确预测出沉降回弹情况.在预测误差方面,考虑真空度和沉降变化的LSTM模型比仅考虑沉降时序的LSTM模型的eRMSE和eMAE降低60%及以上.该研究可为真空预压地基沉降预测提供先进的数据驱动预测方法.
关键词:
In order to explore a more accurate method for predicting settlement in vacuum preloading foundation treatment, a vacuum preloading settlement prediction model based on long short-term memory (LSTM) neural network was developed, taking the second-phase land reclamation project in the East Park of Xiamen New Airport planning area as an example. Measured settlement data from two regions were selected as the dataset, and the results were compared with traditional settlement prediction methods including the Asaoka method, three-point method, and hyperbolic method. The results show that the prediction model based on the LSTM neural network considering only sedimentation time series outerperforms the traditional methods that rely only on sedimentation time series. When the vacuum film is damaged and settlement rebound occurs under vacuum precompression foundation treatment, the root mean squared error (eRMSE) and the mean absolute error (eMAE) of LSTM model decrease by more than 45% compared to the traditional methods. Additionly, this model accurately captures the settlement rebound trend, providing more reliable prediction. In terms of prediction error, the eRMSE and eMAE values of the LSTM model which considers vacuum degree and sedimentation are lower than those of the LSTM model which only considers sedimentation time series by over 60%. This paper offers an advanced data-driven prediction method for prediction in vacuum preloading foundation settlement.
Keywords:
本文引用格式
梁煜婉, 肖朝昀, 李明广, 孟江山, 周建烽, 黄山景, 朱浩杰.
LIANG Yuwan, XIAO Zhaoyun, LI Mingguang, MENG Jiangshan, ZHOU Jianfeng, HUANG Shanjing, ZHU Haojie.
真空预压法自从国外引进后,在加固地基的理论研究和工艺技术方面都取得了重大的进展,准确预测真空预压过程中的沉降发展及沉降量是判断工程施工质量的关键.传统上曲线拟合法主要包括双曲线法[1]、三点法[2]、浅岗法(Asaoka法)[3]等.曲线拟合方法受样本数据好坏影响大,必要时需要人为剔除样本数据后进行拟合,受人为影响大,并且不同模型对参数的要求不尽相同,以至于在工程应用上,不同曲线拟合方法均具有其各自的局限性及缺点.比如,采用三点法预测软土地基沉降时,预测结果的精确性高度敏感于数据的人为筛选[4];采用双曲线法预测沉降量时,预测质量高度依赖于固结度,即当固结度小于60%时,双曲线法预测能力弱[1];采用Asaoka法预测软土地基沉降时,时序起点选取和时间间隔划定对预测结果具有显著影响[5].
随着物联网及云监测技术的发展,智慧感知在工程中的深入普及成为可能,引入机器学习为代表的数据驱动方法来实现多数据融合沉降预测,获得更高质量的预测结果成为趋势.其中,由Hochreiter等[6]首次提出的长短时记忆(LSTM)神经网络模型在预测时序问题方面备受关注.LSTM神经网络因对时序数据处理具有长期记忆优势,在时序预测这一问题上,已广泛应用于非土木领域和土木领域中多种时序问题.前者包括且不限于海洋、能源、医学、机械、环境、铁路等领域后者如实时地震灾害评估预测[7]、水土流失预测[8]、基坑开挖预测[9]、隧道掘进机施工参数预测[10]等.Hu等[11]提出了一种基于LSTM神经网络模型的混凝土堆石坝沉降预测方法,该方法能同时对多个具有强关联的监测数据序列进行建模,在预测长度的扩展下,模型能够提供稳定准确的结果;王启贵等[12]采用LSTM神经网络建立沉降预测模型,证明了LSTM模型能够成功应用于沉降预测.
相较于传统曲线拟合法只能基于已有的沉降量对未来的沉降量进行预测,LSTM神经网络模型可通过不断迭代训练的方式来减少误差,且可考虑多因素如膜下真空度变化等.鉴于此,本文构建LSTM神经网络模型,对厦门新机场规划片区翔安南部莲河片区(东园地块)造地二期工程真空预压沉降进行预测.在仅考虑沉降时序影响,以及同时考虑沉降时序和膜下真空度影响两种情况下,运用LSTM神经网络模型与传统曲线拟合法对真空预压沉降进行预测和量化评估,以期对厦门新机场造地工程的建设提供理论基础.
1 LSTM神经网络
在使用机器学习处理时序问题时,循环神经网络(recurrent neural network,RNN)模型是最常用的模型之一.而LSTM神经网络模型是在RNN模型的基础之上引入专门的记忆存储单元,有效解决了RNN网络存在的梯度消失及无长期依赖问题,并引入了控制门机制用于控制特征的流通和损失以实现长短时记忆.传统LSTM的单元结构如图1所示,主要由遗忘门ft 、输入门it 、输出门Ot 和记忆细胞Ct 等组成.图中:X(t-1) 、Xt 分别代表t-1时序、t时序的输入变量;h(t-1) 、ht 分别代表t-1时序、t时序的输出;σ代表激活函数,是一种将变量映射到[0,1]的sigmoid函数.
图1
遗忘门ft 控制细胞状态中部分信息被丢弃或保留;记忆细胞Ct 通过遗忘门来控制信息的遗忘和记忆;输入门it 决定当前输入信息中哪些重要的新信息被存放在细胞状态中;输出门Ot基于细胞状态确定需要输出的信息以及传递下去的隐藏状态.
LSTM记忆单元的主要计算过程如下:
式中: bf 、bi 、bC 、bo 分别为遗忘门、输入门、记忆门、输出门对应的参数;Wf 、Wi 、WC 、Wo 为权重矩阵;m、n为系数.
LSTM预测模型框架如图2所示,可分为数据处理、输入层、隐藏层、输出层4个部分,其中
图2
2 模型构建
LSTM神经网络预测模型训练步骤如下.
(1) 将原始数据进行向量化处理,将沉降监测数据拼接后转为向量表达形式:
式中:
(2) 对原始时序数据集进行采取归一化处理,使各点落在[0,1]区间内:
式中:
(3) 隐藏层的理论输出O和实际输出Y分别如下:
式中:LSTM为图2所示的计算过程.
(4) 记忆单元内的运算采用sigmoid函数和tanh函数,而模型各隐藏层之间选择tanh函数作为激活函数.
(5) 训练及预测评价.以平均绝对值误差eMAE(表示预测值和真实值之间绝对误差的平均值,其数值越小准确度越高)和均方根误差eRMSE(衡量的是预测值与真实值之间的偏差,当预测值与真实值误差越小,该值越小)作为评价指标对训练及预测结果进行评价,其公式分别如下:
式中:
3 工程概况
厦门新机场规划片区翔安南部莲河片区(东园地块)造地二期工程在一期造地工程基础上,对一期围堰范围内吹填标高以下吹填淤泥(2a)和原状淤泥(3a),采用插塑料排水板真空预压法进行地基处理,其处理面积约1.67 km2.在施工期间,对全场范围内膜下真空度、围堰深层水平位移、沉降量等测项建立自动化云监测系统,在云平台采用机器学习实现同时考虑沉降时序和膜下真空度影响的沉降预测.以B6-1-17和B4-1-6两个区域为例,其中B6-1-17区未出现真空膜破损,且沉降量处于持续下降状态,沉降趋势呈稳定状态,下文简称该状态为沉降趋势稳定,B4-1-6区出现真空膜破损引发沉降量回弹现象,沉降趋势呈不稳定状态,下文简称该状态为沉降趋势不稳定.试验区地表以下地质条件如图3所示.
图3
4 仅考虑沉降时序影响的预测
4.1 预测过程
图4
图4
试验区沉降实测值及预测结果对比
Fig.4
Comparison of measured settlement values and predicted results in test area
4.2 预测结果
为了定量分析各个方法的预测结果,通过3种传统预测方法(双曲线法、三点法和浅岗法)和LSTM模型沉降预测与实测沉降进行对比.图5展示了B6-1-17区和B4-1-6区沉降量预测值与实测值对比情况.
图5
图5
不同区域沉降量预测值与实测值对比
Fig.5
Comparison of predicted and measured values of sedimentation in different regions
表1为B6-1-17区域不同预测方法的性能评价,根据表中的eRMSE和eMAE比较结果可以看出:LSTM模型的eRMSE=0.7 mm,eMAE=0.6 mm,比双曲线法的下降93%以上(双曲线的eRMSE=18.1 mm,eMAE=14.7 mm),该结果表明LSTM模型的预测精度要远高于双曲线法.同时,LSTM模型的精度与三点法持平,略优于浅岗法,这是由于浅岗法和三点法均能很好地拟合出沉降量变化的原有趋势,且B6-1-17试验区的时序-沉降量曲线较为平滑,沉降趋势呈稳定状态,未发生突发状况,即未出现真空膜破损引发沉降量回弹的现象,在该情况下,LSTM并未体现出明显的优势.
表1 B6-1-17区LSTM沉降预测性能评价指标
Tab.1
| 阶段 | LSTM | 三点法 | 双曲线法 | 浅岗法 | |||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| eRMSE/mm | eMAE/mm | eRMSE/mm | eMAE/mm | eRMSE/mm | eMAE/mm | eRMSE/mm | eMAE/mm | ||||
| 拟合阶段 | 3.5 | 3.0 | 3.3 | 2.2 | 10.7 | 9.0 | 1.3 | 0.4 | |||
| 预测阶段 | 0.7 | 0.6 | 1.0 | 0.9 | 18.1 | 14.7 | 1.5 | 1.3 | |||
注:为4种预测方法的评价指标保持一致,“拟合阶段”和“预测阶段”分别对应B6-1-17区时序为35~149 d和150~178 d时的评价指标.
但在实际预测过程中,传统方法预测精度高度敏感于人为选取数据的影响,在预测过程中出现同一种预测方法由于数据选取的不同而得到不同精度的现象,该现象极度影响了传统方法在使用时的效率.传统预测方法在使用中,需进行多次调试才能得到一个较为准确的预测结果,但LSTM模型依靠强大的算力,人为选取参数对预测精度的影响微乎其微.
表2为B4-1-6区域不同模型算法的性能评价,根据表中的eRMSE和eMAE比较结果可以看出:在预测阶段,LSTM模型的eRMSE和eMAE分别为2.7 mm和2.3 mm,比三点法、双曲线的eRMSE和eMAE降低79%以上,比浅岗法的eRMSE和eMAE降低45%以上,表现了LSTM模型在预测过程具有很好的准确性,且该方法在不同时序下的预测结果都能保持良好的性能.在该试验区进行地基处理过程中,出现真空膜破损的情况,造成真空度突然下降,此时沉降量出现回弹,时序-沉降量曲线处于不平滑的状态.在该状态下,传统预测方法的预测结果均呈现一种稳定的持续下降趋势,不能预测出沉降量回弹,而LSTM模型的预测结果可以明显看出,在时序为125~130 d 处,沉降量曲线有明显的上升,说明LSTM能够比传统预测方法更好地预测沉降量的变化.
表2 B4-1-6区LSTM沉降预测性能评价指标
Tab.2
| 阶段 | LSTM | 三点法 | 双曲线法 | 浅岗法 | |||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| eRMSE/mm | eMAE/mm | eRMSE/mm | eMAE/mm | eRMSE/mm | eMAE/mm | eRMSE/mm | eMAE/mm | ||||
| 拟合阶段 | 3.9 | 3.4 | 2.4 | 1.5 | 2.5 | 2.1 | 3.5 | 2.9 | |||
| 预测阶段 | 2.7 | 2.3 | 12.4 | 10.7 | 13.6 | 11.5 | 5.0 | 4.3 | |||
注:为4种预测方法的评价指标保持一致,“拟合阶段”“预测阶段”分别对应B4-1-6区时序为30~115 d、116~143 d时的评价指标.
综上所述,提出的LSTM模型在不同时序状态下都具有良好的性能,对比评价指标,在沉降趋势稳定的情况下,LSTM模型预测的精度明显高于双曲线法,略高于浅岗法,和三点法持平.特别是在沉降趋势不稳定情况下,LSTM模型能够实现沉降回弹的预测,这是传统预测方法不能实现的,此时该方法的预测精度比传统预测方法更高,显示了其沉降量预测的高效性、准确性.
5 同时考虑沉降和真空度时序影响的预测
图6
图6
B4-1-6区域真空度和沉降量实测值
Fig.6
Measured values of vacuum degree and settlement in B4-1-6 zone
图7
图7
基于LSTM网络构造不同模型的沉降训练及预测结果对比
Fig.7
Comparison of settlement training and prediction results of different LSTM-network-based models
表3 不同LSTM模型预测沉降性能评价指标
Tab.3
| 区域 | 只考虑沉降时序 | 考虑真空度和沉降时序 | |||
|---|---|---|---|---|---|
| eRMSE/ mm | eMAE/ mm | eRMSE/ mm | eMAE/ mm | ||
| B6-1-17 | 0.7 | 0.6 | 0.4 | 0.4 | |
| B4-1-6 | 2.7 | 2.3 | 0.6 | 0.9 | |
| B4-1-6(沉降回弹阶段) | 3.4 | 3.1 | 1.1 | 0.8 | |
注:B6-1-17和B4-1-6分别对应B6-1-17区和B4-1-6区在预测阶段的评价指标,B4-1-6(沉降回弹阶段)对应B4-1-6出现沉降回弹阶段(即时序为120~133 d区间)的评价指标.
综合以上训练和预测结果可知,LSTM模型对变化趋势稳定的时序沉降数据进行训练预测时,精度较高,但在膜下真空度变化明显的情况下,LSTM模型需同时考虑真空度才能具有更强的适应性.综合考虑外部条件,不仅考虑时序沉降量的变化,同时也能考虑膜下真空度的波动对预测沉降量的影响,以达到更高的预测精度.同时,这也反映了在真空预压工程中预测沉降,仅从沉降数据进行单一考虑因素,不考虑外部条件对其影响,就不能达到高精度预测结果,不利于施工质量的保证及风险控制.综上所述,同时考虑真空度和沉降时序的LSTM模型相较于只考虑沉降时序的LSTM模型以及传统曲线拟合方法在沉降预测上更具实时性和前瞻性,能及时应对突发工况做出高质量预测.
6 结论
传统沉降预测方法的性能敏感于数据的选取,且在预测过程中,沉降曲线仅根据已有沉降量变化趋势进行预测,不能预测沉降回弹现象.为能更加准确地预测沉降量变化情况,本文在传统沉降预测方法的基础上,提出考虑沉降量的LSTM神经网络模型和同时考虑沉降时序和真空度的LSTM神经网络模型.通过东园地块二期工程现场地监测的工程实例验证,得出以下结论.
(1) 对于沉降趋势稳定(即测点未出现真空膜破损、且沉降量处于持续下降的状态)和沉降趋势不稳定(即测点出现真空膜破损引发沉降量回弹的现象)的沉降时序数据,LSTM神经网络的预测结果均处于一种高精度状态.特别是在沉降趋势不稳定的情况下,LSTM神经网络比传统预测方法的eRMSE和eMAE均下降45%以上,精度远高于传统预测方法.
(2) 考虑沉降时序的LSTM神经网络在对沉降进行预测时,预测曲线呈现短暂的上升现象,该现象未能在传统预测结果中展示,说明LSTM神经网络模型比传统预测方法能更加准确地预测出真空膜破损引发沉降量回弹的现象.
(3) 无论沉降趋势是否稳定,在预测沉降量精度和预测沉降回弹两个方面,同时考虑沉降时序和真空度的LSTM神经网络模型比仅考虑沉降时序的LSTM神经网络模型具有明显的优越性.特别是在沉降趋势不稳定的情况下,整个预测阶段的评价指标,前者比后者的下降60%以上,即同时考虑沉降时序和真空度的LSTM神经网络模型的精度更高.
(4) 本文预测的地表沉降是基于已有沉降和膜下真空度的影响下进行预测,对于不同地基处理的沉降预测,理论上也可采用多种影响因素同时对LSTM神经网络模型进行训练以得到更加准确的预测结果,如何将该模型推广到其他类型地基处理监测项目是值得深入研究的问题.
参考文献
Rectangular hyperbola method of consolidation analysis
[J].
砂井地基沉陷分析
[J].
Analysis of sand well foundation subsidence
[J].
Observational procedure of settlement prediction
[J].
用曲线拟合的方法预测软土地基沉降
[J].
Observational settlement prediction by curves fitting methods
[J].
Asaoka法预测软土地基沉降时存在的问题和对策
[J].
Problems and their solutions in predicting soft ground settlement based on Asaoka’s method
[J].
Long short-term memory
[J].
DOI:10.1162/neco.1997.9.8.1735
PMID:9377276
[本文引用: 1]
Learning to store information over extended time intervals by recurrent backpropagation takes a very long time, mostly because of insufficient, decaying error backflow. We briefly review Hochreiter's (1991) analysis of this problem, then address it by introducing a novel, efficient, gradient-based method called long short-term memory (LSTM). Truncating the gradient where this does not do harm, LSTM can learn to bridge minimal time lags in excess of 1000 discrete-time steps by enforcing constant error flow through constant error carousels within special units. Multiplicative gate units learn to open and close access to the constant error flow. LSTM is local in space and time; its computational complexity per time step and weight is O(1). Our experiments with artificial data involve local, distributed, real-valued, and noisy pattern representations. In comparisons with real-time recurrent learning, back propagation through time, recurrent cascade correlation, Elman nets, and neural sequence chunking, LSTM leads to many more successful runs, and learns much faster. LSTM also solves complex, artificial long-time-lag tasks that have never been solved by previous recurrent network algorithms.
Real-time regional seismic damage assessment framework based on long short-term memory neural network
[J].
A new application of deep neural network (LSTM) and RUSLE models in soil erosion prediction
[J].
地铁车站深基坑开挖变形智能多步预测方法
[J].
DOI:10.16183/j.cnki.jsjtu.2022.419
[本文引用: 1]
为更好预测深基坑开挖期间地下连续墙的侧向位移变形,基于长短期记忆神经网络(LSTM)智能算法理论构建了LSTM多步预测模型.首先对多步预测模型的多输出策略进行论述,其次详细介绍了LSTM多步预测模型的构建方法,并对模型输入集空间维度和时间维度两项超参数进行探究,以提高模型的预测准确度.最后依托某富水砂土深基坑工程实例,分析了模型预测值与实际监测值的差异.3个典型监测点的数据分析结果表明LSTM多步预测模型具有较强的泛化能力,相关算法对深基坑开挖变形预测方法的改进优化具有参考价值.
Intelligent multi-step prediction method for deep foundation pit deformation of subway station
[J].
TBM penetration rate prediction based on the long short-term memory neural network
[J].
Prediction for the settlement of concrete face rockfill dams using optimized LSTM model via correlated monitoring data
[J].
基于机器学习LSTM方法的大面积高填土沉降预测
[J].
Large area high fill settlement prediction based on machine learning LSTM method
[J].
/
| 〈 |
|
〉 |
