基于高斯过程时间序列法的公路路基沉降预测

时间:2022-08-15 11:32:46

基于高斯过程时间序列法的公路路基沉降预测

摘 要:针对目前路基沉降理论十分有限,常规理论计算的路基沉降预测结果与实测值出入较大的问题,本文提出一种基于高斯过程的路基非线性位移时间序列预测的新方法,采用机器学习方法,对路基沉降进行预测。工程实例应用结果表明,该方法科学可行。与指数曲线法及BP神经网络预测结果相比较,具有预测精度高、适用性强、参数自适应化且易于实现的优点。

关键词:道路工程 高斯过程 时间序列 路基沉降 预测

中图分类号:U41文献标识码: A

Forecasting Method of Gaussian Process Time Series of Highway Subgrade Subsidence

ZHANG Si-qiJIANG An-nan YU Li-xin

(Dalian maritime universityLiaoning Dalian 116026)

Abstract: Due to the fact that, nowadays the study on the subgrade subsidence theory is quite limited and the problem of a big difference lying in the predicted results which adopted conventional calculating method and the measured results, this paper proposes a new approach which is called nonlinear displacement time series prediction based on Gaussian process of subgrad, and will adopt machine learning method to forecast the subgrade subsidence. Application results of engineering examples shows that the method is pared with the predicted results of Exponential curve and BP Artificial neural networks,it has high prediction accuracy and applicability, parameters self-adaptive, simple to implement and capability in solving non-linear small samples problems.

Key words: road engineeringgaussian processtime seriessubgrade Subsidence prediction

0 引 言

路基沉降的预测与控制是公路建设中的一个关键问题,也是目前亟待解决的一大技术难题。由于理论计算方法本身的局限性和工程地质条件的复杂性,完全依靠理论方法很难准确预测路基沉降[1],而为了掌握路堤在施工期中的变形动态,又必须进行实时观察。一方面要保证路堤在施工中的安全和稳定,另一方面要能正确预测工后沉降,使其控制在设计的允许范围之内。因此, 通过对实测的沉降数据进行处理,以获得沉降规律, 从而预测路基的沉降量,具有重要的实际工程意义[2]。

在路基沉降预测方法中,双曲线拟合法、指数曲线法等传统方法已被广泛应用于实际工程中,但传统方法均存在预测精度低的缺点。近年来,国内外一些学者采用灰色理论、支持向量机、神经网络等方法研究路基沉降。灰色理论(GM)在路基沉降适用性上尚存在一定的局限性;支持向量机(SVM)方法的核函数及其超参数难以合理确定;神经网络(ANN)方法是一种基于大样本的机器学习方法, 而沉降样本数据在大多数情况下是非常有限的,而且神经网络方法存在着推广能力不强、容易过学习及局部优化等难以解决的问题[3]。高斯过程早期主要应用与通信系统与信号分析[4]中,现逐渐应用于工程上,在基坑位移[5]、边坡位移[6]预测以及隧道工程参数反演[7]中均有应用。本文首次将高斯过程机器学习技术引入路基沉降预测, 并提出一种基于高斯过程时间序列法的公路路基沉降预测方法。

1高斯过程及其回归原理[8-11]

1.1高斯过程((Gaussian Process,简称GP)

GP 是最近发展起来的一种新的机器学习技术. 高斯过程有着严格的理论统计学习理论基础, 对处理高维数、小样本、非线性等复杂的问题具有很好的适应性, 是目前国际上机器学习领域的研究热点。在统计学理论中,GP 是一个随机过程,其任意有限变量集合的分布都是高斯分布,即任意一组的随机变量{xi∈X, i=1, … , n}与其对应的过程状态{Y(x1), … , Y(xn)}的联合概率分布服从n维高斯分布。一个高斯过程完全由均值函数和协方差函数所确定。我们将均值函数记为m(x),将协方差函数记为k(x,x'),他们的定义如下:

(1)

(2)

由此高斯过程记为:

(3)

1.2 高斯过程回归算法(Gaussian Process Regression 简称GPR)

假设有n 个观察数据的训练集D= { ( xi, yi ) |i= 1, ⋯, n} , x i∈Rd 是d 维输入矢量, ti∈R 是相应的输出标量. 如果X 表示d×n 维输入矩阵, y 表示输出矢量, 有D= ( X,y)

假设观察目标值y 被噪声腐蚀, 它与真实输出值t 相差ε:

(4)

其中ε为独立的随机变量, 符合高斯分布, 均值为0, 方差,

根据贝叶斯学习理论, 观察目标值y 的先验分布为:

(5)

式中I表示单位矩阵, K= K(x,x) 为n×n 阶对称正定的协方差矩阵, 矩阵中的任一项Kij 度量了xi和xj的相关性。

n个训练样本输出y和1个测试样本输出y*所形成的联合高斯先验分布为:

(6)

式中, K( X, x* ) 是测试点x*与训练集的所有输入点X 的n×1 阶协方差矩阵, k(x*,x *) 是测试点x*自身的协方差。

根据贝叶斯原理, 高斯过程模型利用观察到的特定数据更新分布, 即给定新的输入x*、训练集的输入值X和观察目标值y的条件下,推断出y *的最大可能的预测分布. 获得n个训练样本输出y和测试样本输出y*的联合高斯后验分布。根据贝叶斯后验概率公式得:

(7)

其中, y * 的均值和方差为:

(8)

(9)

由于GP 方法中协方差函数在有限输入集上要求是正定的,且是一个满足Mercer 条件的对称函数,故协方差函数等价于核函数公式(8)可写成核函数的形式:

(10)

其中

预测值的均值是核函数k(x,x') 的线性组合, 可将非线性关系的数据映射到特征空间后转换为线性关系数据。

2 路基沉降时间序列预测的高斯过程模型

对于路基沉降, 通过监测获得的随时间变化的位移序列是一组典型的时间序列{ x1,x2, ⋯,xN}。高斯过程模型是根据当前的位移监测数据挖掘出其蕴含的变化规律,对路基未来的位移做出合理的预测。实际上,对序列i时刻的位移值进行预测,就是要寻找在第i时刻的位移值x i 与前i-1个时刻的位移值x1,x 2,⋯,xi- 1的关系,即xi=f(x1,x2,⋯,xi- 1),f()表示位移时间序列之间的非线性关系。此非线性关系很容易通过高斯过程来表达。参见公式(8)(10)

3 影响路基沉降高斯过程预测结果的因素

3.1协方差函数

一个高斯过程完全由均值函数和协方差函数所确定。相对来说,均值函数对预测结果影响较小且种类相对单一,而协方差函数种类较多且均对预测结果影响较大。在GP模型中协方差函数需要满足: 对任一点集都能够保证产生一个非负正定协方差矩阵。目前常用的协方差函数主要有:

①平方指数协方差函数(SE):

(11)

②理二次协方差函数(RQ):

(12)

③Matern协方差函数:(13)

④神经网络协方差函数(neural net):

(14)

值得注意的是两个或两个以上的协方差函数的加和仍是协方差函数。

协方差函数中超参数的选取对学习与预测结果的影响较大。其中l表示两个数据点的距离相关性,如果l很小,表示两个数据点高度相关,反之,表示低度相关; 为核函数的信号方差,用来控制局部相关性的程度;α为核函数的形状参数;表示噪声的方差;为克洛内克尔(Kronecker)符号。

在GPR 模型中,最优超参数可通过极大似然法自适应获得,即建立训练样本的对数边缘似然函数,对超参数求偏导,再采用共轭梯度优化方法搜索出超参数的最优解,对数似然函数的形式为:

.(15)

3.2单步外推与多步外推

外推预测样本的构建通常有两种不同方法,一种是单步外推即在构造预测样本的输入向量时返回上一步的输出向量所对应的实测值,另一种则是多步外推即返回上一步的预测值。

单步外推:第一步, 通过高斯过程学习机挖掘出前i-1时刻位移序列x1,x 2 ⋯,x i- 1之间隐含的非线性关系,根据高斯过程原理建立第i 时刻的位移值预测值xi*与前i-1个时刻位移序列x1,x 2,⋯,xi- 1的非线性关系,由此得到第i时刻的位移值预测值xi *; 第二步,获得第i时刻的位移实际监测值xi之后, 将此新数据纳入高斯过程学习机的学习样本, 重新进行训练学习, 调整位移时间序列的后验分布,进一步挖掘位移序列x1,x2,⋯,xi-1,xi之间隐含的非线性关系,根据高斯过程原理建立第i+1时刻的位移预测值xi+1 *与前i个时刻位移序列x1,x 2,⋯,xi- 1,x i的非线性关系, 由此得到第i+1时刻的位移预测值xi+1 *;依此类推,就可以得到未来任意时刻的位移预测值。

多步外推:类同于单步外推,但不是每一次数据滚动都返回上一步的输出向量所对应的实测值而是返回上一步的预测值。在外推n步之后再返回1到n步输出向量所对应的实测值。显然多步外推比单步外推的精度要低,且预测数据有滞后性,但其优势有:1、在一定预测精度下可预测未来更长的时间。2、受奇异点的影响较小,鲁棒性较好。

4 工程实例

京哈(G102 线)公路长春至德惠某路段为双向四车道一级公路,是长春市东北部的一条重要干线公路,地处松辽平原东北部的平原微丘区,起点至米沙子段位波状台地,地形起伏较小,相对高程差不超多 30m。米沙子至终点为二级阶地冲积层,地势逐渐变低,坡度平缓,地形开阔。采用JMDL-4720 单点位移计进行路基沉降观测,选取K1144+280处断面B监测点在沉降监测初期获取的一组原始数据序列[12],分别建立指数曲线法、BP人工神经网络模型、高斯过程时间序列法模型对路基沉降进行预测。

指数曲线法

指数曲线法根据太沙基的固结理论,认为反应土体中的孔隙水压力消散的程度与土体变形呈指数曲线关系因此土体的压缩过程及路基沉降曲线理论符合指数曲线关系,在不考虑次固结沉降的情况下,假设路基荷载稳定,有公式:

式中:为路基在t时刻的沉降量;为拟合沉降初始值;为现场土体确定的常数。

公式可用图解法与解析法求解。

BP人工神经网络

BP神经网络是一种多层的前向型神经网络,又称反向传播神经网络,具有多层的网络结构(见图1),是一种应用较为广泛的神经网络模型.通过样本数据的训练,不断修正网络权值和阈值,使误差函数沿负梯度方向下降,逼近期望输出。

图1:BP神经网络结构图

BP网络算法输入的是一个网络正确行为的样本集合:{p1,t1}, {p2,t2}…{pN,tN},其中pN为网络的输入,tN为对应的目标输出.每输入一个样本,便将网络输出与目标输出相比较.算法将调整网络参数以使均方误差最小化,即

式中:为第k次迭代的网络输出的总误差性能函数;为网络输出与目标输出的偏差;为目标输出;为网络输出。

通过样本训练网络,可以对未来数据进行预测。

高斯过程时间序列法

采用理二次协方差函数与神经网络协方差函数组合协方差函数(),采用单步外推进行数据滚动预测。

表1:监测数据

天数(d) 沉降量(mm) 天数(d) 沉降量(mm)

0 0 340 26.12

15 3.7 400 26.91

30 5.06 445 27.36

60 8.17 490 27.73

85 12.93 555 28.69

105 17.66 620 28.99

135 20.11 657 29.89

180 21.96 682 30.75

235 24.08 723 31.32

300 25.00 783 31.81

将前300天数据作为训练样本,预测后500天的沉降数据。

表2:三种不同模型的预测结果比较

天数(d) 实测值(mm) 指数曲线法 BP神经网络 高斯过程

预测值 误差(%) 预测值 误差(%) 预测值 误差(%)

300 25.00 27.04 8.16 25.46 1.86 25.97 3.85

340 26.12 27.93 6.93 25.84 1.08 25.55 2.17

400 26.91 28.89 7.36 27.03 0.46 26.32 2.20

445 27.36 29.45 7.64 27.56 0.74 27.26 0.39

490 27.73 29.95 8.01 29.53 6.48 27.83 0.34

555 28.69 30.52 6.38 30.40 5.96 28.32 1.26

620 28.99 30.96 6.80 31.19 7.60 29.05 0.22

657 29.89 31.36 4.92 31.33 4.82 29.26 2.10

682 30.75 31.57 2.67 31.38 2.06 29.74 3.30

723 31.32 31.98 2.11 31.48 0.52 30.47 2.72

783 31.81 32.21 1.26 31.65 0.51 31.39 1.31

MSE=1.14 MSE=0.48 MSE=0.37

图1:监测点实测线与各模型预测曲线

从表2及图1可以看出,三种模型均具有较高的预测精度,指数曲线法误差在 1.26%~8.16%之间且前期误差较大,后期误差逐渐减小,整体上的拟合值均大于实测值。BP神经网络预测模型的误差在0.46%~7.60%之间前期后期的误差较小,中间的误差较大,没有很好的反映实际沉降的趋势变化。高斯过程预测模型误差在0.22%~3.85%之间波动,各点的预测误差均很小,整体预测精度高于上述的其他模型能,且比较准确的反映实际沉降的趋势变化。从预测模型理论的合理性和实际预测效果来看,高斯过程预测模型具有明显的优势。

5 结论

(1)工程实例应用表明, 采用高斯过程学习机方法, 不必建立复杂的数学和力学模型。 通过对实测资料进行滚动学习就能给出准确可靠且精度较高的预测结果,说明本文所提出的高斯过程时间序列法的公路路基沉降预测方法是科学可行的,并具有一定的先进性。

(2)在工程实例中,运用指数曲线法,BP神经网络法,高斯过程时间序列法对G102公路长春至德惠路段K1144+280处断面B监测点的路基沉降进行预测。运用传统方法指数曲线法,由于计算过程中需要进行适当假设与真实的路基沉降存在误差,所以预测精度相对较低。BP神经网络模型,是一种大样本机器学习方法,在本例与实际工程中由于公路沉降数据较少所以预测精度也偏低。高斯过程模型,能够利用小样本进行数据滚动预测,在本例中预测结果能很好的反映实际路基沉降的趋势变化,预测精度较高。

(3)将该路基沉降预测方法与预警系统结合,设立合理预警值。当路基沉降预测出异常数值时预警系统可以及时报警,提早进行相关加固措施,避免工程事故的发生。

参考文献:

[1] 黎军丰. 公路软土路基沉降预测方法综述. 科技情报开发与经济. 2010 ,20(14):182-185

[2] 刘 鹏,陈泽松,赵 明,夏元友,冯仲仁 .高速公路软土路基沉降预测方法分析 .土工基础 .2005, 19(3): 53-55

[3] 李 军 张友鹏. 基于高斯过程的混沌时间序列单步与多步预测. 物 理 学 报 Acta Phys. Sin.2011,60(7):070513.1-070513.10

[4] 沈赞.基于高斯过程的时间序列分析[D].上海:上海交通大学,2009.

[5] 苏国韶, 燕柳斌, 张小飞, 江权 基坑位移时间序列预测的高斯过程方法. 广西大学学报( 自然科学版).2007, 32(2):223-226

[6] 夏自能 .边坡位移非线性时间序列的斯过程预测方法[D]. 广西. 广西大学. 2012

[7] 刘开云,方昱,刘保国 基于进化高斯过程回归算法隧道工程弹塑性模型参数反演. 岩土工程学报.2011,33(6):883-889

[8] Rasmussen C.E., Christopher K.I. Gaussian Processes for Machine Learning[M].Cambridge, Massachusetts: The MIT Press, 2005

[9] Williams C.K.I., Rasmussen C.E. Gaussian Processes for Regression[J]. Advances in Neural Information Processing Systems, 1996, 8: 514-520

[10] 申倩倩, 孙宗海. 基于自适应自然梯度法的在线高斯过程建模[J]. 计算机应用研究.2011, 28(1): 95-97

[11] Sofiane Brahim-Belhouari, Amine Bermak. Gaussian process for nonstationary times series prediction[J].Computational Statistics & Data Analysis,2004,47(4):705-712.

[12] 安宝平.102国道长春至德惠段路基沉降预测模型库研究[D].长春.吉林大学.2013

上一篇:浅论市政桥梁的拼宽加固设计 下一篇:浅谈土建工程施工质量管理的问题与措施