浅谈Bayes方法在土工实验数据分析中的应用

时间:2022-10-03 06:27:57

浅谈Bayes方法在土工实验数据分析中的应用

摘 要:基于土工实验数据离散性大的特点,本文根据土工实验数据的检查和异常点判别的原则,提出在相关距离 内用样本加权平均估计土的平均特性的方法,以及最小样本数的确定方法,并以实例探讨Bayes方法在土工数据分析中的应用.

关键词:土工试验数据;3 法则;Bayes方法

土工试验结果的可靠程度会直接影响岩土工程设计的精度与施工方案的选取,可靠的实验结果,可使岩土工程设计和施工方案经济合理;歪曲事实的实验结果,可能导致不良的后果,要么使设计过于保守,要么遗留安全隐患.

影响土工试验数据可靠性的因素包括土样本身的因素和实验因素两个方面.

土样因素取决于土体本身的复杂性,即使同一区域的同种性质的土体,可能由于其含水量的不同或者粘粒含量的个体差异,导致其物理力学性质不同;另外,同一种土的原状土和重塑土的物理力学性质指标也存在差异性;原状土在采样、运输和储存、制备样品的过程中,受到的扰动程度同样会对土体的物理力学性质产生影响,所有这些因素都会影响土工试验数据的可靠程度.由此引起的实验数据的误差,是由于土体本身的变异性引起的误差.

实验因素引起的误差包括以下几种:

1)系统误差:由于测量工具(或测量仪器)本身固有误差、测量原理或测量方法的缺陷、实验操作及实验人员本身心理生理条件的制约而带来的测量误差.

2)随机误差:偶然的、无法预测的不易控制的不确定因素干扰而产生测量误差,这种误差称为随机误差.

3)过失误差:明显歪曲实际事实的误差.

根据抽样理论,要使一组样本得到的试验结果有意义,必须满足两个主要条件:①从土样中取出的试验样本必须具有代表性且符合调查目的的需要.②试验样本数量必须充分.依照以上两个条件,土工试验数据的整理应包括三个方面的内容:一是总体实验数据的检查以及异常数据的分析和舍弃处理;二是最小样本数问题;三是与土体性质指标的自相关性有关的问题.

一 总体实验数据的检查,以及异常数据的分析和舍弃处理

土工试验数据一般是对于某一土体的物理性质或力学性质的测定结果,如果土体本身的变异性不甚明显,那么试验结果应该在真值附近一定范围内上下波动.在实验数据整理过程中,首先应根据经验和统计原则消除系统误差或过失误差,以免影响计算结果的准确度.一般可以依据下面的原则对试验数据进行检查、修正和剔除异常点.

1.1 根据土的物理力学特性可判出的明显不合理点

在一组实验数据中,如果存在明显不符合土的物理力学性质的值的范围的点,通过观察,可以找出这一类异常点,并予以舍弃.如果一组实验数据大部分在某个值域范围内波动,但有一点或几点与该值域相差悬殊,我们可以认为这些点是异常点,这类点可以剔除.

1.2 根据某一置信水平找出确定范围以外的异常点

1.2.1 实验数据较多情况下的数据取舍原则――3法则

根据概率论原理的3法则,在试验数据中,出现在[m - 3 ,m+3]之外的数据点的概率只有0.27 %,

我们可以把大于m+3 和小于m -3 的试验数据作为异常点处理.应注意用3 法则进行试验数据取舍时,前提条件是试验数据较多且总体呈正态分布.一般认为当样本容量大于等于3 时,抽样分布与正态分布近似,此时用3 法则进行取舍应该是可行的.在实际的大型岩土工程中,试验数据有可能达到30个.

实际应用时,不能机械地把位于[m -3 ,m+3]之外的点全部予以剔除,还应分析导致其异常的原因.如果一个土样的多个参数值均位于[m -3 ,m+3]之外,则这些异常数据是由土样因素引起的,应重新取土补做实验或进行相应的调整.如果某个土样的某一个参数位于[m -3 ,m+3]之外,说明此误差是由试验误差引起的,应予以剔除.如某工程的同一土层的内聚力c/kPa的试验数据为:2.58,3.26,4.12,6.12,5.28,4.19,7.61,4.38,

5.64,3.68,2.94,4.56,4.26,5.34,3.99,5.49,4.31,6.34,2.59,3.67,8.99,3.54,4.53,5.36,4.68,6.18,

5.48,4.39,4.61,1.99,3.58.其数值分布如图1所示.

从其分布可以看出,这些数据符合正态分布,计算得到:平均值为4.63,标准差1.44,置信水平99.73%的分布范围是[0.31,8.95],数值8.99可以剔除.

1.2.2 一次实验中实验数据较少,又无其他资料可以引用情况下的数据取舍原则在小型的岩土工程实际中,当试验数据数目n

此范围外的点可视作异常点.有一组土的内摩擦角实验数据为:9.4,9.0,8.0,6.0,4.8,6.2,8.7,9.5,4.3.用置信水平99.73 %进行数据取舍。

因为n=9

二 土工试验数据中最小试验样本数问题

在试验数据整理过程中,还有一个问题需要考虑,即最小试验样本数问题.试验样本数过少,会极大影响试验结果.试验样本数多少取决于种种因素,包括工程规模、现场勘探条件以及工程要求精度.以下仅从统计特征方面讨论这个问题:

某一工程中,从一硬粘土层中取得4个原状土样,对各土样作不排水三轴试验得出下列Cu值:101,97,95,109(KPa ).为使土样不排水剪切强度以95 的概率落在实验结果平均值100.5的范围内,求必须的土

样最小数目.

由于只有4个土样,n<30,用t分布计算.V=3,查表得相应于F(t)=0.95时的t=2.35;且Cu 的实验平均值为100.5(KPa ), =6.19,因而,相应的数值范围为100.5±2.35×6.19÷ =93.23~107.77(kPa),离开平均值范围为2.35×6.19÷÷100.5―7%,不在5%范围内,还需增加样本.以6个样本试算,u=5,F(t)=0.95,查表得t=2.02,于是离开平均值的范围为:

偏离值为5.10/100.5=5.1% >5% ,不满足要求.以7个样本试算, v=6,F(t)=0.95,查表得t=1.94,于是离开平均值的范围为:

偏离值为4.54/100.5=4.5 %< 5 %,满足要求。

所以,还需增加3个土样,即至少需要7个土样才可以达到所需精度要求.土工试验中,一次实验的试验样本数如果满足不了统计要求的最小样本数,增加土样又意味着增加额外的投资,而此时我们可以收集以往的实验资料,利用Bayes方法解决一次实验样本数不足的问题.

由《概率论》的Bayes方法,对离散型随机变量有

(1)

称为参数的验后概率; 称为验前概率; 为给定参数 条件下的 的条件概率,称为似然函数.) (2)

若已测得一组实验测值为 ,怎样由去推定 首先要求得其验后概率 ,验前概率 、似然函数 .一般 可通过以往的经验得到, 可通过测值 得到,于是由公式(2),就可以得到验后概率 ,从而求得其期望值,此期望值即为需求参数 的Bayes估计值。

土工试验数据可以认为是离散型试验数据.下面以长沙地区的粉砂抗剪强度参数 为例说明Bayes估计方法的应用。

一般情况下土的抗剪强度参数符合正态分布,故以下讨论以正态分布为基础.长沙电厂工程分三期进行,其资料见表1.下面用Bayes方法计算,第一步把一期工程资料作为二期工程的验前资料,以二期工程资料求得似然函数,从而可得验后概率;第二步,以此验后概率作为三期工程的验前资料,然后求得结合了全部一、二、三期工程的验后概率,这样求得的强度参数同时考虑了三期工程,将更为合理可靠.

由Bayes公式,有 ,就正态分布而言,Bayes公式可进一步具体化为

其中, 为一期工程资料, 。

其中,是根据二期工程资料求得的,

故验后概率为两个正态分布的乘积,它本身也是一个正态分布,其抗剪强度均值 和标准差 可由下式求得:

故验后概率 。由此可见,验后方差比验前方差和似然方差都要小.现以上述求得的验后概率作为验前概率,以三期工程作为新的测值进行Bayes法第二次应用的计算.

已知。由三期工程资料,

故得新的验后概率

即的验后分布。.所以此粉砂的强度参数的贝叶斯估计值为 31.52.将全部资料加以平均得到强度参数的平均值为=31.73.当然, 值应比值更合理可靠.通过以上分析可以看出:

Bayes法可以把不同时间测得的观测数据有机地结合起来,而不是简单的加权平均,从而得到一个更为可靠的数据结果.这个优点使它在一些大型工程的设计指标的研究中广泛使用,如在研究土的力学性质指标时,直接进行力学性质试验,特别是三轴试验往往是浪费时间、耗费资金、需要技术和设备,而进行土的物理性质指标的测定则要简便经济得多.假如在进行一定力学性质试验的同时,利用土的物理性质指标(如土的密度、含水量等)来丰富力学性质指标的验前概率,那么所得的力学指标将会更加精确.Bayes法在应用上的另一个优点是它可以更精确的处理不同观测结果的合并问题,如上例所述.再如测定土的抗剪强度时可能采用直剪试验、三轴试验或原位试验等方法,各种方法的实测值具有不同的概率函数,Bayes法就可将这些不同概率规律的信息有机结合起来,得出更可靠的参数验后分布,依此确定的土的

抗剪强度参数将更为合理.

3 土体性质指标的自相关性的问题

在以往考虑实验数据的相关关系时,常常是求它们之间的线性相关系数,对于土工试验指标其自相关函数通常不是线性相关,而是指数相关,因此,就不能用以往的求相关系数的方法来判别其相关性。

土工问题中,可用相关距离 来判别其独立与否.在相关距离 内,土性指标基本上是相关的;相反,在该范围之外,土性指标基本上是不相关的.而相关距离 事先是未知的,它也要根据样本测值来求,一般用递推平均法求相关距离,同时取样间距Z 对 的计算会产生影响,这种影响反应于当取样距离Z 不同时,得到的 也不一样.Z / 越大,说明各抽样点的土性越接近相互独立,抽样误差就越小。

因此,取样距离应尽可能大于 .但从另一角度考虑,如果样本间距太大,便不能精确估计自相关函数和相关距离.因此,当Z= 时将求出的 作为土的相关距离比较合适.有了相关距离后,就可以根据取样点的位置,以 为尺度,将指标的样本测值分成几组,在相关距离 内的样本点,用样本的加权平均估计该区域内的平均土性,在一个 范围内,可得到一个.对于n个样本值,可得到 m 个 .通过以上处理得到的这 m 个,就可视为彼此独立的样本了。

3.1 通过迭代求解土的相关距离

可以利用计算机程序,通过搜索 = Z 时的,只要以较小的基本间距取样本,程序在运算过程中,以基

本间距的若干倍作为Z 计算 ,直到 小于某个规定值 。

3.2 用样本的加权平均来估计该区域内的平均土性

在土体的相关距离内,测值点是相关的,这时可用样本的加权平均值来估计该范围的平均土性,具体做法为

(5)

这里 是有关样本 的权值, 是 内的样本点数.关于一组权 ,可依下式取极小值.

(6)

其限制条件为0≤≤1和Σ =1, 是 和 点处土性指标之间的相关系数,采用Lagrangian乘法,可以得到下列矩阵方程:

(7)

这里,相关函数 的形式可以假设,因为相关函数的确切形式对大多数实际应用意义不大,据此,一组权 就可以算出,从而该范围的平均土性可用估计值式(6)来计算.在实际工程中,虽然走值不一样大,但用起来还是较方便的.经过上述处理后的 m个 ,就是彼此独立的样本了。

具体情况下,可根据工程具体精度要求,进行简化或省略,如在6范围内的几个数据,通过实验判断或简单计算就可以确定其代表值时,就不需加权平均.在实际应用中,最多的情况可能是根据经验结合计算进行处理.

4 结束语

1)影响土工试验数据可靠性的因素包括土样本身和实验因素两个方面,在进行土工试验指标整理时,根据土的物理力学特性可判定出一部分明显的不合理点,还可以根据3d法剔除不合理的测定值,从而使土工试验数据更接近实际.

2)考虑土工试验数据的相关性可以通过迭代求解土性指标的相关距离,用样本的加权平均来估计该区域内的平均土性指标值.

3)为满足最小样本数的问题,可以利用Bayes方法确定土的性质指标,以弥补土工实验数据的数目不足问题.

注:文章内的图表及公式请以PDF格式查看

上一篇:浅谈城市公园建设 下一篇:浅谈城市公园绿地设计原则与目前存在的问题