岩土工程评价与设计方法讲座-岩土工程评价方法(上).ppt
岩土工程评价与设计方法讲座第一部分岩土工程评价方法,引 言,2010年6月,岩土工程勘察与设计岩土工程疑难问题答疑笔记整理之二脱稿交付人民交通出版社出版。这本书与土力学与岩土工程师岩土工程疑难问题答疑笔记整理之一是姐妹篇,共同记叙了六年来,我国岩土工程界网友在中国工程勘察信息网上,切磋、讨论技术问题的主要历程和内容,共约100余万字篇幅。,概括起来,这两本书里,网友提出了四个类型的问题:现行体制与岩土工程体制、岩土工程师需要的土力学素养、岩土工程勘察、岩土工程设计。其中,岩土工程勘察包括钻探、原位测试、土工试验等勘探的实务工作和资料分析、综合评价工作两个部分。,在前几年,一些兄弟单位、地方协会和培训机构组织的讲座中,我比较多地讲了前面的三个问题,即体制问题、岩土工程师的土力学素养和岩土工程勘察的实务工作。第二本书出版以后,一些朋友希望我讲一讲这本书中关于勘察工作中的岩土工程评价和岩土工程设计的问题。由于内容比较多,将分为两个部分,第一部分为岩土工程评价方法,第二部分为岩土工程设计方法。,第一部分 岩土工程评价方法,一.岩土工程评价与岩土工程设计的基本要求二.岩土工程设计参数的统计分析与评价方法三.地下水位评价与地下室抗浮验算方法,四.抗剪强度指标的评价与大面积堆载的稳定性验算五.勘察报告中的岩土工程评价六.岩土工程设计荷载取值与安全度控制方法七.基础方案建议与地基基础设计的基础选型,第二部分 岩土工程设计方法,一.浅基础设计的地基承载力问题二.地基基础设计的变形控制方法三.单桩、群桩的承载力与桩基础设计四.地基处理的方案选择与设计控制,五.边坡稳定性分析与土压力计算六.基坑工程方案设计与事故分析七.地基基础抗震评价与抗震设计,岩土工程勘察技术面临的挑战,1.在勘察报告中对深层土的地基承载力评价2.特殊条件下的地基承载力取值方法3.长桩和超长桩基础下软弱下卧层的强度验算4.长桩和超长桩桩端阻力的发挥条件,5.深层土的抗剪强度试验的加载要求6.为深基坑设计提供的抗剪强度试验的应力路径7.取土时试样卸荷作用对不固结不排水试验结果的影响8.大面积填土中的地下水浸润线上升9.大底盘地下车库上建筑群的沉降计算10.深层土的基床系数,一.岩土工程评价与岩土工程设计的基本要求,岩土工程勘察规范对勘察报告的内容提出了如下的规定:1.勘察目的、任务要求和依据的技术标准;2.拟建工程概况;3.勘察方法和勘察工作布置;4.场地地形、地貌、地质构造、岩土性质及其均匀性;,5.各项岩土性质指标,岩土强度参数、变形参数、地基承载力的建议值;6.地下水埋藏情况、类型、水位及其变化;7.土和水对建筑材料的腐蚀性;8.可能影响工程稳定性的不良地质作用的描述和对工程危害程度的评价;9.场地稳定性和适宜性的评价。,上述9项要求中,第4第9项的要求都是分析、评价。评价构成了岩土工程勘察报告的基本内容和结论。但什么是分析、评价?1.分析、评价的目的是什么?2.怎样做分析、评价?3.评价与设计有什么区别?这些都是我们需要弄清楚的问题。,在现实的勘察工作中,至少在我的论坛上所反映出来的问题中,显示了部分业内人士在不同程度上存在着一些值得重视的问题:1.对参数统计评价的基本前提不是很清楚,例如:力学层与地质体之间是什么样的关系?对力学层为什么要作均质体的假定?什么是异常数据?异常数据如何剔除?如何使用经验关系?,2.对岩土工程评价与岩土工程设计的区别不是很清楚。例如:1)评价与设计的前提条件有什么区别?评价的前提是对地质条件的探明,而设计的前提是明确工程条件;2)评价与设计之间是什么样的关系?评价为设计提供对地质条件的理性认识;,3)评价时进行一些计算的目的是什么?评价时进行的一些计算是为了比较不同方案之间的异同。什么是适度量化和有条件的量化?量化应该符合勘察工作的条件,只能做一些假定条件下的量化计算。4)评价的结论与设计的结果有什么不同?评价是对现有地质条件的分析和预测;设计是对拟建工程的谋划与安排。,3.岩土工程勘察的审图应该把握什么问题,是否存在过度的定量计算的要求?1)评价的深度如何掌握?2)如何正确地理解岩土工程勘察规范对岩土工程评价的要求?3)在勘察阶段能否以设计规范作为审图的依据?评价的依据是勘察规范,而设计的依据是设计规范,两者不能混淆。,二.岩土工程设计参数的统计分析与评价方法,岩土工程参数统计分析与取值是岩土工程勘察内业工作的重要组成部分,是对原位测试和室内试验的数据进行处理、加工,从中提出代表性的设计、施工参数,作为岩土工程勘察分析评价的重要依据。,基本观点,由于岩土体是自然形成的,其成分、结构和构造都是随机的和不确定的,勘察时的钻孔或原位测试所取得的土样或数据都有相当大的偶然性,采样必然带有随机性。因此,岩土工程参数的分析方法必须建立在随机数学的基础上,采用统计的方法获得具有代表性的参数,对于所得到的岩土工程参数也只能从统计的概念上去理解,才能正确地使用。,参数分析的内容,岩土工程参数分析的内容包括对原始数据的误差分析和有效数字的取舍,数据统计特征的分析,平均值和标准值的计算,参数间经验公式的建立及其正确地运用。如何处理规范界限值与自然界的不一致,如何剔除粗差。抗剪强度指标的统计。变形参数的选用。,6.1如何理解参数的统计修正系数,统计修正系数计算时,公式括号中的正负号如何选择?不利组合具体情况下怎么考虑?除了抗剪强度取负值外,还有那些指标通常取负值?或那些指标可以取负值。另外,统计修正系数一般情况下在0.751之间,如果计算出来是负数或大于1,是不是计算结果就不能用了呢?对于岩土参数的统计规范有规定,对于原位测试该怎么统计呢,是按照规范的公式,还是按平均值1.645 计算?,统计修正系数是对土性指标的平均值因变异性而进行的修正,平均值乘以修正系数以后称为标准值,标准值是具有概率意义的代表性数值或者称为取用值。,岩土参数的标准值是岩土工程设计的基本代表值,是岩土参数的可靠性估值。对岩土设计参数的估计,实质上是对总体平均值作置信区间估计。在勘察工作中取土试样或者作原位测试测定岩土的性状和行为,其目的是希望了解岩土体的总体的性状和行为,取土试验或作测试工作是一种抽样的手段,而非目的。抽样所得的子样,包括试验的结果和原位测试的结果都是抽样得到的子样,这些子样并非我们的终极目标。,例如,我们取土作三轴试验,求得的强度指标仅是所取的土样的性状,这些指标在多大程度上反映了整个土层的实际性状呢?我们感兴趣的不是几筒土样,而是整个土层,需要了解的是整个土层强度的平均趋势,亦就是需要了解强度指标的总体。,如何从子样的数据中得出关于总体的结论呢?这种方法在统计学中称为统计推断,就是从有限的样品的结果出发来估计总体的特征,从特殊的抽样数据来推断一般的总体特征的方法。在采用统计学区间估计理论基础上,可以得到的关于参数总体平均值置信区间的单侧置信界限值:,子样的变异系数由子样的标准差求得:空间均值的变异系数为空间均值的标准差与空间均值之比:,标准差折减系数可用随机场理论方法求得,其表达式为:e相关距离h计算空间的范围,考虑到随机场理论方法尚未完全实现实用化,在实际工程应用时,可以采用下面的近似公式计算标准差的折减系数:得到近似的实用公式:,式中t为统计学中的学生氏函数的界限值,一般取置信概率为5%。学生氏函数t与样本容量n的关系见表,为了便于应用,也为了避免工程上误用统计学上的过小样本容量(如n=2、3、4等),在规范中不宜出现学生氏函数的界限值。因此,在1980年代编制建筑地基基础设计规范和岩土工程勘察规范时,通过数据拟合方法求得了下面的近似公式:,需要结合岩土工程实际问题讨论统计学的区间估计理论和置信界限的物理意义。岩土工程设计参数的代表性取值为什么要取区间估计理论的置信界限呢?岩土工程师是在有限信息的条件下,或者说在信息很不完备的情况下要对岩土体的性状作出估计,包括对地质条件的估计、对设计参数的估计、对工程问题的估计。这里用的是“估计”的词汇,而不是“确定”或“计算”之类的词。为什么?,这是因为,根据有限的信息作出的判断或评估,带有很大的不确定性,充其量仅仅是对客观存在的物理量或状态的一种估计或者讲是概率估计,而不是确定性的计算结果。概率估计的结果往往给出一个区间,说明你要估计的客观存在的物理量最有可能在这个区间以内。比方说,你要根据试验结果的数据对内摩擦角作出估计,估计客观存在的内摩擦角最大可能存在于711之间。,那么能否说你有充分的把握认为内摩擦角的客观存在肯定就在这个区间范围以内,其实也并没有100的把握,你还得回答有多大百分比的把握,这个百分比与上面所说的“置信概率”互补,如果置信概率是5,就说明你有95的把握估计是在这个区间范围以内,还有5的可能性会大于这个区间的上限或小于这个区间的下限。这种估计称为双侧置信区间界限的估计。,在工程上,一般并不需要估计双侧置信区间界限,只要控制最危险的单侧界限就足够安全了。例如,我们估计内摩擦角的置信区间,低于下限界限是危险的,必须加以控制,而对上限并没有必要加以控制,因为实际可能的内摩擦角越大就越安全。所以我们只要控制不低于置信下限就可以了,即控制小于7的可能性低于一个小概率就可以了。这种区间估计称为单侧区间估计,用于取用相应于单侧置信界限的指标取值。,什么情况取上限?什么情况取下限?主要取决于指标的性质,根据参数的性质,从不利方面来选择正负号。修正系数一般不可能出现负数,如果出现负值,那说明相对来说,变异系数太大了,计算的结果不合理。用正号的修正系数就肯定大于1.0,是正常的。下面进一步讨论如何正确运用统计学的区间估计理论,区别两种置信界限的概念及其对工程应用的意义。为什么提出这个“两种置信界限的概念”的问题来讨论呢?因为这个问题有普遍的意义。,在国家标准建筑结构设计统一标准(GBJ50068-2001)的附件中规定,材料的性能标准值按下式计算:这里的f是子样标准差,1.645是样本容量为无穷大时的学生氏函数。有个规范曾经将这个公式引用到岩土工程中,用以计算标准贯入锤击数N的标准值,但却发现不能用。这是怎么一回事?,但在工程实际应用中,人们发现当标准贯入锤击数的子样标准差比较大的时候,用这个公式求得的标准值比最小值还要小。例如,下表所列的是对某土层测定的标准贯入锤击数的数值,求得平均值为20,标准差为3.8,按这个公式计算得到的标准值仅为13.7,已经非常接近于最小值,人们无法接受这样的统计结果,显然采用这样小的标准值是不恰当的。,表列的是对某土层测定的标准贯入锤击数的数值,求得平均值为20,标准差为3.8,按前面公式计算得到的标准值仅为13.7,已经非常接近于最小值;而用后面公式计算的结果为18.6。,为什么将统一标准中关于材料性能指标标准值的计算公式直接用到岩土工程的指标估计时会产生这样的问题呢?这涉及统计数学的实际应用问题,工程材料性能指标的标准值的取用建立在统计数学中关于区间估计理论的基础上。工程应用中,一般取用单侧置信界限作为设计参数的标准值,对材料的强度用置信下限值。但区间估计理论有两类,一类是估计单个测定值,另一类是估计总体平均值。,估计单个测定值的置信下限值的物理意义可以这样来理解,在大量的重复抽样试验中,出现低于试验值的概率将小于置信概率(例如,取置信概率=5%),对上部结构材料性能所采用的公式正是这种估计单个测定值的统计公式。对于标准贯入试验,对同一个土层,每次测定的击数小于13.7的概率估计小于5。但对岩土工程是没有工程意义的。,影响岩土工程性状的性能是岩土体总体的平均性能,个别点的性能并不影响全局,因此应采用依据估计总体平均值的统计概念建立的统计方法。采用估计总体平均值的置信下限作为标准值,意味着总体平均值可能低于置信下限值的概率只是一个小概率,即置信概率,而总体平均值大于置信下限的概率则是一个充分大的概率(1-)。,对于岩土体的强度和变形问题,对工程有意义的并不是单个测定值,勘察的目的是要根据有限的抽样测定来估计岩土体测定指标总体的平均值,用以估计岩土体的稳定和变形性状。就以表中的标准贯入锤击数数据为例,我们关心的是土层的标准贯入锤击数的总体平均值以及根据这个标准值用经验公式求得的设计参数,用以代表整个土层的工程特征。,用前面公式求得的13.7是什么意义呢?这表示,预计对这个土层进行标准贯入试验数据的序列分布可能是大于13.7的数据出现的概率将大于95,小于13.7的测定值出现概率不会超过5%。但对于岩土工程问题来说,这样的推断并没有太大的实际意义。用后面公式计算得到的标准值为18.6,这个标准值表示预计这个土层的标准贯入击数标准值的总体平均值大于18.6的概率将大于95,小于18.6的概率不会超过5。岩土工程大多数参数应采用这种统计方法估计标准值。,为什么上部结构材料性能的标准值可以用公式(6-12)计算呢?这可能是上部结构构件设计中,截面尺寸与试样尺寸之比并不太大,用估计单个测定值的置信下限作为标准值不致引起太大的误差的缘故。鉴于上述分析,在岩土工程中,采用了如公式(6-1)所示的估计总体平均值的置信界限作为标准值的计算公式,亦即岩土工程勘察规范给出的公式。,6.2 用什么方法统计经验公式?,经常看到很有用的一些经验公式,对我们工作很有帮助,但不知用什么方法得到这些经验公式的。,经验公式用于描述岩土参数之间的定量关系。由于岩土工程中参数测定方法的多元化,对同一岩土体通常可以采用各种不同方法进行测试,为经验公式的统计提供了大量原始数据。又由于岩土工程中参数测定的不确定性比较大,也需要通过不同的方法进行印证与检验。有时由于某些试验的条件比较困难或者费用比较昂贵,希望用比较方便、简单的测试结果,通过经验公式得到需要的参数。,统计经验公式所依据的数据是对比试验的资料,为什么要强调这个问题?是因为出现了对计算结果统计经验公式的案例。这涉及统计方法应用的一个最基本的概念和原则问题。必须明确这个原则,不能允许出现假的经验公式。,例如,基于对比试验资料统计地基承载力和原位测试数据之间经验公式,对比试验是指对同一个场地,既做载荷试验,又做原位测试。当然原位测试的土层、测定的标高和位置都与载荷试验点是匹配的,这样得到的数据组是一一对应的,积累了许多试验之后,就能得到地基承载力与静力触探比贯入阻力或标准贯入击数之间的数据系列。,将这样的对比试验数据画成散点图,可以根据散点群的趋势以分析地基承载力与原位测试指标之间存在什么样的相关关系。对于自变量与因变量一一对应的数据,可采用解析法建立经验公式;但对于离散性的数据,则只能采用统计的方法求解经验公式中的回归系数。,Ko1sin,岩土参数之间的关系可能是线性的,也可能是非线性的,这需要通过分析来选用线型。最简单的方法是将试验数据画在直角坐标图上,用图解法分析变量之间呈什么样的关系,对有些参数之间的经验关系可以根据专业知识判定线型。,岩土工程中常用的经验公式在直角坐标图上有如图所示的三种类型:第一种类型是当自变量增大时,因变量逐渐减小;第二种类型是当自变量增大时,因变量随之增大,但斜率逐渐减小并趋于常量或减小到零;第三种类型是当自变量增大时,不仅因变量随之增大。而且斜率也不会减小。,三种类型的非线性经验公式,x y x y x y dy/dx dy/dx b 0 b0 0 b 1 b1 b 1,将非线性化为线性关系,公式所示的幂函数是一种适应性比较强的线型,能广泛地适用于描述上述三种类型的经验关系。,对幂函数等式的两端取对数:A、B两个系数可以用统计的方法求得,称为回归系数。,Yy,X1/x,A=a,B=b,Y1/y,X1/x,A=a,B=b,Ylogy,X=x,Alog a,B=b log e,Y=y,X=x2,A=a,B=b,利用统计数学的方法可以求解线性方程中的待定参数,在岩土工程的参数分析中,采用最小二乘法已有足够的分析精度。,最小二乘法的概念,假定代表这些散点的回归方程线已经画出,我们取任意点M进行分析,M点与回归线在纵向的坐标差为YY,Y为实测值,Y表示用自变量X代人回归方程求得的数值,两者的差值(YY)称为离差。除了在回归线上的散点外,其他的点都存在离差。不在回归线上的散点越多,散点离回归线越远,则离差的总和就越大。由于离差有正有负,离差的代数和就有互相抵消的可能性,就反映不出误差的大小。,离差的平方和Q,对于一定的散点群,当直线的位置和走向发生变化时,离差平方和随之而变化,在这样的变化中总能找到一个最小的Q值,则与之相应的直线位置应该是最佳的。,因此,以离差平方和最小为条件确定的回归系数A和B应该是最理想的,也就是我们要求的结果,这种确定回归系数的方法通常称为最小二乘法。根据求极值的原理,离差平方和最小的条件为:,得到用下式表示的回归系数A和B:,回归系数既然是在离差平方和最小的条件下求得的,由此必然存在着剩余的离差平方和。剩余的离差平方和分配到每个数据上的部分称为回归方程的剩余方差,剩余方差的平方根称为回归方程的剩余标准差。,剩余方差是衡量经验公式精度的指标。而衡量两个指标之间关系密切程度的指标是相关系数r。如果散点都在一条直线上,则对任一对数据都满足,则Q0;如果散点满天飞,两个变量完全不相关,回归不起作用,则剩余方差等于总方差,基于对上述两种极端情况的分析,提出一个指标来衡量介于这两种极端情况之间相关程度的指标,称为相关系数。对于完全相关的情况,相关系数r1;对于完全不相关的情况,相关系数r0;对于介于中间状态的情况,相关系数变化于区间0r1。,对于非线性的经验公式,在求得线性的回归方程以后,还需要进行系数变换,将线性方程变换回原来的非线性方程,得到非线性的经验公式。得到经验公式之后,需要进行回代检验,以检查统计计算是否正确。,数据处理的一些不恰当的做法,1当待定参数的个数超过试验数据的数量时,采用内插的方法得到足够多的数据个数以满足准则方程的数量要求。甚至提出“可通过插值的方法,增加控制方程数,使独立方程个数大于或等于优化反分析的参数个数”。这个提法显然是不正确的、相互矛盾的。,插值与其所依据的数据并不是独立的,则增加的方程就不是独立的,插值再多,方程再多也不满足独立方程个数大于或等于优化反分析的参数个数的数据处理基本要求。例如根据试桩曲线的数据计算荷载传递函数的待定系数,一般Qs的试验数据只有10对,如待定参数的个数超过10个就无解,除非在试验时增加试验数量或数据的数量。,2根据反分析(或试验资料整理)得到的计算参数,用数值分析的方法求得土体或结构物的反应,将计算的结果和实测的数据进行对比,两条曲线非常接近就说明理论方法是正确、合理的。实测变形 反分析 参数 正分析 计算变形 实测变形验证,这里非常关键的问题是验证用的实测数据必须和反分析(或试验资料整理)所依据的数据互相独立,即必须是两套数据。,3验证的方法上不严格,有任意性。如果实测(或试验)曲线有很多条,例如,在相同条件下的平行试验,在建筑物对称位置的观测数据,但这些数据或曲线之间往往存在一定的差异,验证时不能回避这种差异,只能从统计平均的概念上去比较理论计算和实测结果之间的吻合程度。,6.3 怎样正确使用经验关系?,在粘性土(包括软质岩石的全风化)中如果其标准贯入试验锤击数达到13击其承载力标准值即可取300kPa以上,而锤击数达到21击其承载力标准值可取600kPa。一般对于软质岩石的全风化与强风化的分界处可以依据标准贯入试验锤击数大于50击的位置划分。这里就有了矛盾,事实上对于软质岩石的强风化其承载力标准值一般是300-500kPa,而粘性土(包括)软质岩石的全风化如果其标准贯入试验值达到21击以上就可取600kPa,这是不合理的。,你说的这几个数值都是经验关系,都针对一定具体的条件而言的,都是针对某个地区、某种岩土而言的,不能外推,也不能延伸,更不能将3个不同条件下得到的经验关系闭合起来,这肯定是闭合不起来的。要记住,对经验的统计关系,不能用数学的A=B,B=C,因此证明A=C必然成立的概念来看待。,就你说的这几个经验关系,用标准贯入击数确定承载力是对粘性土而言,没有说可以用到全风化的软质岩石,不能外延。因为一般指的粘性土是指洪冲积成因的,而全风化的软岩的性质与母岩的关系十分密切,有的全风化软岩的工程性质比黏性土还要差,从黏性土得到的经验关系包不住软质岩石。,按标准贯入50击击数划分强风化的经验界限值,是在花岗岩地区得到的经验,也不能外延到软岩,而强风化软岩的承载力则是由一些载荷试验资料得出的,也是具有一定适用条件的经验值,与标准贯入击数没有相关关系。岩土工程中的经验关系,包括经验公式都是有限制使用条件的,包括岩土的类别、地区的差异、原始数据的范围,不能拿来就用,要经过验证。,请问统计修正系数与回归修正系数有何异同?,这两个系数计算公式分别出于在何处?两者有何异同?各适用于什么情况?统计修正系数回归修正系数,统计修正系数是对单个变量的平均值因变异性而进行的修正,平均值乘以修正系数以后称为标准值,标准值是具有概率意义的代表性数值或者称为取用值。回归修正系数是对从回归方程计算结果(或从地基承载力表查承载力)因自变量的变异性而对因变量进行的修正,修正以后的取用值也称为标准值。这两个系数在形式上相似,但来源和用途不同。,回归修正系数用于根据经验公式估计参数时,处理误差传递影响的修正系数。由于散点的离散性,即使采用最小二乘法的优化处理,经验公式都还存在一定的剩余离差。用经验公式求解未知的岩土工程设计参数时,所得到的并不是确定性的数值,而是带有一定误差的计算结果。因此,不能将经验公式当作数学解析式来使用,必须考虑误差在经验公式中的传递。,用经验公式预估岩土参数的误差来源,一部分与回归方程的置信带有关,另一部分则与代入指标的变异性有关。,回归方程的置信带,用经验公式预估岩土参数的两种情况,1.用X的某个测定值来求Y的估计值,考虑误差估计的经验公式为:,2.用X的平均值值来求Y的估计值时,考虑误差估计的经验公式为:,计算实例,对静力触探与室内压缩试验的对比试验结果曾分别三次抽样统计得到三个经验公式,从表可见,公式甲的剩余标准差比公式乙大很多,但与公式丙相接近;公式乙的样本容量n和公式丙相差不多,但公式甲的样本容量n却远远超过其他两个公式。如现有样本容量n010的比贯入阻力数据,均值为2.0MPa,变异系数为0.10,分别代入表中的三个经验公式,取置信概率为0.05,则计算结果见表6-4。,从比较计算的结果可以看出,公式丙的剩余标准差最大,样本容量又最小,公式所依据的原始数据的质量最差,因此其可靠性最差,实用的价值也就比较差。公式甲和公式乙计算结果接近,这是由于公式甲的样本容量虽然大,但数据离散性大,剩余标准差大,而公式乙的样本容量虽然小一些,但数据质量好,因此两个公式的效果接近。,分析代入指标变异性的影响,设有三组变异性不同的数据,其计算结果见表6-5。计算结果表明,代入指标的变异性越大,用经验公式预估的数值就越低,经验公式的效益得不到充分的发挥。,两个十分重要的概念,第一,经验公式的可靠性与实用性直接依赖于建立经验公式时所用原始数据的质量与数量。提高原始数据的质量和增加对比试验的组数固然要化代价,但能带来明显的经济效益。第二,如果代入数据的质量很差,那么经验公式的可靠性再高也是没有用的。这和用高精度的计算机去处理粗糙数据的道理是一样的。这就需要努力提高代入数据的质量。以最大限度地发挥经验公式的效益。,讲了上面的这些问题以后,我们可以进一步讨论你所提出的回归修正系数了。这个系数出现在建筑地基基础设计规范GB 7-89中,与规范给出的地基承载力表配套使用,反映了查表所用的指标的变异系数对查表结果的影响。地基承载力表实际上是经验公式的表格化,回归修正系数则是经验公式误差分析的一种具体应用。,6.4 怎样剔除异常数据?,6.4.1 粉质黏土中往往夹有薄层粘土,在整理数据时粘土的数据要不要剔除呢,有人认为不应该剔除,这样才能反应土层的真实情况,有人认为应该剔除,既然定了粉质粘土就应该剔除粘土的数据,不知高教授有何看法啊。,甚至有人认为,状态不同,都不能分为一层,比如粉土,孔隙比e=0.750.9是中密,那么如果是一层,就不能有孔隙比小于0.75或者大于0.9的。几十个粉质粘土中有几个粘土样是正常的,我们不可能把每个粘土样所在的位置划分一层出来。正如粘性土大部分是可塑的,有几个可能是软塑或者硬塑,在土工统计中就不能出现软塑或者硬塑的土样。,怎样认识和处理反映自然形成的土层所具有的物理力学性质?,这里讨论的是工程勘察中一个非常重要的问题,涉及许多基本概念,怎样认识和处理反映自然形成的土层所具有的物理力学性质?怎样看待土的分类指标、状态划分的指标?岩土工程师应该具备什么样的数据处理与运用数据处理结果的基本素养?变异系数究竟是一个什么样性质的指标?土层的定名和分类对工程究竟有什么样的影响?,从根本上说,土层总是非均质的、其性质是随机变异的,土层是在漫长的地质年代里自然形成的,土层物质的来源、搬运物质的自然营力的性质与规模、土体沉积以后的成土环境等等都是变化的、基本上是无序的、随机的。,土类、土层划分的相对性,但人们要利用土作为工程的地基、材料或环境,需要进行设计和施工,就不得不对土体进行适当地划分,分为几个相对比较均匀些的土类或土层,采用一些代表性的指标来描述其物理力学性质,以便于设计与施工。,但无论怎么划分,无论采用什么方法,总与人工材料不同,客观世界并不随我们在规范的规定而变化,于是就出现了在划分为粉质黏土的土层中,可能有几个指标的塑性指数大于17,划分为中密的粉土中有几个比较大的孔隙比等等,其实这是非常正常的事,没有办法解决大自然的不均匀性质。,怎样看待土的分类指标、状态划分的指标?,前面说过为了设计与施工的需要,不得不将本质上是非均质的土体人为地划分为几个相对均匀的土类或土层。于是人们就研究土的分类的方法、状态划分的方法、密实度划分的方法。,就产生了前苏联的规范、英国的规范、美国的规范、中国的规范、中国建筑系统的规范、公路系统的规范、桥梁系统的规范、铁路系统的规范、甚至还有城市桥梁的规范,提出了林林总总的一大批土类划分的标准、状态划分的标准、密实度划分的标准,划分的界限就极其多元化。,但自然界并不买账,它不会服从哪一本规范,无论哪一种方法都可能存在照顾了这一头,又拉下另一头,顾此失彼的现象。所以最要紧的是我们使用规范的工程师不要把规范看成绝对真理就可以了。举个例吧,粘性土按液性指数划分为硬塑、可塑和软塑三种状态,有的规范采用三分法,平均地各取三分之一。,而建筑地基基础设计规范采用0.250.75是可塑,小于0.25是硬塑,大于0.75是软塑这种非等分的方法。这个规定怎么来的,当年就是我提出了这个建议,理由是可塑的范围适当大一些,容易与野外描述结果取得一致,大家同意了这个办法就列入规范了。这个可塑与硬塑之间其实并没有非常严格的界限。即使是液限指数等于零或等于1的界限,是由液限和塑限指标计算得到的,但由于这两个试验方法的多元化,用不同的标准得到的结果相差非常大。,由此可见,这种划分土类、状态和密度的指标,只是人们约定俗成的一种规则,为了交流、交接的一种语言符号而已,和人的姓名一样,和划分中年人和老年人的年龄界限一样,都是相对而言的,不能绝对化。任何规范的土类划分,都不可能完全符合自然界,也不能要求自然界服从人类的安排,更不能将客观存在的不均匀性视为异端,不能将其作为异常数据剔除。,岩土工程师应该具备什么样的数据处理与运用数据处理结果的基本素养?既然自然界那么复杂,试验的结果又是那样离散,因此岩土工程师如何处理和运用数据就非常重要。我们不怨天尤人,既然我们所面临是天然材料,比人工材料复杂得多,那我们就应该采取积极的态度,学习和掌握随机数学的基本概念和实用的数据处理方法去处理岩土工程的数据,从中总结规律性的认识以指导我们的工程实践。,怎样正确认识变异系数?,变异系数究竟是一个什么样性质的指标?好像有句话说:“如果统计后的变异系数较大,就要考虑分层是否合理了。”这反映了一个现实情况,是对变异系数的误解与曲解的反映,是岩土工程师的随机数学基本素养不足的表现。,变异系数变化的特点,1.变异系数变化的范围相当大,显示出影响变异系数的因素比较复杂。2.各种不同的物理力学指标的变异系数变化范围并不相同,物理指标的变化范围一般小于力学指标。,3.变异系数的数值主要反映了土的成分与结构的不均匀性对土性指标的影响,即使划分为同一土层,成分与结构的不均匀性使土的物理力学指标呈现出比较大的变异系数。4.砂土内摩擦角的试验条件单一,影响因素比较少,变异系数变化范围不大,说明虽然试验的误差在一定程度上加大了变异系数,但并不是主要因素。,岩土工程勘察规范GB50021-2002(2009年版)提出了一些最基本的概念和方法,例如,第条关于岩土参数统计的要求,条关于相关型参数的统计分析方法,条关于岩土参数标准值的确定方法。但可惜很多工程师并没有充分地去理解规范的条文,也很少去考虑如何在工程实践中运用这些方法。,在岩土工程勘察规范50021-94版中,曾经给出了对变异系数的评价,见表6-7。规范给出变异系数的评价界限值并不是给出一种“判别是非”的标准,变异系数很高并不说明这个试验就存在问题或就不合格。根据变异系数不能简单地作为评价勘察试验质量的标准。,不管作为试验是否合格?分层是否正确?数据是否需要剔除?按上述规范给的变异系数界限来判定都是不对的。鉴于上述种种误解,所以在修订规范时就将这个表删除了,没有再列入2002版的规范。但现在看来,事情并没有完全解决,现在依然存在将变异系数的大小作为一种“判别是非”的标准。,土层的定名和划分对工程究竟有什么样的影响?讲到最后,工程上怎么办或许是大家最关心的事。先讲土层划分与定名,土层划分的基础应该是野外鉴别描述结合土工试验指标,希望岩土工程师多下现场,到钻机上摸土,这是最重要的,划分土层以后,在一层土中出现塑性指数跨越分类界限怎么办,例如野外描述是黏土,试验结果是塑性指数大于17的是多数,有少数试验结果小于17怎么办?,如果有规律性的存在,可以定名黏土夹粉质粘土薄层或夹层,如果规律性不强,则定名黏土含粉质粘土,其实17的界限是人为的界限,而且不同分类标准的界限又是不同的,这样处理对工程没有太多的问题,因为重要的是力学性质指标的试验结果,是力学层的划分对不对。,至于状态或密实度是在分层的基础上的描述,可以根据液性指数的数值分布描述为可塑软塑,硬塑可塑等都是很正常的,不应该按液性指数再划分亚层,完全没有这种必要,而且液性指数划分状态界限也完全是人为划分的,并没有充分的客观依据。,所有的数据,不管是否参与统计,是否对分类与描述产生影响,都必须在资料中反映,剔除数据是不能允许的。因为这些试验的数据是客观存在的,不同的工程师对其作用的主观评价可能不一样,不在资料中出现,其他工程师就无法评估你评价的正确与否,因此不可以删除原始数据,而只能说明其不参与统计的理由,让其他工程师来评估你的理由对不对。,4.6.2 是否把超过三倍标准差作为剔除数据的依据?,每一剪切试验会得到一组c、的测试结果。在进行数理统计时如果发现一组测试结果中的c(或)值为异常数据,是把该c(或)值单独剔除而保留其(或c),还是应该把整组c、值予以剔除?,在审查时经常发现一些勘察报告的物理力学性指标统计表中c和 的数量不一致,估计是剔除数据时把c(或)异常值单独剔除而保留其(或c)。我个人觉得不妥,因为是同一组数据,如有异常应一起剔除。不知道这样理解对不对?,你提出了资料整理的一个基本问题,即如何处理离散性比较大的数据,主要应该处理的是实测数据,而不是统计得到的指标。这涉及对误差的分析和误差处理的基本概念。即客观存在与人们的主观认知的关系。,误差分析,试验数据是一种物理量,通常物理量的真值是不知道的,是需要测定的值。但由于量测仪器、试验方法、试验环境、人的观察力和测量的程序等都不可能完美无缺,故真值是无法测得的。实验科学中的真值定义为在无系统误差的条件下,用足够多次的观测,可以获得接近于真值的数值,即观测次数无限多时得到的平均值,一般称为最佳值。,观测值与真值之差称为误差;误差分为系统误差、偶然误差和过失误差三类。系统误差是指测定中未被发觉或未被确认的因子所引起的误差。引起系统误差的原因一般认为是由于仪器不良,如刻度不准,砝码未校正;试验环境的变化,如温度、压力、湿度的变化;操作人员的习惯,如习惯从侧面读数等。可以用校正仪器,控制环境和改正不良习惯来消除系统误差。,偶然误差是指在已消除系统误差的条件下,但所测的数据仍在末一位或末二位数字上有差别,则称这种误差为偶然误差。偶然误差的特点是时大时小,时正时负,方向不一定;偶然误差产生的原因不清楚,因此无法控制。但如用同一精度的仪器,在同一条件下,对同一物理量作多次测量,若测量的次数足够多,则可发现偶然误差完全服从统计规律,偶然误差的算术平均值将逐渐接近于零。偶然误差可以用误差理论进行处理。,过失误差又称粗差,是完全由人为因素造成,如粗枝大叶、过度疲劳或操作不正确等因素。消除过失误差的方法是提高工作人员的责任感,健全工作制度,加强对数据的审核。,误差的表示方法,1.范围误差范围误差是指一组测量中最高值与最低值之差,表示最大的误差有多大,但不能作测定值之间的相互比较。最大误差系数是范围误差与测定值的平均值之比。这种表示方法的缺点只与两极端值有关,而与测量次数无关。,2.算术平均误差 算术平均误差由下式计算:式中 n 观测次数;di观测值与平均值之差。算术平均误差的缺点是无法表示出各次测量间离散的情况。,3.标准误差 标准误差也称为均方根误差,其定义为:标准误差是一组测量中各个观测值的函数,而且对较大误差和较小误差都比较敏感,因此是表示测量精确度的较好的方法。,4.或然误差 或然误差的意义为:在一组测量中若不计正负号,误差大于或然误差的观测值与误差小于或然误差的观测值各占观测次数的50%。从或然积分可以导出:,剔除粗差的标准,由于粗差的存在,使实测数据离散性比较大,首先应该从数据的试验、采集上进行检查,剔除存在明显错误的数据,如果发现不了错误的原因,就按3倍标准差原则剔除,其理论依据是大于或小于3倍标准差的数据出现的概率非常小,由此可以判为小概率(0.35)的事件,即“不可能事件”,由此可以删除。,在抗剪强度试验中,实测的误差反映在画强度包线时,有些点偏离太大,可能是因为试样密度有差异,或剪切面上夹砂,就应剔除这些试验点,一旦给出了c和的数值,在分别统计c和时发现某些指标的离散性比较大,这时再剔除指标就不应该了。同时,客观上c和的变异性本来就是不一样的,内聚力的变异性远大于内摩擦角,此时更不能再采用上述的数据处理原则来剔除统计结果的数据。,关于极差超过30%,我们曾作过灰土挤密桩的载荷试验,对极差超过30%的数据我采用了去掉大值,认为大值是异值,然后分析极差直至达到30%的要求。不知此做法是否正确?,建筑地基基础设计规范GB500072002对于载荷试验的结果,规定极差不超过平均值的30时可以取平均值作为代表性的数值,但对超过30的试验结果如何分析与处理没有作出规定。,采用极差来描述试验数据的离散性是一种比较简便的方法,但并不非常合理,因为它过分地依赖于个别的数据,评价离散性的合理指标是变异系数,它充分利用了所有数据的信息,是整个试验数据离散性的综合反映。但对于样本容量不是很大的数据,数据信息本身就不是很丰富,极差方法比较简单的优点就受到人们的青睐,因此规范就采用了这种方法。,但是你用去掉最大值以满足30的规定的做法是没有根据的。对于试验的结果要尊重,不能随便删除,如果确实证明有系统因素影响了试验结果,不采纳存在系统因素的数据,那是允许的。例如这个试验点的水泥下料太多了,或者是搅拌次数明显不够等这些影响承载力的因素起了作用,查明以后不采纳这些数据。在去掉存在系统因素的试验数据后,其余的数据离散性是偶然因素造成的,就可以用统计的方法处理数据;,与极差30对应的变异系数,可以分析与极差30相应的最大变异系数的范围。若同一场地做了三根试桩,其极限承载力分别是X12X3,极差30%可以表达为下式:,的区间为0.91.1