试验误差与数据处理.ppt
第2章 误差的性质与处理,2.1 随机误差,2.2 系统误差,2.3 粗大误差,2.4 直接测量的数据处理步骤,主要内容:,2.1 随机误差,随机误差产生的原因,随机误差的特性,随机误差是由众多的,变化微小的因素所造成的。,1、随机性。,3、随机误差服从统计规律,增加测量次数可减小随机误差对测量结果的影响。,2、随机误差产生在测量过程中。,例如,压力、温度、磁场、仪器装置及测量人员等因素的影响。,随机误差处理的基本原则,随机误差处理的理论依据是概率论与数理统计。具体参量可用随机变量的数学期望、方差和置信概率等特征量来表示。,实验测量的目的是通过实验数据的分析以及借助于数学工具对数据进行整理,从而获得研究过程的数学模型或者求得某一被测量的真值。一切由不确定的随机因素所造成的随机误差,它的大小及正负,在其出现之前是不可预估的。随着测量次数的增加,各数据随机误差的大小及正负符合统计规律。实验数据处理的任务就是要在测量的随机数据中寻找有关的规律。通过大量的实验研究发现,尽管随机误差的分布规律多种多样,但多数服从或近似服从正态分布。,2.1.1 随机误差的分布,一、正态分布(Normal distribution),1、正态分布的特性,正态分布又称高斯分布,因为德国数学家高斯(Gauss)在研究误差理论时,较早地引入了这种分布。根据概率论的中心极限定理,几种非正态误差共同作用的结果也将使总误差趋向正态分布。假定在某一相同条件下的测量列为x1、x2、xn,x0为真值,其它误差(主要指系统误差和粗大误差)可以忽略,该测量值的随机误差为,则服从正态分布的随机误差和测量值的概率密度函数分别为,正态概率密度函数的是一条钟形曲线,称为正态(高斯)曲线。正态曲线(服从正态分布的随机误差)具有如下性质:(1)单峰性:绝对值小的误差比绝对值大的误差出现的概率大。,(2)对称性(抵偿性):绝对值相等且符号相反的误差出现的概率相同。(3)有界性:在一定测量条件下,不可能出现无限大的随机误差。,这与随机误差具有抵偿性是一致的。,2、正态分布随机误差的数字特征 能准确描述服从正态分布随机变量(测量值)及其误差的统计规律通常用两个参数数学期望和方差(或标准差)。(1)数学期望数学期望的本质含义是:随机变量(误差)分布的中心位置,也就是随机变量(误差)概率密度分布曲线的重心位置。说明了随机变量(误差)分布的集中情况,是对概率分布的一种估计。服从正态分布的测量值和随机误差的数学期望为,证明,当实验次数增大时,随机变量X观测值的算术平均值 将在x的数学期望附近摆动,因此在实际工作中往往用算术平均值代替随机变量的数学期望。(2)方差及标准差,由数学期望与方差可以看出:当随机误差服从正态分布时,测量值的数学期望等于真值,随机误差的数学数学期望等于零这与随机误差具有抵偿性是一致的;另外从方差(标准差)的定义可知,它们反映测量值与真值之间的偏离程度,数值越小,偏离程度越小,彼此之间的离散程度越小,反之,离散程度越大。,标准差(均方根误差)和方差2描述正态分布曲线的形状,是恒正值。、2 越大,分布曲线的峰值就越低,图形的形状就越“胖”,分布曲线越平缓,离散程度越大;反之、2越小,分布曲线的峰值越高,图形的形状越“瘦”,分布曲线越陡峭,离散程度越小。标准差(均方根误差)和方差2描述分布曲线的宽窄。,3、随机误差正态分布的实验验证,随机误差是否符合正态分布,可通过以下方法来验证。,统计直方图,例:用单摆测周期。已知单摆周期的约定真值为T=3.01s,用秒表对该摆的周期进行150次测量,数据如下:,可按如下步骤对样本观测值进行处理,(1)数据整理:先将样本值x1,x2,xn 按照由小到大的顺序排列统计;(2)分组:确定分组数k和组距h。分组数不宜过大也不宜过小,通常样本容量的大小选择在7至15之间。n大时可适当增大样本容量;(3)列分组频率分布表:以ni表示观测值落入第i组的频数,则fi=ni/n称为该组的频率,将分组整理的数据列成上页的表格;(4)作频率直方图:在oxy坐标平面上,分别以x轴上各区间(i-1,i为底,以ni或fi为高画出一排竖立的矩形,即频数(率)直方图;(5)作概率密度曲线:将频数(率)直方图中各矩形上的中点连接起来得到一条折线。,若该曲线与正态分布概率密度曲线形式相符,则证明被研究的误差符合正态分布。,根据以上数据绘制出随机误差统计直方图如下:,统计直方图可以很直观的显示误差分布概率密度的形式,但是误差的分布是否严格的符合正态分布,还需要用正态概率纸作图来证明。,二、随机误差的几种非正态分布,当影响测量结果的众多因素中有一个或几个因素影响较大时,构成中心极限定理的条件得不到充分满足,此时产生非正态分布的随机误差。,1、均匀分布,均匀分布又称矩形分布或等概率分布。在误差分布范围-a,+a 内,随机误差取任意一值的概率相等。概率密度函数为,例如,数字化测量仪器误差服从均匀误差,数学期望,证明:,方差及标准差,证明:,误差落在区间 内的概率:,例:求由数据舍入所引起的误差落在 区间内的概率。,2、三角形分布,两个相互独立的具有相同分布范围的均匀分布的随机变量之和仍为随机变量,该随机变量服从三角形分布,又称辛普生(Simpson)分布,即若两随机变量皆在-0.5a,+0.5a上均匀分布且独立,其和在-a,+a 上服从三角形分布。,概率密度函数为,数学期望,方差及标准差,例:已知误差服从三角形分布,求误差落在 区间内的概率。,服从三角形分布的随机误差特征:(1)单峰性(2)对称性(3)有界性(4)抵偿性,在实际测量中,若整个测量过程必须进行两次才能完成,而每次测量的随机误差服从相同的的均匀分布,则总的测量误差为三角形分布误差。例如:进行两次测量过程时数据凑整的误差;用替代法检定标准砝码、标准电阻时,两次调零不准所引起的误差等均为三角形分布。注意:如果对两个随机误差误差限定为不相等的均匀分布求和时,其和的分布规律不再是三角形分布而是梯形分布。,3、反正弦分布,若随机变量是 的正弦函数,即,a为常数,在区间 0,2 上服从均匀分布,则服从反正弦分布。概率密度函数为,数学期望,方差及标准差,例如:仪器度盘偏心引起的角度读数误差。,误差限:,服从反正弦分布的随机误差特征:(1)单峰性(2)对称性(3)有界性(4)抵偿性只不过其峰型成凹型,即小的误差比大的误差出现的几率小。,例:求服从反正弦分布的随机误差落在 区间内的概率。,误差落在区间 内的概率:,4、分布,设随机变量 相互独立,且都服从标准正态分布,随机变量,的概率密度函数为,则称随机变量 服从自由度为 的 分布。,分布的主要特征量为:,分布是t分布和F分布的基础。,其中 可理解为随机变量的个数。由图线可看出,随着自由度的增大曲线接近对称,充分大时,曲线近似正态分布曲线。,自由度指在数学中能够自由取值的变量个数,如有3个变量x、y、z,但x+y+z=18,因此其自由度等于2。在统计学中,自由度指的是计算某一统计量时,取值不受限制的变量个数。首先,在估计总体的平均数时,由于样本中的 n 个数都是相互独立的,从其中抽出任何一个数都不影响其他数据,所以其自由度为n。在估计总体的方差时,使用的是离差平方和。只要n-1个数的离差平方和确定了,方差也就确定了;因为在均值确定后,如果知道了其中n-1个数的值,第n个数的值也就确定了。这里,均值就相当于一个限制条件,由于加了这个限制条件,估计总体方差的自由度为n-1。例如,有一个有4个数据(n=4)的样本,其平均值m等于5,即受到m=5的条件限制,在自由确定4、2、5三个数据后,第四个数据只能是9,否则m5。因而这里的自由度=n-1=4-1=3。推而广之,任何统计量的自由度=n-限制条件的个数。,5、t 分布,设随机变量X与Y相互独立,X服从标准正态分布,Y服从自由度为 的 分布,则定义新的随机变量t为,当测量列的测量次数较少时,其误差分布通常认为服从t分布。,分布的主要特征量为:,概率密度函数为称随机变量t 服从自由度为 的t 分布。,证明:由误差定义,可得,根据正态分布随机误差的抵偿性,当n时,有,因此,等精度测量的算术平均值及标准差,一、算术平均值(arithmetic average)原理,若变量x服从正态分布,且数学期望(或真值)为。当测量次数n足够大时,算数平均值必然趋近于真值。因此对于等精度测量列来讲,全部测量值的算术平均值可以作为待测量的最佳估计值。,由此可见:,如果对某一量进行无限多次测量,就可得到不受随机误差影响的测量值,或其影响甚微,可予忽略。这就是当测量次数无限增大时,算术平均值被认为是最接近于真值的理论依据。由于实际上都是有限次测量,那么算术平均值还是不是被测量的最佳值呢?,举例说明:设重复测量某量值5次,5个测得值分别是1,2,3,4,5。求得算术平均值为 以 为准,求各测得值偏离 的误差得平方和QQ,注意:算术平均值原理仅适用于对同一量的等精度测量数据的处理。,随便用任何一个不同于 的数,代替3作上面同样的计算,所得的 必定大于Q,即用算术平均值代入计算得到的Q是最小值。,2.残差的性质:,a计算过程中不存在舍入误差时:,b计算过程中存在舍入误差时:,1.残差(residual error):测量值与算术平均值之差。,二、残余误差(残差),当n为奇数时,当n为偶数时,式中为 的舍入误差,A 为修约间隔,即为实际求得算术平均值末位数的一个单位。,(1)关于残差代数和,利用残差的上述性质,可以校核算术平均值及其残差计算的正确性。,例1:测量某物理量10次,测量结果如下表示,求算术平均值,并对计算结果进行校核。,说明:当测量列中的测量次数和每个测量数据的位数皆较多时,可用简便方法计算算术平均值。方法是:任选一个接近测得值的数x0作为参考值,计算每个测得值xi与x0差值 xi=xixo i=1,2,n 因为,所以有,解:任取参考值x0=1879.65(m),计算差值 和 列于表中,很容易求得因为n为偶数,由表可知故计算结果正确。,例:已知测量列求其残余误差。,残余误差分别为:,计算过程无误。,(2)残差的平方和具有最小值。,它构成了最小二乘法的理论依据,也是组合测量和曲线拟合的理论基础。,测量的标准偏差简称标准差,也称之为均方根误差。由于随机误差的存在,等精度测量列中各个测得值一般皆不相同,它们围绕着该测量列的平均值有一定分散,此分散度说明了测量列中单次测得值的不可靠性,必须用一个数值作为其不可靠性的评定标准。,三、测量的标准差(standard deviation),而标准差决定正态分布曲线的形状。越小,曲线越高而陡;越大,曲线越低而平坦。这说明标准差表征被测量的测量值围绕真值的离散性。因此,标准差可作为测量列中单次测量不可靠性的评定标准。,(一)测量列单次测量的标准差,在等精度测量列中,单次测量列的标准差可按公式计算:,证明:,测量列中每个测量值都可以看作随机变量X的取值,根据离散性随机变量方差的定义:,Pi为每个测量值出现的概率,对于等精度测量,每个测量值出现的概率相同,即:,代入上式得:,注意:,不是测量列中任何一个具体测得值的误差,只是用来表示一定条件下等精度测量列随机误差的概率分布情况。在该条件下,任一单次测得值的随机误差都不等于,但是我们可以认为这一系列测量中所有测得值都属同样的一个标准差的概率分布。,和测量条件(仪器、环境、方法、人员等)有关。,(二)标准差的计算(估算)法,1.贝塞尔公式(Bessel Formula),证明:,两边平方求和得,对于一测量列可用算术平均值来代替真值计算残差:,又因为,若各误差之间相互独立,根据误差的抵偿性,在n时,可认为,所以,故,即,贝塞尔公式,例:用一游标卡尺测量一长度L10次。数据为:,22.62,22.66,22.67,22.62,22.63,22.69,22.66,22.61,22.64,22.70,假设已排除了系统误差和粗大误差。,求:算术平均值及单次测量的标准差。,解:,求算术平均值:,计算残差并校核:-0.03,+0.01,+0.02,-0.03,-0.02,+0.04,+0.01,-0.04,-0.01,+0.05,求标准差:,经校核:,,计算过程正确。,2.极差法(extreme difference),主要思路:找出各测量值的最大值和最小值,计算它们的差(即极差)。,根据统计方法,极差与标准差之间的关系为,dn是与测量次数有关的量,可查表得到。,dn取值表,例:用一游标卡尺测量一长度L10次。数据为22.62,22.66,22.67,22.62,22.63,22.69,22.66,22.61,22.64,22.70,若已排除了系统误差和粗大误差。用极差法计算标准差。,解:,极差,查表得,特点:极差法迅速、简便,在n小于10时具有一定的精度,当大于10时不宜采用。,1/Kn和1/Kn数值表,3.最大误差法,当被测量的真值可以预测时,,当被测量的真值不可以预测时,,解:,查表得,特点:最大误差法简单、方便,容易掌握,并且当n小于10时,具有一定的精度,在进行一次测量时,特别适用。,例:用一游标卡尺测量一长度L10次。数据为:,22.62,22.66,22.67,22.62,22.63,22.69,22.66,22.61,22.64,22.70,假设已排除了系统误差和粗大误差。,按最大误差法求标准差。,三种方法比较;最大误差法和极差法简便易行,特别是当n小于10时,具有一定的精度,但其可靠性比贝塞尔公式要低,当几种计算方法的结果出现矛盾时,应以贝塞尔公式为准。,(三)算术平均值的标准差,算术平均值的标准差是表征同一被测量的各个独立测量列算术平均值分散性的参数,可作为算术平均值不可靠性的评定标准。或,证明:,因各次测量值之间相互独立,根据方差性质,因等精度测量,所以,用残差表示,算术平均值的标准差的估算公式为:,可简化为:,增加测量次数可以提高测量精度,当n10以后,已减少得非常缓慢,要提高测量精度,应采用适当精度的仪器,选取合适的测量方法。,例:测量温度得到11个测量值(单位:),数据如下:528,531,529,527,531,533,529,530,532,530,531 求:算术平均值及其标准差。,解:,算术平均值,方差,标准差,由数据可得:,概率积分与极限误差,一、概率积分,定义:概率积分就是在给定误差区间1,2上对已知概率密度函数 积分并求出概率。,若误差服从正态分布,且误差区间对称,则,引入新变量,则:,为拉普拉斯函数。,其中,P为置信概率,t为置信系数。超出范围的误差概率=1-P为显著度。,例:求正态分布的随机误差在置信区间-t,+t内的概率,其中t分别为1,2,3。,解:,,查附表1可得,,查附表1可得,,查附表1可得,二、极限误差,当测量结果的误差超出某一误差的概率很小时,此误差为极限误差,极限误差又称极端误差。,正态分布的随机误差,单次测量的极限误差一般为,如果测量列算术平均值的误差满足正态分布,则,实际测量中,根据不同的要求也可取其它t值来表示极限误差。如取t=2.58,P=99%;t=1.96,P=95%等。因此,一般情况下,测量列单次测量的极限误差表示为,算术平均值的极限误差表示为,例:已知某测量的标准差=0.2,求极限误差为0.4时所对应的置信概率和置信系数。,解:,例:已知某测量的标准差=0.2,求置信概率99%的置信系数及极限误差。,解:,由置信概率P=99%,可得(t)=0.495,查表可得(2.58)=0.495,即置信系数为t=2.58,极限误差为lim=2.58=2.580.20.52,需要指出,上面公式是在测量次数比较多,分布满足正态分布,且标准差已知的前提下导出的结果。通常情况下标准差是未知的,只能根据有限次测量的n个测得值得到估计值,当n20时,测量值不再服从正态分布,而是服从t分布,这时置信系数t应按t分布计算。,按t分布计算单次测量的极限误差应为:,按t分布计算测量列算术平均值的极限误差应为:,一般情况下,当测量次数n20时按正态分布来处理。,置信系数可由给定的置信概率 P=1-(为置信度)和自由度=n-1查表确定。,例:对某工件进行5次测量,测量列的标准误差估算值为5m,求置信概率P=95%时的极限误差。,解:,由已知得自由度=4,显著度=1-p=0.05,查t分布表得t=2.78,极限误差为,习 题,1、比较误差与残余误差的概念。,2、比较贝塞尔公式、极差法及最大误差法的优缺点。,3、对某量进行6次等精度测量,结果如下:33.3,32.7,32.4,33.5,33.1,33.0。(1)用三种方法计算单次测量的标准偏差。(2)求算术平均值的标准差。,4、对某量等精度测量12次,得算术平均值,其单次测量的标准差为,取 和 时,用t分布求算术平均值的标准差及其极限误差。,2.2 系统误差,研究系统误差的重要性:,研究系统误差是研究随机误差基本前提。即我们认为误差的出现是随机的,完全排除了系统误差的影响。,系统误差具有确定的变化规律,但没有一种通用的处理方法,处理起来要比随机误差困难的多,必须认真研究。,对于系统误差的研究,可以发现一些新事物。例如惰性气体的发现。,系统误差的来源,测量装置。原因:仪器设计、制造、安装缺陷。,测量环境。原因:实际环境条件偏离规定的测量条件。,测量方法。原因:采用了近似的测量方法或近似计算。,测量人员。原因:测量者自身的生理特点。,系统误差的特征:系统误差产生在测量之前,存在于测量过程中;系统误差呈现一定的规律性,总可归结为一个或几个因素的函数。如时间,温度等的函数;只要测量条件相同,系统误差是可以重现的,同时决定了它具有可修正的特点。,系统误差的分类,从变化规律方面来进行分:,一、定值系统误差(fixed systematic error),测量过程中误差的大小和符号始终保持不变。例如,零点不准、视差及标准仪器误差等所带来的误差。,二、变值系统误差(variable systematic error),在测量过程中,误差的大小和符号随着测量位置、时间、温度等条件的变化而发生有规律的变化。,1.线性变化的系统误差(linear systematic error),测量过程中,误差随时间、温度、质量等的变化而呈线性变化。如测量某一电阻,电阻误差与温度变化之间的关系为,为电阻温度系数,为温度变化值)。,和 呈线性关系。温度变化引起钢尺刻度的变化,等等。,2.周期性变化的系统误差(periodic systematic error),测量过程中,误差的大小和符号随时间或有关因素呈周期性规律变化。最常见的有正弦(余弦)变化规律。例如,仪表回转中心与刻度盘中心有偏心差e,则指针在任意角度 时,所引起的示值误差即为周期性误差,即。(如图所示),指针在0或180 时,误差为0,指针在90或270时,误差绝对值最大,为e。,3.复杂规律变化的系统误差(complicated systematic error),误差的变化规律非常复杂,很难用数学表示式来表示,一般只用经验公式或实验曲线表示。例如,导轨的直线度误差,直流电表指针偏转角与偏转力矩不能保持严格的线性关系,而表盘仍采用均匀刻度所造成的误差。,系统误差对测量结果的影响及其发现,一、系统误差对测量结果的影响,(一)定值系统误差对测量结果的影响,1.对算术平均值的影响,设对真值为 的某物理量等精度测量n次,得到测量列,若测量值同时含有定值系统误差 和随机误差,则有,当测量次数足够多,即,结论:定值系统误差只影响测量值的算术平均值,使算术平均值增加或减小,但对误差的分布没有影响。即:只影响误差分布曲线在X轴上的位置,而不影响分布曲线的形状。,当测量次数足够多,即,因此,2.对残差的影响,(二)变值系统误差对测量结果的影响,1.对算术平均值的影响,设对真值为 的某物理量等精度测量n次,得到测量列,若测量值同时含有变值系统误差 和随机误差,则有,2.对残差的影响,结论:变值系统误差不仅对测量结果的算术平均值有影响,而且还影响误差的分布规律和分布范围。,二、系统误差的发现,(一)定值系统误差,1.实验对比检定法,在确信没有明显的变值系统误差的前提下,通过改变产生系统误差的条件(通常是改用更高准确度的仪器和基准),在不同的条件下进行检定性测量,通过比较来发现系统误差。,例,用千分尺重复测量名义值 的轴n次,得的算术平均值为,另用准确度更高的标准量块在测微仪上测量该轴n次,得的算术平均值为,则用千分尺测量存在的定值系统误差为,2、计算数据比较法,即,若,则可认为有定值系统误差存在。,的极限误差,任取两组测量数据,,当P 选取99.73%时,t=3,公式可变为:,该方法常用来验证理论计算公式、鉴定测量方法和新设计的测量仪器。,例:在不同条件下测量某一长度量,第一组测得值=7.0247mm,=0.1m;第二组测得值=7.0259mm,=0.2m。试判断测量量中有无定值系统误差。(已知无变值系统误差存在),解:,按正态分布,取置信概率为99.73%,则t=3,则,说明两组测量中含有定值系统误差。,例:化学家雷莱(Rayleigh)曾利用不同方法制取氮气,由化学方法制取的氮,其平均密度和标准差为2.29971和0.00041;从大气中提取的氮,其平均密度和标准差为2.31022和0.00019。,解:,取置信概率P=99.73%来判断,有,故可判断其中一定有系统误差,经检查排除了由于操作技术等原因产生的系统误差的可能性后,强调了两种方法存在的差别。后经进一步分析,发现了惰性气体的存在。,(二)变值系统误差的发现,1、残差观察法,残差观察法是利用测量列的各个残余误差的大小和符号的变化规律,直接由误差数据表或误差曲线图形来判断有无系统误差,一般适用于有规律变化的变值系统误差。具体如下(1)若残差的正负大体相同,且无显著的变化规律,则无系统误差。如下页图a(1)将测量序列依次排队,如果残差的大小有规律地向一个方向变化,且符号为()或(),说明测量中存在线性系统误差。(如下页图b)(2)将测量序列依次排队,如果残差符号做有规律地周期性的交替变换,则测量中存在周期性系统误差。如果有微小波动,说明在周期性系统误差出现的同时还有随机误差的影响。(如下页图c),判断复杂规律的系统误差是否存在变值系统误差时,测量的数据不多时用残差观察法难以确定。应加大测量次数(n200),绘制统计直方图,观察是否符合预期的随机误差分布规律,如符合,则表明没有变值系统误差。,(c)周期性系统误差,(a)无系统误差,(b)线性系统误差,2、残差校核法马利科夫准则,假设测量列中存在线性变化的系统误差,将测量值按先后顺序排列,并将前后各半分成两组,然后将两组的残差求和再相减。,已知,则,当测量次数较多时,由随机误差性质得,所以,因此,当 显著不为零时,则说明测量结果中存在线性系统误差。,测量结果中存在变值系统误差时,。,而,例:测量一电阻10次,数据如表,试判断有无系统误差。,电阻测量数据表,解:,残差观察法,从表中数据看出,残差的值由小到大,符号由负变正,初步判断有线性变化系统误差存在。,马利科夫准则,由于差值显著不为零,故测量中存在线性变化的系统误差。,3、阿贝赫梅特(Abbe-Helmert)准则,阿贝准则:,设按测量的先后顺序得测量误差列,定义三个量:,阿贝赫梅特准则是在阿贝准则的基础上完善的,适合检验周期性系统误差的存在。,其中,令,置信系数t取1,得到阿贝准则的限差,若 则怀疑有周期性系统误差。此为阿贝准则。,假定测量列服从正态分布,且各测量误差之间相互独立,则变量C的数学期望、方差和标准差为:,由此,得到变量C的极限误差为:,注意:在实际测量中误差i未知,2也未知,故通常用残差代替i,用S2代替2进行判断。则相应的有如下关系式,阿贝赫梅特准则:,阿贝-赫梅特准则的限差,若 则怀疑有周期性系统误差。,例:测量一电感10次,结果(单位:mH)分别为30.42,30.44,30.50,30.53,30.51,30.42,30.43,30.49,30.49。试判断系统有无系统误差。,解:,算术平均值,残差,-0.06,-0.04,+0.02,+0.05,+0.03,-0.06,-0.05,+0.01,+0.05,+0.05,残差观察法,作 图,阿贝赫梅特准则,因为,故可以判断有系统误差存在。,由于产生系统误差的原因很复杂,影响系统误差的因素也是多方面的,因此系统误差的发现方法除了上面介绍的几种外,还有其它的方法,如秩和检验法、t检验法等,可参考有关文献。,上述方法各具有不同的特点,但都有一定的局限性。,系统误差的减小和消除,一、消除误差源法(实验前),从产生误差根源上消除系统误差是最理想的方法。主要从以下几方面考虑:标准器件的可靠性;仪器的工作状态;仪器安装、调整、接线;测量方法和计算方法;环境条件和被测对象;测量人员等。,二、引入修正值法(实验后),前提:大小和方向可确定的已定系统误差。关键:确定修正值。方法:检定法。例:采用高一等的标准砝码对标称值为1kg的标准砝码进行检定,经多次测量其平均值(即相对真值)为1.002kg。则其修正值为:,三、改进测量方法(实验中),(一)定值系统误差,1、替代法(又称置换法),实质:在一定条件下,对某一被测量进行测量后,不改变测量条件,再以一个同性质的已知标准量代替被测量,并使仪器呈现与以前相同的状态,此时的标准量即等于被测量值。,例2:欲测量某检流计内阻 Rg,可采用如下线路图。,2、零示法,实质:在测量过程中,使被测量的作用效应与已知量的作用效应相当(即达到平衡),减小定值系统误差。,例1:利用平衡电桥测电阻。,例2:利用电位差计测电动势。,注意:测量结果中的误差主要取决于标准器的误差,因此零示器必须有足够高的灵敏度。,3、导号法,实质:改变测量中的某些条件(如改变测量方向、电压的极性等),保证其他条件不变,使两次测量结果中的系统误差的符号相反,数值相等,取平均值作为最后的测量结果,可以消除系统误差。,例:灵敏电流计(光点反射式)测微弱电流。若起始零点不准(指针指在处),4、交换法,实质:它是将被测量与标准量的位置互换,进行两次测量,使产生定值系统误差的因素对测量结果的影响起相反作用,从而消除系统误差。,例1:采用高斯双重称量法测重物 m,如图所示:,5、差值法,实质:利用测量量的差值求未知量以消除定值系统误差。,例1:通过测x、y求y=ax中的a时,若测y的过程存在定值系统误差y,测1次得 x测,y测=y+y,显然用式,得到的a存在误差。,若改变x测两次,得 x测1,y测1=y1+y x测2,y测2=y2+y则由式,所得a与y无关,结果正确。,例2:拉伸法测钢丝的倔强系数。,改变力测两次:,两式相减得:,倔强系数与原长无关。,2、周期性系统误差半周期读数法,实质:对于周期性系统误差,相隔半个周期进行测量,取两次读数的平均值作为测量结果。,周期性系统误差一般可表示为,当=1时,误差为,当=1+时,误差为,取平均值,例:通常在测角仪刻度盘的对径的两个刻度上(即相隔180度)各装一个游标。例如分光计仪器,目的就是为了消除由于偏心差所引起的周期性系统误差。,在可能的条件下,引导系统误差的符号、绝对值发生随机变化,以便在多次测量求平均值时,可把系统误差抵消或部分消除。,例:米尺测某一长度时,用不同的刻度位置去测量该长度的值。,(三)引导系统误差随机化,四、系统误差的消除准则,假设最后残余的系统误差为,根据保留有效数字的舍入原则,只要当 不超过总的系统误差绝对值 的有效数字末位的1/2个单位,即可忽略不计。,例:,思考:当总的系统误差为下列值时,残余误差的最大值。,2.3粗大误差,粗大误差的来源,粗大误差又称疏失误差或过失误差,它的绝对值与其它测量值的误差分量相比明显偏大,即明显歪曲测量结果,又称坏值,在数据处理时应予以剔出。,2、客观外界条件的因素,1、测量人员的主观因素,测量过程中,由于测量条件突然改变引起仪器示值跳动。如,测量过程机械冲击振动、电压不稳、电磁干扰及温度的骤升和骤降等,此时的测量值均含有异常值。,由于测量者在测量时的疏忽所造成的读数误差、记数误差、错误计算、错误操作以及使用有缺陷的计量器具等。,粗大误差是由测量过程中某些突变因素所造成的。,可疑值的处理原则,1、直观判断,及时剔出,2、增加测量次数,继续观察,3、用统计方法进行判别,4、保留不删,确保安全,粗大误差的统计判别方法,基本思想:根据误差出现的统计规律,给定显著水平(或置信概率),确定其随机误差的分布范围,凡是超过这个范围的误差,就认为不属于随机误差范畴,而是粗大误差,相应的测量值为异常值,应予以剔除。,(一)莱以达(3)准则,对某一物理量等精度测量n次,得一测量列xi(in),如果测量值仅含有随机误差,,前提条件:测量值不含有系统误差,随机误差服从正态分布。,认为该测量值含有粗大误差,为异常值,可以剔除。,若,或,特点:莱以达准则简便、保险但非常保守,无须查表,适合于大样本n 30。样本容量n30时,异常值难以检出,只能做粗略的判别;当n10时,即使存在粗大误差也判别不出来。证明如下:,证明:,取n10,则,例:对恒温室标准温度测量15次,测量值 Ti如表,试判断有无坏值。,残,残,(二)格拉布斯准则,为了检验 xi(i=1,2,n)是否含有粗大误差,可将xi值按其值的大小排成顺序统计量x(i),即,x(1)x(2)x(n-1)x(n),建立顺序统计量,格拉布斯导出了顺序统计量确切分布。因此,给定显著水平(一般取0.05或0.01)和n后,通过查表就可以找出格拉布斯统计量的临界值g0(n,)。,对某一物理量等精度测量n次,得一测量列xi(in),如果测量值仅含有随机误差,且测量值服从正态分布。分别计算算术平均值、残差及标准差的估计值。,选择g(1)、g(n)数值较大的,当满足,可认为小概率事件出现,说明x(i)含有粗大误差,应予剔除。,格拉布斯准则临界值g0(n,)表,注意:格拉布斯准则每次只能剔除一个可疑值,剔掉一个可疑值后,应再重新进行计算判断,直到判定无可疑值为止。,例:试用格拉布斯准则判断上例测量值中有无异常值。,解:,测量值按大小排列顺序 T(1)=20.30,T(15)=20.43,显然x(1)最可疑,计算其统计量,选定显著水平=0.05,查表得,所以第八个数据T8含有粗大误差,应舍去。,T8剔除后,重复上述检验步骤,可以发现,新测量列已无粗大误差。,(三)罗曼诺夫斯基准则 t检验准则,在测量次数较少时,按t分布的数据分布范围来确定粗大误差的界限较合理。,t检验准则思路:,在n次重复测量中,先将某个可能存在粗大误差的可疑测量值剔除,然后按t分布对该值进行检验。,检验过程:,等精度独立测量值为x1,x2,xn,若其中某个数据xm被怀疑含有粗大误差,可首先将该数据剔除,然后按余下的n-1个数据计算平均值及标准差的估计值,即,根据选定的显著水平和测量次数n,在表中找出t检验系数k(n-1,)。,若,说明将xm剔除是合理的、正确的,否则不能认为该测量值含有粗大误差,应重新将其收入测量列。,罗曼诺夫斯基准则检验系数k(n-1,)表,例:试用罗曼诺夫斯基准则判断上例测量值中有无异常值。,解:,将最可疑的第8个数据剔除。由余下的测量值可得,选取显著水平=0.05,剔除一测量值后,测量次数为14,查表得,k(14,0.05)=2.26,故测量值 T8含有粗大误差,应予以剔除。,剔除T8以后,重复上述步骤进行判断,测量值不再含有粗大误差。,一般性检验过程:,选择检验规则,计算统计量。指定异常值检出的显著水平。确定统计量的临界值。一般用显著水平和子样容量(或自由度)来确定。作出判断。即某测量值的统计量大于临界值,则为异常值。剔除异常值后,重新建立测量值的统计量,继续判断,直至没有异常值。,注意:若判断出的异常值过多,应对样本的代表性进行检验,确认假设分布是否合理,所采用的方法是否得当。,1、算术平均值,2、测量列(单次测量)的标准差为,3、标准差的估算方法:,贝塞尔公式,极差法,最大误差法,真值已知,真值未知,当测量次数n趋于无穷时,算术平均值趋于真值。,描述随机误差分散性的指标。,一、随机误差,小 结,4、算术平均值标准差的估计值,5、置信概率,6、单次测量的极限误差,二、系统误差,(一)定值系统误差,1、实验对比检定法:采用更好的测量条件进行检定性测量。,2、计算数据比较法:,定值系统误差只影响测量结果算术平均值,不影响随机误差的分布规律。,定值系统误差的发现方法:,置信系数,认为有定值系统误差存在,(二)变值系统误差,1、残差观察法,2、马里科夫准则:判定线性系统误差,3、阿贝-郝梅特准则:判定周期性系统误差,取变量,当取置信系数为1时,,变值系统误差不仅影响测量结果算术平均值,而且还影响随机误差的分布规律。,当 显著不为零时,则说明测量结果中存在线性系统误差。,4、系统误差的消除与减小方法,定值系统误差:零示法、导号法、交换法、替代法、差值法,变值系统误差:对称测量法、半周期法,另外还可以引导系统误差随机化。,三、粗大误差,(一)物理判别方法,(二)统计判别方法,1、莱以达准则,2、格拉布斯准则 其中,3、罗曼诺夫斯基准则,其中,k(n-1,),其中,例:对某一长度测量9次,假定无定值系统误差存在,得到下列数据,求测量结果。,长度测量数据表,2.5非等精度测量的数据处理,非等精度测量是指在测量的过程中,参与测量的五个要素(装置、方法、环境、人员和被测对象)除被测对象不能改变外,其它四个要素发生改变所进行的测量,又称复现性测量。,常见的非等精度测量有以下两种情况:,1、在相同的条件下,对同一被测量进行m组等精度测量,每组的测量次数不相同,为一非等精度测量列。,2、在不同的测量条件测量,测量结果的标准偏差各不相同,所得的测量列 为非等精度测量列。,一、权、单位权及加权平均值,1.权:是测量结果在相互比较时各自的信赖程度,是它们取平均值时各自所占的比例,记为。可信赖程度越高的数据,权越大,在最后结果中所占的比重越大。方差可以表示测量结果的可信赖程度,方差越小,测量结果的可信赖程度越高,该数据的权越大。即测量结果的权与各自的方差成反比。,等精度测量列,各测量值的标准差相等,权也就相等,因此,等精度测量又称等权测量,它是非等精度测量的特例。,权的性质:,(1)各数据的权同时扩大或缩小同一倍数不影响测量数据的处理结果,即权的大小是相对的。,为非等精度测量数据的标准差,为对各数据一致的常数,可根据方便任意选定。,(2)权的数值应与测量精度相联系,精度越高的数据权就越大,而精度越低的数据权就越小,证明:,的算术平均值,,即,其标准差为,是等精度测量的标准差。由于,同理数据 的权为,所以,即权与等精度测量次数成正比。,(3)若非等精度测量数据是由等精度测量不同测量次数的数据平均所得,则权与求得该平均的等精度测量次数成正比。,2.单位权,由于 是等精度测量各数据的标准差,因此每个数据xij 的权都是一致的,皆为,令等精度测量各数据权为1,即p=1,称为单位权,则,另外,上式可以理解为任一非等精度测量数据都可认为是由 ni 个等精度测量数据求平均所得。,3.加权平均值,若有m个非等精度测量数据xi(i=1m),每个数据的权为pi,则这些数据可以看成是m组等精度测量的最佳值。,每个数据可等效为全部等精度测量数据的算术平均值,即加权平均值:,全部等精度测量数据的算术平均值应是最佳取值,即,对于等精度测量,各数据权相等,即 p1=p2=pm=p,因此,说明等精度测量的算术平均值是非等精度测量在权值相等时的特例。,二、单位权化及加权平均值的标准差,非等精度测量中,有时为了计算方便,可将非等精度测量列转化为等精度测量列,这样可以用等精度测量的有关公式来处理非等精度测量结果。采用的方法是将权数不同的非等精度测量列转化为具有单位权的等精度测量列,即所谓的单位权化。,1、单位权化:使任何一个非等精度随机变量乘以自身权数的平方根,所得到的新变量的权数为1。,设测得值为y