试验误差与数据处理.ppt
《试验误差与数据处理.ppt》由会员分享,可在线阅读,更多相关《试验误差与数据处理.ppt(131页珍藏版)》请在三一办公上搜索。
1、第2章 误差的性质与处理,2.1 随机误差,2.2 系统误差,2.3 粗大误差,2.4 直接测量的数据处理步骤,主要内容:,2.1 随机误差,随机误差产生的原因,随机误差的特性,随机误差是由众多的,变化微小的因素所造成的。,1、随机性。,3、随机误差服从统计规律,增加测量次数可减小随机误差对测量结果的影响。,2、随机误差产生在测量过程中。,例如,压力、温度、磁场、仪器装置及测量人员等因素的影响。,随机误差处理的基本原则,随机误差处理的理论依据是概率论与数理统计。具体参量可用随机变量的数学期望、方差和置信概率等特征量来表示。,实验测量的目的是通过实验数据的分析以及借助于数学工具对数据进行整理,从
2、而获得研究过程的数学模型或者求得某一被测量的真值。一切由不确定的随机因素所造成的随机误差,它的大小及正负,在其出现之前是不可预估的。随着测量次数的增加,各数据随机误差的大小及正负符合统计规律。实验数据处理的任务就是要在测量的随机数据中寻找有关的规律。通过大量的实验研究发现,尽管随机误差的分布规律多种多样,但多数服从或近似服从正态分布。,2.1.1 随机误差的分布,一、正态分布(Normal distribution),1、正态分布的特性,正态分布又称高斯分布,因为德国数学家高斯(Gauss)在研究误差理论时,较早地引入了这种分布。根据概率论的中心极限定理,几种非正态误差共同作用的结果也将使总误
3、差趋向正态分布。假定在某一相同条件下的测量列为x1、x2、xn,x0为真值,其它误差(主要指系统误差和粗大误差)可以忽略,该测量值的随机误差为,则服从正态分布的随机误差和测量值的概率密度函数分别为,正态概率密度函数的是一条钟形曲线,称为正态(高斯)曲线。正态曲线(服从正态分布的随机误差)具有如下性质:(1)单峰性:绝对值小的误差比绝对值大的误差出现的概率大。,(2)对称性(抵偿性):绝对值相等且符号相反的误差出现的概率相同。(3)有界性:在一定测量条件下,不可能出现无限大的随机误差。,这与随机误差具有抵偿性是一致的。,2、正态分布随机误差的数字特征 能准确描述服从正态分布随机变量(测量值)及其
4、误差的统计规律通常用两个参数数学期望和方差(或标准差)。(1)数学期望数学期望的本质含义是:随机变量(误差)分布的中心位置,也就是随机变量(误差)概率密度分布曲线的重心位置。说明了随机变量(误差)分布的集中情况,是对概率分布的一种估计。服从正态分布的测量值和随机误差的数学期望为,证明,当实验次数增大时,随机变量X观测值的算术平均值 将在x的数学期望附近摆动,因此在实际工作中往往用算术平均值代替随机变量的数学期望。(2)方差及标准差,由数学期望与方差可以看出:当随机误差服从正态分布时,测量值的数学期望等于真值,随机误差的数学数学期望等于零这与随机误差具有抵偿性是一致的;另外从方差(标准差)的定义
5、可知,它们反映测量值与真值之间的偏离程度,数值越小,偏离程度越小,彼此之间的离散程度越小,反之,离散程度越大。,标准差(均方根误差)和方差2描述正态分布曲线的形状,是恒正值。、2 越大,分布曲线的峰值就越低,图形的形状就越“胖”,分布曲线越平缓,离散程度越大;反之、2越小,分布曲线的峰值越高,图形的形状越“瘦”,分布曲线越陡峭,离散程度越小。标准差(均方根误差)和方差2描述分布曲线的宽窄。,3、随机误差正态分布的实验验证,随机误差是否符合正态分布,可通过以下方法来验证。,统计直方图,例:用单摆测周期。已知单摆周期的约定真值为T=3.01s,用秒表对该摆的周期进行150次测量,数据如下:,可按如
6、下步骤对样本观测值进行处理,(1)数据整理:先将样本值x1,x2,xn 按照由小到大的顺序排列统计;(2)分组:确定分组数k和组距h。分组数不宜过大也不宜过小,通常样本容量的大小选择在7至15之间。n大时可适当增大样本容量;(3)列分组频率分布表:以ni表示观测值落入第i组的频数,则fi=ni/n称为该组的频率,将分组整理的数据列成上页的表格;(4)作频率直方图:在oxy坐标平面上,分别以x轴上各区间(i-1,i为底,以ni或fi为高画出一排竖立的矩形,即频数(率)直方图;(5)作概率密度曲线:将频数(率)直方图中各矩形上的中点连接起来得到一条折线。,若该曲线与正态分布概率密度曲线形式相符,则
7、证明被研究的误差符合正态分布。,根据以上数据绘制出随机误差统计直方图如下:,统计直方图可以很直观的显示误差分布概率密度的形式,但是误差的分布是否严格的符合正态分布,还需要用正态概率纸作图来证明。,二、随机误差的几种非正态分布,当影响测量结果的众多因素中有一个或几个因素影响较大时,构成中心极限定理的条件得不到充分满足,此时产生非正态分布的随机误差。,1、均匀分布,均匀分布又称矩形分布或等概率分布。在误差分布范围-a,+a 内,随机误差取任意一值的概率相等。概率密度函数为,例如,数字化测量仪器误差服从均匀误差,数学期望,证明:,方差及标准差,证明:,误差落在区间 内的概率:,例:求由数据舍入所引起
8、的误差落在 区间内的概率。,2、三角形分布,两个相互独立的具有相同分布范围的均匀分布的随机变量之和仍为随机变量,该随机变量服从三角形分布,又称辛普生(Simpson)分布,即若两随机变量皆在-0.5a,+0.5a上均匀分布且独立,其和在-a,+a 上服从三角形分布。,概率密度函数为,数学期望,方差及标准差,例:已知误差服从三角形分布,求误差落在 区间内的概率。,服从三角形分布的随机误差特征:(1)单峰性(2)对称性(3)有界性(4)抵偿性,在实际测量中,若整个测量过程必须进行两次才能完成,而每次测量的随机误差服从相同的的均匀分布,则总的测量误差为三角形分布误差。例如:进行两次测量过程时数据凑整
9、的误差;用替代法检定标准砝码、标准电阻时,两次调零不准所引起的误差等均为三角形分布。注意:如果对两个随机误差误差限定为不相等的均匀分布求和时,其和的分布规律不再是三角形分布而是梯形分布。,3、反正弦分布,若随机变量是 的正弦函数,即,a为常数,在区间 0,2 上服从均匀分布,则服从反正弦分布。概率密度函数为,数学期望,方差及标准差,例如:仪器度盘偏心引起的角度读数误差。,误差限:,服从反正弦分布的随机误差特征:(1)单峰性(2)对称性(3)有界性(4)抵偿性只不过其峰型成凹型,即小的误差比大的误差出现的几率小。,例:求服从反正弦分布的随机误差落在 区间内的概率。,误差落在区间 内的概率:,4、
10、分布,设随机变量 相互独立,且都服从标准正态分布,随机变量,的概率密度函数为,则称随机变量 服从自由度为 的 分布。,分布的主要特征量为:,分布是t分布和F分布的基础。,其中 可理解为随机变量的个数。由图线可看出,随着自由度的增大曲线接近对称,充分大时,曲线近似正态分布曲线。,自由度指在数学中能够自由取值的变量个数,如有3个变量x、y、z,但x+y+z=18,因此其自由度等于2。在统计学中,自由度指的是计算某一统计量时,取值不受限制的变量个数。首先,在估计总体的平均数时,由于样本中的 n 个数都是相互独立的,从其中抽出任何一个数都不影响其他数据,所以其自由度为n。在估计总体的方差时,使用的是离
11、差平方和。只要n-1个数的离差平方和确定了,方差也就确定了;因为在均值确定后,如果知道了其中n-1个数的值,第n个数的值也就确定了。这里,均值就相当于一个限制条件,由于加了这个限制条件,估计总体方差的自由度为n-1。例如,有一个有4个数据(n=4)的样本,其平均值m等于5,即受到m=5的条件限制,在自由确定4、2、5三个数据后,第四个数据只能是9,否则m5。因而这里的自由度=n-1=4-1=3。推而广之,任何统计量的自由度=n-限制条件的个数。,5、t 分布,设随机变量X与Y相互独立,X服从标准正态分布,Y服从自由度为 的 分布,则定义新的随机变量t为,当测量列的测量次数较少时,其误差分布通常
12、认为服从t分布。,分布的主要特征量为:,概率密度函数为称随机变量t 服从自由度为 的t 分布。,证明:由误差定义,可得,根据正态分布随机误差的抵偿性,当n时,有,因此,等精度测量的算术平均值及标准差,一、算术平均值(arithmetic average)原理,若变量x服从正态分布,且数学期望(或真值)为。当测量次数n足够大时,算数平均值必然趋近于真值。因此对于等精度测量列来讲,全部测量值的算术平均值可以作为待测量的最佳估计值。,由此可见:,如果对某一量进行无限多次测量,就可得到不受随机误差影响的测量值,或其影响甚微,可予忽略。这就是当测量次数无限增大时,算术平均值被认为是最接近于真值的理论依据
13、。由于实际上都是有限次测量,那么算术平均值还是不是被测量的最佳值呢?,举例说明:设重复测量某量值5次,5个测得值分别是1,2,3,4,5。求得算术平均值为 以 为准,求各测得值偏离 的误差得平方和QQ,注意:算术平均值原理仅适用于对同一量的等精度测量数据的处理。,随便用任何一个不同于 的数,代替3作上面同样的计算,所得的 必定大于Q,即用算术平均值代入计算得到的Q是最小值。,2.残差的性质:,a计算过程中不存在舍入误差时:,b计算过程中存在舍入误差时:,1.残差(residual error):测量值与算术平均值之差。,二、残余误差(残差),当n为奇数时,当n为偶数时,式中为 的舍入误差,A
14、为修约间隔,即为实际求得算术平均值末位数的一个单位。,(1)关于残差代数和,利用残差的上述性质,可以校核算术平均值及其残差计算的正确性。,例1:测量某物理量10次,测量结果如下表示,求算术平均值,并对计算结果进行校核。,说明:当测量列中的测量次数和每个测量数据的位数皆较多时,可用简便方法计算算术平均值。方法是:任选一个接近测得值的数x0作为参考值,计算每个测得值xi与x0差值 xi=xixo i=1,2,n 因为,所以有,解:任取参考值x0=1879.65(m),计算差值 和 列于表中,很容易求得因为n为偶数,由表可知故计算结果正确。,例:已知测量列求其残余误差。,残余误差分别为:,计算过程无
15、误。,(2)残差的平方和具有最小值。,它构成了最小二乘法的理论依据,也是组合测量和曲线拟合的理论基础。,测量的标准偏差简称标准差,也称之为均方根误差。由于随机误差的存在,等精度测量列中各个测得值一般皆不相同,它们围绕着该测量列的平均值有一定分散,此分散度说明了测量列中单次测得值的不可靠性,必须用一个数值作为其不可靠性的评定标准。,三、测量的标准差(standard deviation),而标准差决定正态分布曲线的形状。越小,曲线越高而陡;越大,曲线越低而平坦。这说明标准差表征被测量的测量值围绕真值的离散性。因此,标准差可作为测量列中单次测量不可靠性的评定标准。,(一)测量列单次测量的标准差,在
16、等精度测量列中,单次测量列的标准差可按公式计算:,证明:,测量列中每个测量值都可以看作随机变量X的取值,根据离散性随机变量方差的定义:,Pi为每个测量值出现的概率,对于等精度测量,每个测量值出现的概率相同,即:,代入上式得:,注意:,不是测量列中任何一个具体测得值的误差,只是用来表示一定条件下等精度测量列随机误差的概率分布情况。在该条件下,任一单次测得值的随机误差都不等于,但是我们可以认为这一系列测量中所有测得值都属同样的一个标准差的概率分布。,和测量条件(仪器、环境、方法、人员等)有关。,(二)标准差的计算(估算)法,1.贝塞尔公式(Bessel Formula),证明:,两边平方求和得,对
17、于一测量列可用算术平均值来代替真值计算残差:,又因为,若各误差之间相互独立,根据误差的抵偿性,在n时,可认为,所以,故,即,贝塞尔公式,例:用一游标卡尺测量一长度L10次。数据为:,22.62,22.66,22.67,22.62,22.63,22.69,22.66,22.61,22.64,22.70,假设已排除了系统误差和粗大误差。,求:算术平均值及单次测量的标准差。,解:,求算术平均值:,计算残差并校核:-0.03,+0.01,+0.02,-0.03,-0.02,+0.04,+0.01,-0.04,-0.01,+0.05,求标准差:,经校核:,,计算过程正确。,2.极差法(extreme d
18、ifference),主要思路:找出各测量值的最大值和最小值,计算它们的差(即极差)。,根据统计方法,极差与标准差之间的关系为,dn是与测量次数有关的量,可查表得到。,dn取值表,例:用一游标卡尺测量一长度L10次。数据为22.62,22.66,22.67,22.62,22.63,22.69,22.66,22.61,22.64,22.70,若已排除了系统误差和粗大误差。用极差法计算标准差。,解:,极差,查表得,特点:极差法迅速、简便,在n小于10时具有一定的精度,当大于10时不宜采用。,1/Kn和1/Kn数值表,3.最大误差法,当被测量的真值可以预测时,,当被测量的真值不可以预测时,,解:,查
19、表得,特点:最大误差法简单、方便,容易掌握,并且当n小于10时,具有一定的精度,在进行一次测量时,特别适用。,例:用一游标卡尺测量一长度L10次。数据为:,22.62,22.66,22.67,22.62,22.63,22.69,22.66,22.61,22.64,22.70,假设已排除了系统误差和粗大误差。,按最大误差法求标准差。,三种方法比较;最大误差法和极差法简便易行,特别是当n小于10时,具有一定的精度,但其可靠性比贝塞尔公式要低,当几种计算方法的结果出现矛盾时,应以贝塞尔公式为准。,(三)算术平均值的标准差,算术平均值的标准差是表征同一被测量的各个独立测量列算术平均值分散性的参数,可作
20、为算术平均值不可靠性的评定标准。或,证明:,因各次测量值之间相互独立,根据方差性质,因等精度测量,所以,用残差表示,算术平均值的标准差的估算公式为:,可简化为:,增加测量次数可以提高测量精度,当n10以后,已减少得非常缓慢,要提高测量精度,应采用适当精度的仪器,选取合适的测量方法。,例:测量温度得到11个测量值(单位:),数据如下:528,531,529,527,531,533,529,530,532,530,531 求:算术平均值及其标准差。,解:,算术平均值,方差,标准差,由数据可得:,概率积分与极限误差,一、概率积分,定义:概率积分就是在给定误差区间1,2上对已知概率密度函数 积分并求出
21、概率。,若误差服从正态分布,且误差区间对称,则,引入新变量,则:,为拉普拉斯函数。,其中,P为置信概率,t为置信系数。超出范围的误差概率=1-P为显著度。,例:求正态分布的随机误差在置信区间-t,+t内的概率,其中t分别为1,2,3。,解:,,查附表1可得,,查附表1可得,,查附表1可得,二、极限误差,当测量结果的误差超出某一误差的概率很小时,此误差为极限误差,极限误差又称极端误差。,正态分布的随机误差,单次测量的极限误差一般为,如果测量列算术平均值的误差满足正态分布,则,实际测量中,根据不同的要求也可取其它t值来表示极限误差。如取t=2.58,P=99%;t=1.96,P=95%等。因此,一
22、般情况下,测量列单次测量的极限误差表示为,算术平均值的极限误差表示为,例:已知某测量的标准差=0.2,求极限误差为0.4时所对应的置信概率和置信系数。,解:,例:已知某测量的标准差=0.2,求置信概率99%的置信系数及极限误差。,解:,由置信概率P=99%,可得(t)=0.495,查表可得(2.58)=0.495,即置信系数为t=2.58,极限误差为lim=2.58=2.580.20.52,需要指出,上面公式是在测量次数比较多,分布满足正态分布,且标准差已知的前提下导出的结果。通常情况下标准差是未知的,只能根据有限次测量的n个测得值得到估计值,当n20时,测量值不再服从正态分布,而是服从t分布
23、,这时置信系数t应按t分布计算。,按t分布计算单次测量的极限误差应为:,按t分布计算测量列算术平均值的极限误差应为:,一般情况下,当测量次数n20时按正态分布来处理。,置信系数可由给定的置信概率 P=1-(为置信度)和自由度=n-1查表确定。,例:对某工件进行5次测量,测量列的标准误差估算值为5m,求置信概率P=95%时的极限误差。,解:,由已知得自由度=4,显著度=1-p=0.05,查t分布表得t=2.78,极限误差为,习 题,1、比较误差与残余误差的概念。,2、比较贝塞尔公式、极差法及最大误差法的优缺点。,3、对某量进行6次等精度测量,结果如下:33.3,32.7,32.4,33.5,33
24、.1,33.0。(1)用三种方法计算单次测量的标准偏差。(2)求算术平均值的标准差。,4、对某量等精度测量12次,得算术平均值,其单次测量的标准差为,取 和 时,用t分布求算术平均值的标准差及其极限误差。,2.2 系统误差,研究系统误差的重要性:,研究系统误差是研究随机误差基本前提。即我们认为误差的出现是随机的,完全排除了系统误差的影响。,系统误差具有确定的变化规律,但没有一种通用的处理方法,处理起来要比随机误差困难的多,必须认真研究。,对于系统误差的研究,可以发现一些新事物。例如惰性气体的发现。,系统误差的来源,测量装置。原因:仪器设计、制造、安装缺陷。,测量环境。原因:实际环境条件偏离规定
25、的测量条件。,测量方法。原因:采用了近似的测量方法或近似计算。,测量人员。原因:测量者自身的生理特点。,系统误差的特征:系统误差产生在测量之前,存在于测量过程中;系统误差呈现一定的规律性,总可归结为一个或几个因素的函数。如时间,温度等的函数;只要测量条件相同,系统误差是可以重现的,同时决定了它具有可修正的特点。,系统误差的分类,从变化规律方面来进行分:,一、定值系统误差(fixed systematic error),测量过程中误差的大小和符号始终保持不变。例如,零点不准、视差及标准仪器误差等所带来的误差。,二、变值系统误差(variable systematic error),在测量过程中,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 试验 误差 数据处理
链接地址:https://www.31ppt.com/p-6344411.html