等精度测量的随机误差ppt课件.ppt
1,误差理论与数据处理,第2章 等精度测量的随机误差,华中科技大学机械学院2011,2,2.0 概述2.1 正态分布的特征2.2 随机误差的数字特征2.3 随机误差的正态分布曲线2.4 单次测量的精度指标2.5 多次重复测量结果的精度指标2.6 几种常用的非正态分布,2 等精度测量的随机误差,本章主要内容,3,等精度测量,2.0 概述,若在多次重复测量中,每一个测得值都是在相同的测量条件下获得的,这样,各测得值就具有相同的精度,可用同一标准差来表征,或者说具有相同的可信赖程度。,随机误差的特点,误差的大小和符合是不能预先知道的;当测量次数增大,这类误差却又具有统计的规律性,测量次数愈多,这种规律就表现得愈明显。,分布规律,分布规律:正态分布;均匀分布;三角分布等。,4,(1)在一定的测量条件下(指一定的计量器具、环境、被测对象和人员),随机误差的绝对值不会超过一定的界限;,2.1 正态分布的特征,随机误差公理,(2)小误差出现的机会比大误差出现的机会要多;,推论,(3)测量次数n很大时,绝对值相等、符号相反的随机误差出现的机会相等。,(1)随机误差的分布是有界限(有界性);,(2)随机误差的分布呈单一峰值(单峰性);,(3)测量次数n趋于无穷大,随机误差的分布呈对称性(对称性);,(4)对同一量进行等精度测量,随着测量次数n趋于无穷大,随机误差的算术平均值将趋于零(相消性)。,5,用于描述随机误差分布特征的数值叫随机误差的数字特征。,2.2 随机误差的数字特征,随机误差的数字特征:,(2)标准差。,(1)算术平均值;,6,一 算术平均值,对真值为 的物理量进行等精度的n次测量,得n个测得值,它们都含有误差,统称真差。,通常,我们是以算术平均值 作为n次测量的结果,即,2.2 随机误差的数字特征,因有,得到,所以,7,同时可得:,式中,是测量值 重复出现的个数,总测量次数;为任意常数。,2.2 随机误差的数字特征,实际测量时,n总是有限的,所以,算术平均值不可能等于真值。但算术平均值围绕真值随机变化,算术平均值是真值的无偏差估计量。,上式中的真值差 即为随机误差,当 时,算术平均值 就等于真值,即,为了计算的方便,算术平均值也可按下式计算:,8,例2-1 求20.0005,19.9996,20.0003,19.9994,20.0002五个测得值的算术平均值。,2.2 随机误差的数字特征,解:一般算法:,简化算法:,9,二 标准差(或标准偏差)Standard deviation,用标准差 来评价测得值的精度,即,2.2 随机误差的数字特征,第I组 20.0005,19.9996,20.0003,19.9994,20.0002第II组 19.9990,20.0006,19.9995,20.0015,19.9994,两组的平均值都为20.0000,但它们的测量精度明显不同。第II组数据的分散比第I组的大,即第I组测得值的测量精度高于第II组。,标准差,测量次数,真差,10,三 用残差计算标准差的估计值,2.2 随机误差的数字特征,由于在有限次测量时得到的是有限个测得值,用算术平均值 来替代真值。就可用 代替 来计算标准差 的估计值。测得值 对其算术平均值 的差,叫残余误差,简称残差。,1 残差的定义,11,(1)一组测得值残差之和等于零,即,2.2 随机误差的数字特征,2 残差的特性,(2)一组测得值残差的平方和最小,即,证明:因为,又因为,证明:将式(2-6)平方,得:,所以,所以,12,相加,有,对 求导,得,此结果表明,如果不取,而取其他代替真值,则相应偏差的平方和一定要比残差的平方和为大,这也同时说明了 比其他值更可信赖。,2.2 随机误差的数字特征,对于,有,因此,当 时,的值最小,即,13,式中,为算术平均值的真差。,故,2.2 随机误差的数字特征,相加,有,因为,由随机误差的特征知,当 时,则,即,或。这表明:在测量次数 足够多的条件下,残差 即为真差。,(3)真差 与残差 之间的关系,因为,所以,14,取 项求和,得,当 足够大时,上式中 接近于0,又因,故,上式中,即为。,故,2.2 随机误差的数字特征,(4)标准差的估计值(贝塞尔公式),因为,两边平方,有,因为,故,15,由式(2-7)就可根据有限个测量值的残差 来求取随机测量误差方差的估计值。开方得:,称为实验标准差,它是标准差 的估计值。式(2-8)称为贝塞尔(Bessel)公式。可简化为式中,C为常数。,如果各测得值不只出现一次,而是 次,总次数,则上式可写成,2.2 随机误差的数字特征,16,(5)标准差的其他计算法,2.2 随机误差的数字特征,1别捷尔斯法(Peters),由贝塞尔公式得,此式近似为,则平均误差为,由于 得,17,2.2 随机误差的数字特征,故有,此式称为别捷尔斯公式,它可由残余误差 的绝对值之和求出单次测量的标准差,而算术平均值的标准差 为,2 极差法,若等精度多次测量测得值 服从正态分布,在其中选取最大值与最小值,则两者之差称为极差,即,根据极差的分布函数,可求出极差的数学期望为,18,故可得 的无偏估计值,若仍以 表示,则有,2.2 随机误差的数字特征,因此,式中的数值见下表。,3 最大误差法,在有些情况下,我们可以知道被测量的真值或满足规定精确度的用来代替真值使用的量值(称为实际值或约定真值),因而能够算出随机误差,取其中绝对值最大的一个值,当各个独立测量值服从正态分布时,则可求得关系式,19,一般情况下,被测量的真值为未知,不能按上式求标准差,应按最大残余误差进行计算,其关系式为,2.2 随机误差的数字特征,两系数、的倒数见表,20,2.2 随机误差的数字特征,21,2.2 随机误差的数字特征,22,四 算术平均值的标准差及其估计值,组的 次重复测量,各组的测量次数 仅为有限次,即各组测得值的算术平均 值 不等于真值,尚具有真值,有,写成一般形式,取方差,2.2 随机误差的数字特征,23,由于,2.2 随机误差的数字特征,故,即,或,24,例2-2 计算表2-1所列两组测得值的标准差。表2-1 两组测量的测得值,解:第I组:,残差 为0.0005,-0.0004,+0.0003,-0.0006,+0.0002。,2.2 随机误差的数字特征,因此,第I组测量精度比第II组高。,第II组:,残差 为0.0010,+0.0006,-0.0005,+0.0015,-0.0006。由式(2-8)计算 为,由式(2-8)计算 为,25,例2-3 用机械测微仪测量某零件直径共51次,测得的数据如表2-2所列,试求测得值的各特征值。,2.2 随机误差的数字特征,解:表2-2 一般算法,26,表2-3 一般算法,2.2 随机误差的数字特征,27,一 经验分布曲线,2.3 随机误差的正态分布曲线,将实际测量的一组等精度测量值画成横坐标为测量值,纵坐标为测量值次数或密度的二维曲线叫经验分布曲线。,在经验分布曲线图中,横坐标 代表各组的中值(即测得值),纵坐标 则代表各组的频率密度。频率密度 有明确的几何意义:设各间距组的间距范围为,某组的出现频率为,则该间距组的频率密度。显然,在经验分布曲线图上,各间距组所对应的矩形面积即代表该组出现的频率。,绘制方法,定 义,解 释,在横坐标上标出以中值为代表的各个间距,再在各个等间距 上,画上相应的矩形,各组矩形的面积应与该组内出现的频率相对应,因此,各组矩形面积的总和,相应地等于各组频率的总和,即为1。,28,表2.4 经验分布曲线数据表,2.3 随机误差的正态分布曲线,29,测得值在区间 的概率应为分布曲线下从 到 所夹的面积,即,2.3 随机误差的正态分布曲线,经验分布曲线,分布密度函数,30,案例:自动振动测量仪,31,案例:自动振动测量仪,32,案例:自动振动测量仪,33,案例:自动振动测量仪,34,二 正态分布曲线,正态分布曲线的分布密度函数 为,2.3 随机误差的正态分布曲线,式中:概率密度;随机变量;标准差;自然对数的底()理论均值或随机变量 的数学期望。的表达式为,随机误差,由于被测量的真值是无法知道的,对连续型随机函数,可以将理论均值作为真值,故式(2-13)可改写成,35,1.理论均值 或算术平均值,若用 代替,式(2-13)又可写成,2.3 随机误差的正态分布曲线,或,正态分布的两个重要参数,(1)极值点;,(2)对称线;,(3)最大概率;,(4)分布中心。,36,2.标准差,2.3 随机误差的正态分布曲线,(1)精度,(2)分散度,(3)连续随机变量的标准差,(4)离散随机变量的标准差,(5)正常的随机变量的界限为,37,三 正态分布密度函数的概率积分,令新的变量,故,2.3 随机误差的正态分布曲线,分布曲线下的全部面积应等于总概率,即,在任意误差区间(a,b)出现的概率为,写成一般形式,即误差在区间 内的概率为,将积分限也进行相应变换,令 及,故,38,表2-5 常用的t值及 值,上式中的定积分 称为拉普拉斯函数,或称概率积分。,2.3 高斯误差定律,2.3 随机误差的正态分布曲线,(1)当 时,即,(2)当 时,即,39,例2.4 从一批零件中抽查200个零件的尺寸,测得的偏差及数据处理过程列于表2-6,实验统计结果为:,试求零件尺寸对 的偏差在-0.75至+1.75范围内的概率。,(3)用于个别对可靠性要求特别高的科研和精密测量工作。,(2)和 用于较重要的科研和精密测量,及仪器检定;,2.3 高斯误差定律,(1)用于一般精密测量,应用广泛;,2.3 随机误差的正态分布曲线,(3)当 时,即,为显著度;为置信概率;为误差限;为置信系数,常用的置信概率的数值及其适用的场合,一般形式:,40,查拉普拉斯函数表,得 值,得故,解:先计算其相应的 值,2.3 高斯误差定律,表2-6,2.3 随机误差的正态分布曲线,41,设,代入上式得:,或,2.平均误差,1.标准差及其估计值,定义:,2.4 单次测量的精度指标,假设测量结果中没有系统误差,评定测量精度的指标,2.4 单次测量的精度指标,当为连续型随机变量,可按积分计算,即,42,式中,。由表 2-5可知,相应的,故,定义:测得值落入 以内(测量误差在 以内)和落在 之外的概率相等,即,3.几率误差(概差、或然误差),平均误差 的含义是:测得值的误差不超过 的置信概率为57.62%。,用残差表示时,2.4 单次测量的精度指标,2.4 单次测量的精度指标,或,所以,与几率误差 相应的置信概率为50%。,43,又因 也是随机误差,同样服从正态分布定律,当 足够大时,也可写成,按定义式平方代入,得:,由式(2-20)得,定义:误差为 的叫极限误差,常用 来表示,即,2.4 单次测量的精度指标,4.极限误差,2.4 单次测量的精度指标,定义:对同一测量对象重复测量10次,测量误差不超过的最大值叫重复测量误差。,5.重复测量误差,别捷尔斯(Peters)公式,44,或,上式称别捷尔斯公式,因 足够大时,可近似地以 代替,所以式(2-26)又可写成如下简化形式:,基于别捷尔斯公式的 及 可分别表示为,式(2-24),(2-25)相除,可得:,2.4 单次测量的精度指标,2.4 单次测量的精度指标,即,故得:,45,2.4 单次测量的精度指标,例2-5 用百分表式卡尺测量长度共10次,测得的结果如下表,试求 表2-7,2.4 单次测量的精度指标,解:按贝塞尔公式计算:,按别捷尔斯公式计算:,46,设变量,当 时,,测量结果可表示为,当 时,相应的测量结果为,以理论均值 代替被测量的真值,算术平均值 的分布方程可写为,若以 次重复测量的算术平均值 作为测量的结果,显然其精度要比单次测量时高。算术平均值 服从以真值 为中心的正态分布,且其标准差 比单次测量的标准差 小 倍(如图所示),即,一 算术平均值的分布,2.5 多次重复测量结果的精度指标,2.5 多次重复测量结果的精度指标,或,47,解:由,查拉普拉斯函数表得:,2.5 多次重复测量结果的精度指标,例2-6 测量某工件25次,得,若要求置信概率,求测量结果。,2.5 多次重复测量结果的精度指标,故误差限为,测量结果为,48,图2-8所示为具有不同自由度数的 分布函数。当 分布就是标准化的正态分布。分布的理论均值为,新统计量 不再服从正态分布,而是服从自由度为(这里)的 分布(亦称学生分布),2.5 多次重复测量结果的精度指标,当测量次数 甚小(例如 次)时,统计量为,2.5 多次重复测量结果的精度指标,式中,为伽玛函数。其表达式为,其方差为,标准差,49,解:由 及 查 分布表(附录表2)得。故可计算出测量的误差限,将误差限与置信概率写成一般的关系式,则为,例2-7 当测量次数,样本的标准差,要求的置信概率,求测量精度。,2.5 多次重复测量结果的精度指标,统计量 落入区间 中的概率为,2.5 多次重复测量结果的精度指标,50,的极限误差,常用的指标:的标准差,(2)的平均误差,二 算术平均值的精度指标,2.5 多次重复测量结果的精度指标,基于贝塞尔公式的计算公式:,(3)的几率误差,51,例2-8 如例2-5所列测量数据,求其精度平均指标 及。若要求置信概率,试确定其测量结果。,解:应用贝塞尔公式计算,故,由于,由 分布表(附录表2),查得,故测量结果应为,2.5 多次重复测量结果的精度指标,基于别捷尔斯公式的计算公式:,2.5 多次重复测量结果的精度指标,52,2.5 多次重复测量结果的精度指标,表示精度的数字,一般采用一位有效数字已够,只有在很精度的情况下,才采用两位有效数字,且应使测量结果与精度参数截取有效数字的末位数要一致,示例如表2-8。,2.5 多次重复测量结果的精度指标,表2-8 精度数据的有效位数示例,上述指标的精度参数的标准差,其计算式为,按贝塞尔公式,在考虑精度指标本身误差的情况下,测量的结果应表示为,53,除非是精度很高的测量,一般都不需用这种形式来表示测量结果。在本例中,考虑到有效数字,测量结果可写为,例2-9 将例2-5所列测量数据,采用几率误差 及其标准偏差 表示测量结果。,2.5 多次重复测量结果的精度指标,解:由例2-5及例2-8,已算出,由式(2-44),可计算,故测量结果可表示为,54,(4)相对不对称系数显然,当;而当 时,即为对称的分布。这样,对于不对称的非正态分布的分布极限,就可表示为,(3)相对分布系数式中,为实际分布在分布极限处的置信系数。,(1)平均值,(2)标准差,一 评定非正态分布随机误差的方法,2.6 几种常见的非正态分布,55,(4)相对分布系数,(2)方差,(1)理论均值,(5)相对不对称系数,均匀分布亦称等概率分布,即在误差的分布范围内,各处的概率密度相等,其分布密度函数为,二 几种重要的非正态分布,2.6 几种常见的非正态分布,1 均匀分布,(3)极限误差,P33页 表2-9 几种常见的随机分布,56,(1)理论均值,(2)方差,(5)相对不对称系数,(4)相对分布系数,2 三角分布,2.6 几种常见的非正态分布,三角形分布是由两个相互独立的具有相同分布范围的均匀分布所合成,随机变量 皆为在 上均匀分布且独立,则其和就在 范围内服从三角形分布。其分布密度函数为,(3)极限误差,57,反正弦分布实际上是一种随机变量函数的分布,若随机变量 是 的正弦函数,即。其中,为常数,在区间 均匀分布,则 就是反正弦分布,其分布密度函数为,(1)理论均值,(2)方差,(3)极限误差,(5)相对不对称系数,(4)相对分布系数,3 反正弦分布,2.6 几种常见的非正态分布,58,(1)理论均值,(2)方差,(3)极限误差,(4)相对分布系数,(5)相对不对称系数,4 偏心分布,2.6 几种常见的非正态分布,偏心分布亦称瑞利分布,它是一种非负的单向连续分布,实质上是服从正态分布的随机变量直角坐标x与y变换成极坐标向量半径模 的分布。射击中,枪弹与靶心的偏心误差 即 的分布就是典型的例子。其分布密度函数为,59,以下列出几种置信概率 值与其相应的偏心分布的界限:,令,及,则可得到概率分布函数为,2.6 几种常见的非正态分布,例2-10 检定车床弹簧夹头的定心精度,进行10次重复加紧精密心轴并测量其径向跳动e,测得的数据及部分处理过程如表2-10,试求跳动量的平均值 及最大、最小值。,60,解:由于该误差服从偏心分布,其平均值,相对不对称系,相对分布系数,由此可算出置信系数,故径向跳动量e 的分布范围应为,2.6 几种常见的非正态分布,表2-10 例2-10数据表,即,61,2.6 几种常用的非正态分布,今设两个服从正态分布的随机变量 及,两者的差值 也应服从正态分布,显然,其理论均值与方差分别为,2.6 几种常见的非正态分布,5.绝对正态分布,但差值 的绝对值则服从绝对正态分布,其概率密度函数为,式中,与 是两个参量,即差值 分布密度函数的理论均值和标准差。差值绝对值 的理论均值(数学期望)和标准差 为,即,62,2.6 几种常见的非正态分布,6 分布,令 是 个独立随机变量,每个随机变量都服从标准化的正态分布。定义一个新的随机变量 为,随机变量 称为自由度为 的卡埃平方(Chi-square)变量,其主要的分布特征量为,参见附录表3,63,7 分布,令 和 是相互独立的随机变量,其中 服从自由度为 的 分布,服从标准化的正态分布,则定义新的随机变量 为,2.6 几种常见的非正态分布,随机变量 称为自由度为 的学生氏 变量,其主要的分布特征量为,64,若 为具有自由度为 的卡埃平方变量,为具有自由度为 的卡埃平方变量,则定义新的随机变量F为,2.6 几种常见的非正态分布,8 F分布,随机变量 称为自由度为,的 变量,其主要的分布特征量为,参见附录表4,65,1 试分别求出服从正态分布、均匀分布和三角分布误差落在 中的概率。2 测量某物体重量共8次,测得数据(单位为g)为236.45,236.37,236.51,236.34,236.39,236.48,236.47,236.40。试求算术平均值及其标准差、几率误差、平均误差、单次测量结果和多次测量的结果。3 费业泰(第5版)P53:2-54 费业泰(第5版)P53:2-75 有一组测量数据(dB):44.6,44.9,44.1,44.8,44.2,43.9,43.6,43.5,43.1,44.1,44.5,43.6,43.7,43.3,44.8,44.0,43.4,44.1,44.3,44.0。试画出测量结果的经验分布曲线。,作业,66,?,2 等精度测量的随机误差,