正态分布的若干理论及其应用本科毕业论文.doc
《正态分布的若干理论及其应用本科毕业论文.doc》由会员分享,可在线阅读,更多相关《正态分布的若干理论及其应用本科毕业论文.doc(38页珍藏版)》请在三一办公上搜索。
1、 摘 要大量的实践经验和理论分析表明,自然界与工程技术中服从正态分布的随机变量是最常见的.诸如机械加工中零件的几何尺寸(直径、长度、宽度、高度)、强度、重量、使用寿命;随机测量误差;人的身高、体重;农作物的收获量;健康人的红血球数目;纤维的强力;炼铁厂每炉铁水的含碳量;学生考试分数;机床维修保养时间;某地区酌年降雨量;炮弹弹落点的分布等等,都可以看作是服从或近似服从的正态分布.数学和经验都证明:受大量、独立、均匀小效应影响的随机变量服从正态分布.在数理统计中用于统计推断的许多统计量,不管资料的原分布是什么,只要样本容量充分地大,它都近似于正态分布某些统计量即使偏离了正态分布,只要偏离量不大,也
2、可以按正态分布处理.因此,正态分布的应用是十分广阔的.关 键 字 正态分布;概率密度函数;标准差;误差目 录引言:11正态分布概念12.正态曲线的特性23.参数 m 和 s 的意义34.标准正态分布及正态分布表44.1.标准正态分布44.2.标准正态分布的分布函数和正态分布表44.3.正态分布表的几种形式55.正态随机变量落在区间(x1,x2)内的概率计算75.1.当值机变量N(0,1)时的概率计算85.2.当随机变量 N(m,s) 时的概率计算95.2.1.服从一般正态分布的随机变量N(m,s )的分布函数95.2.2.概率计算106正态分布在几个领域内的应用实例126.1已知m, s求某条
3、件下的概率8126.2已知某条件下的概率,求参数和 s ?146.3已知 m,s 和区问(a,b)内的变量数,求总变量数156.4已知m,s及各范围内的概率,求某范围的上、下限166.5. 用标堆差确定所需测量次教17参考文献19致谢20正态分布的若干理论及其应用数学系2004级1班 王文瑞 数学与应用数学 04104141指导老师 李海增引言:正态分布是一种最常见的连续型随机变量的分布,它在概率论和数理统计中无论在理论研究还是实际应用上都占有头等重要的地位,这是因为它在误差理论、无线电噪声理论、自动控制、产品检验、质量控制、质量管理等领域都有广泛应用,数理统计中许多重要问题的解决都是以正态分
4、布为基础的.正态分布也具有许多良好的性质,因此在理论研究中正态分布十分重要.1正态分布概念设连续型随机变量的密度函数(也叫分布密度,概率密度,概率密度函数)为: (1.1) (其中是常数,且 ,为正态总体的平均值,为正态总体的标准差,为正态总体中随机抽取得的样本值).则称随机变量服从参数为的正态分布,记作,式(1.1)是德国著名数学家高斯在找误差分布时于1795年推导发现的,因此正态分布又称高斯分布、误差分布或常态分布.正态分布密度函数的图形如图1所示,这条曲线称“正态分布密度函数曲线”或“正态分布曲线”,简称“正态曲线”,由于它的形状象只钟,又称“钟形曲线”,为纪念高斯又称“高斯曲线”1.2
5、.正态曲线的特性对式(1.1)进行数学处理,可得正态曲线特性.对式(1.1)求导,有 (2.1)令,则有,即当时, 有极大值对式(2.1)求导有: (2.2)令,则有 ,即曲线在:处有两个拐点.将正态曲线的特性列入表1.表1 正态曲线特性0-0-0 曲线凹拐点凸极大值凸拐点凹由表1和图1可知正态曲线有以下特性:1) 曲线以为对称轴,且在时取得极大值,曲线由起向左右延伸时,不断降低,呈现中间高,两头低的钟的形状.2) 曲线在对称轴两侧 处有两个拐点.3) 的取值范围为整个轴,离越远, 越小,当时,曲线以轴为渐进线.4) 曲线总在轴上方,它于轴所围面积等于l,对称轴两边曲线下的面积相等各为0.5.
6、机械加工得到的尺寸是服从正态分布的,如在机床上加工100件中的轴,则这100件轴的尺寸有以下统计规律.1) 100个尺寸中,在10附近的占的数量最多、这是正态分布的单峰性.2) 在这100个尺寸中,约有50个左右大于10,有50个左右小于10,这是正态分布的对称性.3) 在这100个尺寸中,大于10.03的个数和小于9.97个数都很少,这是正态分布的有界性.4) 这100个尺寸与标准尺寸10的差的平均值趋与零,这是正态分布的抵偿性.上述四条规律,零件数量越多就越准确2.3.参数 m 和 s 的意义和是正态分布的两个参数,当和确定后,正态曲线就完全确定了.和 不同,正态曲线的位置和形状则不同.是
7、位置参数,它的大小决定曲线在轴上的位置,是形状参数,它的大小决定曲线的高矮胖瘦.若不变只让变,则曲线形状不变,仅在轴上平行移动如图2所示;若不变只让变,则曲线在轴上的位置不变,仅形状发生变化,越小则曲线越显的高瘦陡峭;越大则曲线越显得矮胖平缓,如图3所示:从几何角度看,是正态曲线极大值的横坐标、是曲线拐点的横坐标到之间的距离,或者说是凸、凹曲线连接点的横坐标;从物理角度看,是正态曲线与轴之间的平面图形重心的横坐标.在数理统计中,是正态分布的数学期望或叫均值,是标准偏差.在计量学中,是被测量的真值,是表征测量值分散特性的一个度量指标.越大,观测值落在附近的概率越小,即观测值分散,测量精度低;越小
8、,观测值落在附近的概率越大,即观测值集中,测量精度高.总之,表明了观测值的集中趋势,反映了观测值的分散程度.显然我们希望越小越好3.4.标准正态分布及正态分布表4.1.标准正态分布称的正态分布为标准正态分布,将代入(1.1)式有: (4.1.1)式(4.1.1)为标准正态分布的密度函数,服从标准正态分布的随机变量1.4.2.标准正态分布的分布函数和正态分布表概率论告诉我们,随机变量的分布函数等于密度函数在无穷区间 上的广义积分,于是标准正态分布的分布函数(也叫概率分布函数)为: (4.2.1)通常用表示标准正态分布的分布函数,即: (4.2.2)取不同的的值,由式(4.2.2)可得不同的的数值
9、,这就得到“标准正态分布函数数值表”简称“标准正态分布表”或“正态分布表”.有些文献也叫“正态概率曲线下的面积”、“概率积分函数表”、“正态分布积分值”、“误差函数表”、“正态曲线下的面积函数表”、“拉普拉斯函数的值”等不同的名称.式(4.2.2)的几何意义是在区间内正态曲线与轴之间所围曲边梯形的面积,如图(4)所示,这也是将“正态分布表”称作“正态概率曲线下的面积”的道理.由于密度函数可以在整个轴上取值,由密度函数性质得: 即正态曲线性质4:曲线与轴所围面积为l4.4.3.正态分布表的几种形式式(4.2.2)通常称概率积分由于积分的上下限不同,可得到以下几种不同形式的正态分布表. (4.3.
10、1) () (4.3.2) (4.3.3) (4.3.4) (4.3.5) (4.3.6) 均有现成表可查.一种文献只附有一种形式的正态分布表.这六种不同形式的正态分布表,形式虽异,但实质相同,对同一问题,无论用那种形式的表都会得到同一结果.这六种表中,其较为常见而则出现较少5.式(4.3.2)的几何意义如图5所示,式(4.3.3)式(4.3.4)和式(4.3.5)的几何意义如图6,式(4.3.6)的几何意义如图7.只有弄清了这六种表的含义,工作中无论碰到哪种形式的表,都可以运用自如.对式(4.3.1)、式(4.3.2)所定义的这两种形式的正态分布表,由正态曲线的对称性和曲线与横轴所围面积为l
11、可知:当,则有,即:当则有,即:当且均为正值时有:当为的相反数时有:当时,有:令,由各相应正态分布表查得:,可以看出: ,这从图5、图7及曲线性质4(对称轴两边面积各为0.5)容易得出.由正态曲线的对称性和曲线与轴所围面积为1还可以得到以下关系式: (4.3.7) (4.3.8)式(4.3.7)式(4.3.8)的几何意义如图8,如图9所示 其实由的几何意义可直接得出式(4.3.7)和式(4.3.8) 4. 5.正态随机变量落在区间(x1,x2)内的概率计算概率统计指出,连续随机变量落在区间内的概率等于它的密度函数在该区间上的定积分,即: 对有: (5.1)对有: ()式(5.1)的几何意义如图
12、10所示.x1x2有了正态分布表,计算上面两个积分就十分容易了 对服从标准正态分布的随机变量,可直接查正态分布表,对服从一般正态分布的随机变量,通过变量置换也可以直接查正态分布表.5.1.当值机变量N(0,1)时的概率计算若 ,则 落在区间内的概率由式(5.1)和式(4.2.2)得: (5.1.1) 可由式(4.2.2)所定义的正态分布表查得.以后若无特别指明,文中的正态分布表均指式(4.2.2)定义的那种形式的正态分布表.倒1设 ,求:;解: 由式(5.1.1)得:由正态分布表查得:,故有: 由式(4.2.2)得: 由式(4.3.7)和式(4.2.2)得:显见: 因为在整个轴上取值,故概率必
13、1.这也证明了正态曲线与轴所围面积为15.5.2.当随机变量 N(m,s) 时的概率计算若,则落在区间()内的概率,原则上讲只要对它的密度函数在区间()上积分即可求得.但是实际上这个积分的计算是比较麻烦的,并且由于它有两个参数,也不可能对不同的和 一一造表备查.于是设法将服从一般正态分布的随机变量化为服从标准正态分布,利用已有的“正态分布表”,以解决所有正态分布的概率计算问题6.5.2.1.服从一般正态分布的随机变量N(m,s )的分布函数由分布函数的定义可知,服从一般正态分布的随机变量的分布函数为:作变量置换,令由上式化为: (5.2.1.1)上式说明通过变量置换可将对服从一般正态分布的随机
14、变量的密度函数的积分化为对服从标准正态分布的密度函数的积分.这为利用“标准正态分布表”打开了大门1.5.2.2.概率计算 设,则落在区间内的概率为: (5.2.2.1)这里,可由正态分布表查得.仿式(4.3.7)对一般正态分布有: (5.2.2.2)例2设 ,求:; .解:这里, ; 由式(5.2.2.1)得: 由式(5.2.2.2)和式(5.2.1.1)得:例3. 设,求?解: =当,=2=0.6826当=0.9545当=当= 上例说明,随机变量1落在区间内的概率为0.6826,或者说在范围内的曲边梯形面积占正态曲线下总面积的68.26;落在区间内的概率为0.9545;落在区间内的概率为0.
15、9973;落在区间内的概率为0.99994.由于落在范围内观测值为所有观测值的99.3 ,几乎包括了所有观测值,因此将作为一个界限范围,这就是常说的“3原则”,它在质量管理和质量控制等领域有广泛应用.在误差理论中,称为极限误差.因为随机测量误差落在范围内的概率为99.76%超出该范围的仅占0.27.即一万次测量中,极限误差在范围内的有9973次,超出该范围的仅有27次,这相当于370次测量中约有1次的测量误差有可能超出范围(0.27 =2710000=1370).若取为极限误差,那么在15788次测量中才约有1次误差的绝对值超出范围(0 006334=6.334100000 115788) 而
16、一般的测量,次数最多也不过几十次,因此可以认为,在任何情况下都不会出现绝对值大于的随机误差,故称为极限误差这就是随机误差有界性的道理.也有些国家将作为极限误差.在不确定度评定中,K称为包含因子(覆盖因子),它常取2或3,扩展不确定度U为合成标准不确定度的K倍.例3的计算结果可用图l1表示用例3的计算方法,取不同的K值,将得到的一些特定的概率值列入表2.表2 不同K的概率7KPKPKP0.67450.51.960.952.810.99510.682620.954530.99751150.752.32620.983.090.99816450.902.5760.993.290.9996正态分布在几个
17、领域内的应用实例6.1已知m, s求某条件下的概率8例4:一种螺纹量规平均可使用5年,其标准差为0.8年.假设螺纹量规的使用寿命服从正态分布,试求以下概率:1)使用期不到4年;2)使用期超过6年.解:设量规使用期为随机变量,由题意知,本题求1) 根据式(5.2.1.1)有:或由式(5.2.2.1)可得:2) 根据式(5.2.2.2)和式(5.2.1.1)有:例5:某车间加工一批轴,其直径服从正态分布,平均直径=l0,标准差=0.015.规定直径在(100.03) 范围内为合格品.求:1)不合格品的概率;2)合格品的概率.解:设这批轴的直径为随机变量,由题意知.和为不合格品.1) 2) 或 例6
18、:某城市平均季降雨量为476,标准差为165,假定该市季降雨量服从正态分布,预测雨量在381到635之间50年内舍有多少年8?解:先求降雨量在381-635的概率故降雨量在该范围内50年中的年数为:500.5505=27.52528(年)2.例7:测量某目标的距离时发生的误差(以米)具有概率密度,求在三次测量中至少有一次误差的绝对值不大干30的概率.解:由题意.在一次测量中误差绝对值小于等于30的概率为:一次测量中误差绝对值大干30的概率为: 三次测量中误差绝对值大干30的概率为: 三次测量中误差绝对值不大干30的概率(即三次测量中至少有一次误差绝对值不大干30的概率)为: 由于三次测量可以看
19、作三次独立试验,于是此题也可按二项分布计算.本题所求概率包括:1)三次测量中有一次的误差不大干30;2)三次测量中有二次的误差不大干30;3)三次的测量均不大干30.这里:=0.4931(上面计算),于是有: 可见按正态分布和按二项分布计算结果相同.例8:设显像管平均寿命为10年,标准差为3.5年,一年内损坏的可免费掉换.每出售100台电视机(1台有1只显像管),可以预料有多少显像管要免费掉换?解:设显像管寿命为 ,则 ,显像管寿命小于1年的概率为:故100台中需要掉换的台数为1000.01=l(台) 9.6.2已知某条件下的概率,求参数m 和s ?例9:有一群男子,4的身高在以下,有52在到
20、之间.若身高成正态分布,求这一分布的平均值和标准差10?解:由题意得:由概率值0.04和0.56反查正态分布表得: 化为: 解得: 即这群男子平均身高为,标准差为.例10:某电子产品的寿命(以小时计)服从参数=160,的正态分布,若要求,问允许的的最大值为多少?解:由题意:即: 反查正态分布表得:故得 例11:滚珠直径成正态分布,已知4的滚珠直径大于,求这一分布的平均值.解: 即: 反查正态分布表得: 解得: 6.3已知 m,s 和区问(a,b)内的变量数,求总变量数例12:某正态分布的,在40与90之间有220个变量值,求整个分布有多少变量值?解:先求变量值在4090范围内的概率故总变量为:
21、 例13:某天中午一餐厅所有顾客吃饭用的钱服从正态分布,平均数为8.74元,标准差为1.2元.这天中午有420人吃午饭用了8.5元或更多,问一共来了多少顾客?解: 故总顾客数为: (人)6.4已知m,s及各范围内的概率,求某范围的上、下限例14:某水果重量成正态分布,现进行分级,20为小的,55为中等,15为大的,10为特大.所有水果平均重量为241.5,标准差为60,求中等水果的下限与上限的重量.解:由题意知,中等水果下限以下的概率为0.20,上限为以下的概率为(0.20+0.55)=0.75,于是有: 反查正态分布表得: 即中等水果下限重量为191,上限为2822.例15:某公司对职工进行
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 正态分布 若干 理论 及其 应用 本科毕业 论文
链接地址:https://www.31ppt.com/p-4026246.html