概率中一些常见分布的联系毕业论文.doc
概率中一些常见分布的联系摘 要 概率分布是概率论和数理统计中的最基本的概念,在初级教程中一般都是孤立地阐述各种概率分布.为了更好地建立起概率中常见分布之间的联系,本文对常用的概率分布的关系加以讨论,主要归纳成四种关系.并在讨论它们之间关系的基础上,建立起分布间的关系图来进一步阐述,以加深理解.关键词:概率分布;二项分布;正态分布;泊松分布;超几何分布ABSTRACTProbability distribution, which is explained isolatedly in the primary subject, is the most basic definition in probability theory and statistics. In order to set up their relationships among the distributions, some ordinary relationships of probability distribution are discussed in this paper. On the base of these, their relationships are further explained to let readers understand deeply. Moreover, some charts of the relationships are given to explain deeply. Key words: Probability distributing; two item distribute; normal distribution; Possion distribution; supergeometric distribution目 录概率中一些常见分布的联系1引言11 几种常见的概率分布11.1 二项分布11.2 泊松分布11.3 正态分布12 常用一维概率分布间的关系22.1 极限关系22.2 变换关系72.3 独立同分布随机变量和的分布82.4 特殊情形93 概率分布间关系的讨论103.1 两条主线103.2 两个中心分布10小结10参考文献12致 谢13概率中一些常见分布的联系引言概率分布是一个古老而久远的研究课题.在很多年前,就有许多国内外著名学者对概率分布进行了定义. 其中最著名的要数1873年法国数学家泊松研究得到的二项分布的逼近公式.这个公式说明了二项分布和正态分布的联系.而且概率论与数理统计作为数学系中专业基础课程,对学习其他科目具有重要作用.概率分布理论是概率论与数理统计的重要组成部分,在实际生活中的运用十分广泛,如摸球问题和次品抽查问题等.概率中常见分布是概率分布理论中的核心部分,要想很好地解决实际生活应用中的问题就必须弄清常见概率分布之间的关系.根据不同的实际问题, 选择相关的概率分布,能够最大限度的节约实际,提高效率.特别是一些典型的问题,运用合适的概率分布,能够事半功倍.1 几种常见的概率分布1.1 二项分布定义1.1 进行次独立重复的伯努利试验,每次试验事件A发生的概率为,若以表示次独立重复的伯努利试验中事件A发生的次数,那么容易求得的分布列是其中这种分布就是二项分布. 注 时,二项分布就是两点分布.1.2 泊松分布定义1.2 若随机变量的分布列是其中这种分布称为泊松分布.1.3 正态分布定义1.3 若随机变量的密度函数为其中为常数相应的分布函数为这种密度函数称为正态分布. 注 当时,此时的正态分布称为标准正态分布,记为.2 常用一维概率分布间的关系2.1 极限关系 极限关系是指当某个参数趋向某值时(通常是),一个随机变量的概率函数逼近于另一随机变量的概率函数.换一句话说,就是两个随机变量通过渐进分布这个纽带联系起来了. 定理2.1.1(棣莫弗-拉普拉斯极限定理) 设是重伯努利试验中事件发生的次数,而是事件在每次试验中发生的概率,则对任意,成立 (1)其中证明 若事件在第次试验中发生,则令;若事件不发生,则令, 则是相互独立的,且而 于是 其中正好是各的数学期望和方差,由林德伯格莱维定理可知(1)式成立. 上述定理断言:当充分大时, 大小适中(最好满足),二项分布收敛于正态分布.即.定理2.1.2(泊松定理) 在次独立重复的伯努利试验中,以表示每次试验事件发生的概率,它与试验总次数有关,若(为常数),则对任意确定的非负整数,有证明 记 有 对确定的,当,有 所以 推论2.1.2 若则成立.上述定理及推论说明当较大, 较小,且不大时,二项分布可用参数为的泊松分布逼近.即其中例 某大城市有一个繁忙的交通岗,若每天有100000人通过,每人出事故的概率为0.0001,求该天出事故的人数不超过2人的概率?解 方法一:显然,利用二项分布得 这里较大,较小,直接用二项分布计算比较麻烦. 方法二:用泊松分布近似二项分布的方法计算,代入公式这里直接查泊松分布表就可以求出,产生的误差为由此可见,当较大, 较小时,泊松分布近似二项分布,其近似程度非常好,而且计算简单.方法三:用正态分布的分布函数近似二项分布的方法计算,由近似公式这里直接查标准正态分布的分布函数表求得,其误差为0.00224151,这比用泊松分布产生的误差要大.方法四:用正态分布的密度函数近似二项分布的方法计算,由近似公式 这里通过查标准正态分布的密度函数表直接求出,产生的误差为0.00542221,其误差比上面的两种近似求值所产生的误差都大.从以上四种解法中可以得到:对于一个实际问题,首先应该根据各种分布适用的条件,判断是服从什么分布,然后用此分布去解决问题.通过以上可知,泊松分布和正态分布都是二项分布的极限分布,在满足一定条件下都能近似成二项分布,所以泊松分布和正态分布也是有联系的.在实际中,利用这种关系有时能够带来很多方便,从而简化计算.下面举例说明例 假设测量的随机误差,试求在100次独立重复测量中,至少有3次测量误差的绝对值大于19.6的概率,并利用泊松分布求出的近似值.附表12345670.3680.1350.0500.0180.0070.0020.001解 每次测量误差的绝对值大于19.6的概率 设为100次独立重复试验中事件出现的次数,服从参数为的二项分布,所求概率由泊松定理,近似服从参数为的泊松分布,从而 定理2.1.3 设有个产品,其中个废品,任意抽取个,则其中恰有废品个数服从超几何分布.若产品个数无限大,且废品率为,即则在不变的条件下,有证明 事实上,由于其中, 故得证. 注 上述事实与我们的直观思想(当产品个数无限多时,有放回抽查和无放回抽查是没有区别的)是吻合的.由上述定理可知,当很大而较小时,超几何分布的极限分布为二项分布.即其中 例 已知某工厂生产了一批灯泡,灯泡的次品率为0.1,从1000个产品中任意抽取3个,求次品个数为1的概率? 解 设=”任意抽取的3个产品中的次品数”.方法一:根据超几何分布公式计算所求概率 方法二:其中很大, 很小,满足超几何分布用二项分布近似的条件.所以由公式可得 由此可见,按这两个公式计算所得结果差别很小,这说明产品数目很大,而从中抽取的数目相对较小,并且产品的次品率不变时,那么所抽取的产品中的次品数近似服从二项分布.定理2.1.4 若是服从参数为的泊松分布的随机变量,则对于任意,有证明过程参见文献.命题 设泊松分布的分布函数与正态分布的分布函数是近似相等的.证明 的特征函数是,而的特征函数是对任意的,的幂级数展开为忽略以后各项,则有于是而泊松分布的分布函数与正态分布的分布函数近似相等,则上述命题成立.上述定理及命题说明泊松分布的极限分布(当参数时)是正态分布.例 已知某放射物体每分钟放射出粒子数服从参数为50的泊松分布,求该物体每分钟放射粒子数小于60的概率.解 设该放射物体每分钟放射出粒子数为,则,由公式可得:该物体每分钟放射粒子数小于60=此外,易知当较大时,分布可以用分布来近似.2.2 变换关系变换关系是指对一个随机变量进行函数变换而得到的新变量.常见的变换关系有:(1)设为正整数, 若服从参数为的巴斯卡分布,则服从负二项分布.(2)若与相互独立,记则(3)若相互独立,记则(4)若相互独立,则(5)若则(6)若则(7)若则(8)由变量的密度函数 ,可知,当时, 分布就是参数的指数分布.即.故若则(9)由分布的概率密度函数 ,可知,当时,即为自由度为的分布.即 .故若则2.3 独立同分布随机变量和的分布有一些特殊的分布,当有个独立的随机变量同分布于这种分布时,它们的和往往服从于一种新的常见分布.常见的独立同分布随机变量和关系有:(1)设独立同分布于伯努利分布,则(2)设独立同分布于几何分布,则服从巴斯卡分布.(3)设独立同分布于标准正态分布,则 (4)设相互独立,且则(5)由分布的概率密度函数 ,可知,当形状参数时, 分布即是参数为的指数分布.即 .故若设独立同分布于则2.4 特殊情形特殊情形是指通过将一个随机变量概率分布中的参数取特定的值,来得到一个新的分布.即新分布是原概率分布的特殊情况.(1)在中,取时, 为分布.(2)在中,取时,为分布. (3) (4)自由度为1的分布为柯西分布.(5)二项分布中,取即为伯努利分布.(6)巴斯卡分布中,取即为几何分布.3 概率分布间关系的讨论3.1 两条主线伯努利试验过程和泊松过程是初等概率论学习中最重要的两个过程,主要是因为:这两个过程在实际生活中比较常见,从中所获得的概率模型是概率统计学的最基础的模型,从中所获得的概率分布也是最基本的分布.附图的两条主线即是这两个过程,下面分别就这两个过程进行比较讨论.在伯努利试验过程中,到时刻为止,共进行次试验,这时成功次数服从二项分布.而在泊松过程中,到时刻的来到数则服从泊松分布.为等待第一次成功,伯努利试验中的等待时间服从几何分布;而泊松过程中则服从指数分布.为等待第次成功,伯努利试验中的等待时间服从巴斯卡分布;而泊松过程中则服从埃尔兰分布.从上述讨论可以看出:伯努利试验与泊松过程很好的联系以上诸多基本分布,这也是选取这两个过程作为图表主线的主要原因.3.2 两个中心分布在该图中,二项分布和指数分布扮演着中心角色.这一事实之所以成立,一部分原因就是它们依据中心极限定理和叠加原理的自然起源.此外,某些分布又是指数分布的推广(比如威布尔分布),因为指数分布常被用于模拟元件寿命的可靠性分析. 附图小结通过这次撰写本科论文,较大程度的提高了我的独立思考能力,加强了我对专业知识的学习,也使我深刻了解了写一篇论文的步骤和格式,有过这样的一次锻炼,在接下来的日子我相信我会做得更好.概率分布在现实生活中应用很广,弄清常见概率分布间的关系,可以使许多复杂难解的问题迎刃而解.本文重点论述了概率中一些常见分布的联系,并对其进行了比较深入的研究.通过对概率分布及其联系的研究,不仅使我们更好地掌握了各种概率分布,而且也使我们能更好地解决实际生活中遇到的问题.由于我的知识面相对狭窄,因此我对某些问题的研究还不够全面,不够深入,需要在以后的工作和学习中不断完善.参考文献1 缪铨生.概率与统计M.上海:华东师范大学出版社,2007.2 梁好翠.三种重要概率分布的关系及其应用J.钦州学院学报,2007. 3 章家顺.关于超几何分布的极限分布为正态分布的条件J.池州师专学报,2004.4 于洋.浅析二项分布,泊松分布和正态分布之间的关系J.企业科技与发展,2008.5 侯文.常用概率分布间的关系J.辽宁师范大学学报(自然科学版),2005.6 齐雪林.几种常见概率分布间的关系J.陕西师范大学继续教育学报,2007.7 杜勋明,陈冬娥,姚云.二项分布和泊松分布的正态近似条件J.湖北医科大学学报,1998.8 朱冬梅.谈概率论中三种重要的分布J.开封教育学院学报,2003.9 周桂如.概率分布及其应用研究J.赤峰学院学报(自然科学版),2008.10 徐义田,马少军,孙丹娜.三种重要分布的关系及应用J.莱阳农学学院,2003.