概率统计课件ch5大数定律、中心极限定理.ppt
5.1 大数定律5.2 中心极限定理,第五章 大数定律与中心极限定理,5.1 大数定律,事件发生的频率具有稳定性,即随着试 验次数的增加,事件发生的频率逐渐稳 定于某个常数。,一、大数定律引入的客观背景,字母使用频率,生产过程中的废品率,大量测量值的算术平均值也具有稳定性,二、频率的稳定性的实质,或,有,频率依概率收敛于概率,设 是n重贝努里试验中事件A发生的次数,p是每次试验中事件A发生的概率,则对任 给的 0,,定理1(贝努里大数定律),或,贝努里,三、贝努里大数定律,证明贝努里大数定律主要的数学工具是切比雪夫不等式.,设随机变量X有期望E(X)和方差,则对于任给 0,贝努里大数定律表明:当重复试验次数n充分大时,事件A发生的频率n/n与事件A的概率p有较大偏差的概率很小.,贝努里大数定律提供了通过试验来确定 事 件概率的方法.,蒲丰投针问题中解法的理论依据就是大数定律,当投针次数n很大时,用针与线相交的频率m/n近似针与线相交的概率p,从而求得的近似值.,针长L,线距a,思考:用蒙特卡洛方法如何计算定积分?(随机投点法)设0f(x)1,求定积分,如何计算a,b上的定积分呢?,四、常用的几个大数定律,1.大数定律的一般形式,定义 设有一随机变量序列Xn,如果对任 给的 0,,则称随机变量序列Xn服从大数定律,定理2(切比雪夫大数定律),设 X1,X2,是一列两两不相关的随机变量序列,它们都有有限的方差,并且方差有共同的上界,即 Var(Xi)c,i=1,2,,则对任意的0,,切比雪夫,2.切比雪夫大数定律,不再是随机的了,取值接近于其数学期望的概率接近于1.,即当n充分大时,,差不多,切比雪夫大数定律给出了平均值稳定性的科学描述,注:,(2)切比雪夫大数定律只要求Xn互不相关,并不要求同分布.当Xn独立同分布,且方差有限时,Xn必定服从大数定律.即得以下定理3.,定理3(切比雪夫大数定律的特殊情况),设X1,X2,是独立且具有相同的期望和方差的随机变量序列,即E(Xi)=,D(Xi)=,i=1,2,则对任给 0,注:贝努里大数定律是定理3的特特情况.,事实上,设n是n重贝努里试验中事件A发 生次数,P是事件A发生的概率,,引入,i=1,2,n,是事件A发生的频率,,3.马尔可夫大数定律,对随机变量序列Xn,若,定理4,则随机变量序列Xn服从大数定律,即对任意的0,有,马尔可夫条件,注:(1)马尔可夫大数定律的条件较弱.它没有独立性、不相关、同分布的假定,容易满足。(2)切比雪夫大数定律可由马尔可夫大数定律推出.,4.辛钦大数定律,设随机变量序列X1,X2,独立同分布,具有有限的数学期E(Xi)=,i=1,2,,则对任给 0,,定理5(辛钦大数定律),辛钦,辛钦大数定律不要求随机变量的方差存在.,注:,辛钦大数定律为寻找随机变量的期望值 提供了一条实际可行的途径.,例如要估计某地区的平均亩产量,要收割某些有代表性的地块,例如n 块.计算其平均亩产量,则当n 较大时,可用它作为整个地区平均亩产量的一个估计.,用蒙特卡洛方法计算定积分(平均值法),求,的值,例,因此,当n充分大时,,计算原理:,设XU(0,1),由大数定律,均值法步骤:,1)产生在(0,1)上均匀分布的随机数xi,2)计算f(xi),n=1,2,N,n=1,2,N,即,3)用平均值近似积分值,应如何近似计算?请思考.,问:若用上述方法求,大数定律以严格的数学形式表达了随机现象最根本的性质之一:,它是随机现象统计规律的具体表现.,大数定律在理论和实际中都有广泛的应用.,平均结果的稳定性,(一)依概率收敛的定义定义 设随机变量序列Y1,Y2,Y3,a是一常数,若对于任意正数,有:,五、随机变量序列的依概率收敛,则称随机变量序列Yn依概率收敛于a 记为,(二)依概率收敛的性质,见教材P145-146,补充性质:设随机变量序列,f(x)为直线上的连续函数,则,5.2 中心极限定理,(一)中心极限定理引入的客观背景,在实际问题中,常常需要考虑许多随机因素所产生总影响.,例如:炮弹射击的落点与目标的偏差,就受着许多随机因素的影响.,如瞄准时的误差、空气阻力所产生的误差、炮弹或炮身结构所引起的误差等等.,这些随机因素的总影响可表示成独立随机变量之和,当n无限增大时,这个和的极限分布是什么?,观察表明,如果一个量是由大量相互独立的随机因素的影响所造成,而每一个别因素在总影响中所起的作用不大.则这种量(随机变量的和)一般都服从或近似服从正态分布.,总之,在客观实际中有许多随机变量,它们是由大量相互独立的随机因素的综合影响所形成的,而其中每一个因素在总的影响中所起的作用都是微小的,这种随机变量往往近似地服从正态分布。这种随机变量可以表示成相互独立的随机变量的和,中心极限定理将研究这种和当 时的统计规律。,为方便起见,研究n个随机变量之和的标准化的随机变量,的分布函数的极限.,的分布函数的极限.,可以证明,满足一定的条件,上述极限分布是标准正态分布.,考虑,中心极限定理,(二)独立同分布的中心极限定理(林德贝尔格勒维(lindeberglevy)极限定理),教材p147定理四 若X1,X2,是一列独立同分布的随机变量,且EXi=,Var(Xi)=2(20),i=1,2,则对任给的实数y,有,例 根据以往经验,某种电器元件的寿命服从均值为100小时的指数分布.现随机地取16只,设它们的寿命是相互独立的.求这16只元件的寿命的总和大于1920小时的概率.,由题给条件知,诸Xi独立,,16只元件的寿命的总和为,解:设第i只元件的寿命为Xi,i=1,2,16,E(Xi)=100,Var(Xi)=10000,依题意,所求为P(Y1920),由于E(Y)=1600,Var(Y)=160000,由中心极限定理,近似服从N(0,1),P(Y1920)=1-P(Y1920),=1-(0.8),1-,=1-0.7881=0.2119,(三)德莫佛拉普拉斯(de Moirre-Laplace)极限定理,教材P150定理六 设n是n重贝努里试验中事件A出现的次数,又A在每次试验中出现的概率为p(0p1),则对于任给的实数y,例 某厂有400台同类机器,各台机器发生故障的概率都是0.02,各台机器工作相互独立,试分别用二项分布、泊松分布,中心极限定理计算机器出故障的台数不少于2的概率。,(四)大数定律与中心极限定理的联系,大数定律研究随机变量序列依概率收敛,中心极限定理研究随机变量序列依分布收敛。但它们都是研究大量的独立随机变量之和的行为。当独立同分布,且有大于零的有限方差时,大数定律和中心极限定理同时成立。,