【教学课件】第八讲大数定律与中心极限定理.ppt
第八讲 大数定律与中心极限定理,【主要内容】介绍大数定律与中心极限定理。【主要目的】本实验将借助MATHEMATICA软件,了解随机模拟的一些简单算法及其应用。,随机变量 在通讯、计算机网络等一些工程应用问题中,通常需要进行大量的仿真模拟,目前采用最多的随机模拟方法是Monte Carlo方法,初等概率统计中的大数定律就是该方法的数学原理之一。在概率中,一般采用随机变量X来描述和分析随机现象,随机变量 X 从本质上来说是一函数,但随机变量 X 这个函数和我们在高等数学中学过的函数稍有所不同。,随机变量与普通函数的区别 定义域不同:高等数学中的函数 f(x),其定义域和值域都是实数R;随机变量X 的定义域是一非常抽象的集合样本空间研究方法不同:实数域R具有非常好的性质,如它是个全序集,具有拓扑结构和线性结构等等,所以对其上的函数f(x),我们可研究其是否连续和可导等函数本身的性质 而样本空间通常仅仅是一个非空集合而已,没有任何其他可用的数学性质,这样就无法采用普通函数f(x)的一些研究方法来研究随机变量X,而是通过研究随机变量X的分布函数F(x)或其数字特征来研究其统计规律。,分布函数的获取 但在实际应用中,通常很难得到随机变量X的分布函数F(x)和其数字特征,能收集到的只是关于该随机变量的一些实验观察数据(称为样本)。那么如何通过这些样本来得到该随机变量X的分布函数F(x)或其数字特征,这就成了我们需要解决的关键问题之一。而大数定律和中心极限定理就为解决上问题提供了一种数学途径。,概率论中的极限概念(I)几乎处处收敛,设 是一列随机变量,是一随机变量,若有:,则称随机变量序列 几乎处处收敛到X。,记为,概率论中的极限概念(II)依概率收敛,则称随机变量序列 依概率收敛到X。,设 是一列随机变量,是一随机变量,若对任 意的,有:,记为,概率论中的极限概念(III)依分布收敛,则称随机变量序列 依分布收敛到X。,记为,设 是一列随机变量,是一随机变量,设随机 变量 与 的分布函数分别为,若对分布函数 的任意一个连续点x,有,大 数 定 律 大数定律主要描述了大数量随机实验平均结果的稳定性,揭示了随机现象的一种统计规律。依概率收敛,契比雪夫大数定理的特殊情形,设 是一列相互独立的随机变量序列,具有相同的 期望和方差:,则对任 意的,有:,伯努利大数定理,设 是n重伯努利试验中事件A发生的次数,设P(A)=p,则对任 意的,有:,辛钦大数定理,设 是一列相互独立同分布的随机变量序列,且 数学期望存在:,则对任 意的,有:,例1 的近似计算,分析:,如下图所示,矩形:的面积是1,四分之一圆:的面积是:,每次往右图所示的矩形中随机投点,假设每次都能投中到这个矩形中,那么点落到四分之一圆的概率就是,解:,设X,Y是相互独立同分布的随机变量,且都服从区间0,1上的均匀分布。令,则有:,表示点落在四分之一圆内的概率,且有:,随机模拟:,产生 n 对相互独立的随机数(Xi,Yi),且Xi 与 Yi 相互独立同分布,服从 区间0,1上的均匀分布。,由辛钦大数定理有:,所以当n充分大时,有:,统计随机数对(Xi,Yi)中满足条件:的数量,这又等于随机数Zi 中满足条件:Zi=1 的数量,随机模拟步骤:,step1:产生 n 个 区间0,1上的均匀随机数Xi。,step2:产生 n 个 区间0,1上的均匀随机数Yi。,step3:组成随机数对(Xi,Yi),i=1,2,n。,step4:统计随机数对(Xi,Yi),i=1,2,n。中 满足条件:的随机数对数量k。,step5:得到 的近似值为:4k/n。,随机模拟结果:,例2 利用大数定理近似计算定积分,分析:,假设函数f(x)的图形如下图所示,那么定积分,就是下图中的阴影面积,随机模拟:,产生 n 对相互独立的随机数(Xi,Yi),且Xi 与 Yi 相互独立,Xi服从 区间a,b上的均匀分布,Yi 服从 区间0,e上的均匀分布。,设A为事件“随机数(Xi,Yi)落在曲边梯形abcd中”,那么二维随机变量(Xi,Yi)的联合概率密度是:,易知事件A的概率是:P(A)=S/(b-a)e,随机模拟:,在矩形abef中随机地取 n 对数(Xi,Yi),相当于做了n重伯努利试验,设 n 对数(Xi,Yi)中落在曲边梯形abcd中的个数为k,那么由伯努利大数定理有:,所以当n 充分大时,有:,step2:产生 n 个 区间0,1上的均匀随机数Yi。,step3:组成随机数对(Xi,Yi),i=1,2,n。,step4:统计随机数对(Xi,Yi),i=1,2,n。中 满足条件:的随机数对数量k。,step5:得到 定积分的近似值为:,step1:产生 n 个 区间0,上的均匀随机数Xi。,计算定积分 的随机模拟步骤:,随机模拟结果:,例3 伯努利大数定理的随机模拟,随机模拟步骤:,step1:产生 n 个 服从两点分布b(1,p)的随机数Xi。,step2:统计n个随机数Xi中 1 的 个数nA,即事件A发生的频数。,step3:计算误差:,step4:重复step1step3 m次,统计这 m次试验中,误差e大于 的 次数及频率。,随机模拟结果(其中m=100,p=0.5,0.05),的次数,的频率,的值,从上表可以看出:随着n的增大,伯努利试验中事件A 发生的频率与事件A发生的概率的偏差大于的概率越 来越接近于0。在实际应用中,当试验次数很大时,可以用事件发生的频率来代替概率。,中心极限定理 中心极限定理主要研究大数量独立随机变量和的分布函数的极限,揭示了大量独立随机因素综合影响的一种统计规律。依分布收敛,独立同分布的中心极限定理,设 是一列相互独立同分布的随机变量序列,且 期望和方差都存在:,则对任 意的,有:,De Moivre-Laplace定理,设随机变量 服从参数为n,p的二项分布,则对任 意的,有:,例4 正态分布对二项分布的逼近,对于二项分布b(n,p),当n充分大时,其分布函数与正态分布函数非常接近,step1:产生 二项分布b(n,p)的随机数X。,step2:对step1产生的随机数X作出直方图。,step3:作出正态分布:的直方图。,随机模拟结果(其中n=100,200,p=0.1),从上图可看出,当n较大时,二项分布的频率图和正态分布的概率密度拟合的效果非常好,这就说明,当n较大时,计算二项分布随机变量的相关概率时,可以用正态分布来近似,达到简化计算的目的,O,记,则,近似,高尔顿钉板试验,共15层小钉,高尔顿(Francis Galton,1822-1911)英国人类学家和气象学家,例5 高尔顿铁板,求中奖的概率。,分析:,假设有 n 排铁钉,那么我们可以定义一列随机变量如下:,随机变量序列 Xi 是相互独立同分布的随机变量,且分布律为:,令:,则随机变量 Yn 表示小球第 n 次遇到铁钉后的位置。,由中心极限定理知,当n 充分大时,Yn 近似服从正态分布 N(0,n),随机模拟结果,铁钉的层数n:中奖概率,10 0.206,16 0.317,30 0.456,思考题:如果中奖区间设为(-,n和n,),随着 n的增大,中奖概率会怎么变化。,(赌徒输光问题)甲、乙两人进行一系列赌博.在每局赌博中,甲赢的概率为,乙赢的概率为.每局赌博后,输者付给赢者一元钱.设每局赌博的结果都是相互独立的.假设在赌局开始时,甲有初始赌博为 元,乙有初始赌本为 元.赌博一直进行到一个人输光为止.求甲输光的概率.,思 考 题,设 为赌博进行了 局之后,甲拥有的总赌本.,分析:,设 为事件“最终是甲先输光”,记 为甲开始有i元钱的条件下,最后输光的概率,用数学式子表示就有,则有:,要求的概率是,先考虑赌完第一局后的情况:,第一局的结果只有两种可能:,甲第一局输,则有,甲第一局赢,则有,利用全概率公式得到:,令,得,则有:,当,即 时,有,可知当 时,即赌博不公平时,甲最终输光的概率为:,所以甲最终输光的概率是:,当 时,即,此时赌博是公平的,有,当赌博是公平赌博时,赌徒最终输光的概率与其拥有的赌本成正比.,综上可知,甲最终输光的概率是,当 时;,当 时.,?,?,?,?,随机模拟这个结果的实现?,The End!,Thanks!,