第三章 概率与概率分布.ppt
《第三章 概率与概率分布.ppt》由会员分享,可在线阅读,更多相关《第三章 概率与概率分布.ppt(191页珍藏版)》请在三一办公上搜索。
1、1,概 率,概率分布,与,第三章,2,一、概率的概念,二、概率的计算,三、概率的分布,四、大数定律,3,一、概率基本概念,(一)事件,定义:在一定条件下,某种事物出现与否就称为是事件。自然界和社会生活上发生的现象是各种各样的,常见的有两类。,4,在一定条件下必然出现某种结果或必然不出现某种结果。,确定性事件,必然事件(U)(certain event),不可能事件(V)(impossible event),一、概率基本概念,5,在一定条件下可能发生也可能不发生。,随机事件(random event)不确定事件(indefinite event),一、概率基本概念,为了研究随机现象,需要进行大量
2、重复的调查、实验、测试等,这些统称为试验。,6,一、概率基本概念,随机事件,事 件,7,一、概率基本概念,(二)频率(frequency),若在相同的条件下,进行了n次试验,在这n次试验中,事件A出现的次数m称为事件A出现的频数,比值m/n称为事件A出现的频率(frequency),记为W(A)=m/n。,0W(A)1,8,一、概率基本概念,种子发芽与否是不能事先确定的,但从表中可以看出,试验随着n值的不同,种子发芽率也不相同,当n充分大时,发芽率在0.92附近摆动。,例:,9,一、概率基本概念,频率表明了事件频繁出现的程度,因而其稳定性说明了随机事件发生的可能性大小,是其本身固有的客观属性,
3、提示了隐藏在随机现象中的规律性。,概 率,10,一、概率基本概念,(三)概率(probability,P),概率的统计定义:设在相同的条件下,进行大量重复试验,若事件A的频率稳定地在某一确定值p的附近摆动,则称p为事件A出现的概率。,P(A)=p,统计概率(statistics probability)后验概率(posterior probability),11,统计概率,一、概率基本概念,抛掷一枚硬币发生正面朝上的试验记录实验者 投掷次数 发生正面朝上的次数 频率(m/n)蒲丰 4040 2048 0.5069K 皮尔逊 12000 6019 0.5016K 皮尔逊 24000 12012
4、0.5005,随着实验次数的增多,正面朝上这个事件发生的频率稳定接近0.5,我们称0.5作为这个事件的概率。,12,一、概率基本概念,(三)概率(probability,P),P(A)=p=lim,在一般情况下,随机事件的概率P是不可能准确得到的。通常以试验次数n充分大时,随机事件A的频率作为该随机事件概率的近似值。,mn,mn,13,概率的古典定义,一、概率基本概念,对于某些随机事件,不用进行多次重复试验来确定其概率,而是根据随机事件本身的特性直接计算其概率。,随机事件,(1)试验的所有可能结果只有有限个,即样本空间中的基本事件只有有限个;,(2)各个试验的可能结果出现的可能性相等,即所有基
5、本事件的发生是等可能的;,(3)试验的所有可能结果两两互不相容。,14,概率的古典定义,一、概率基本概念,具有上述特征的随机试验,称为古典概型(classical model).,设样本空间有n个等可能的基本事件所构成,其中事件A包含有m个基本事件,则事件A的概率为m/n,即P(A)=m/n。,古典概率(classical probability)先验概率(prior probability),15,一、概率基本概念,1,2,3,4,5,6,7,8,9,10,随机抽取一个球,求下列事件的概率;(1)事件A抽得一个编号 4(2)事件B=抽得一个编号是2的倍数,该试验样本空间由10个等可能的基本事
6、件构成,即n=10,而事件A所包含的基本事件有3个,即抽得编号为1、2、3中的任何一个,事件A便发生。,P(A)=3/10=0.3,P(B)=5/10=0.5,16,一、概率基本概念,1,2,3,4,5,6,7,8,9,10,A“一次取一个球,取得红球的概率”,10个球中取一个球,其可能结果有10个基本事件(即每个球被取到的可能性是相等的),即n=10,事件A:取得红球,则A事件包含3个基本事件,即m=3,P(A)=3/10=0.3,17,一、概率基本概念,1,2,3,4,5,6,7,8,9,10,B“一次取5个球,其中有2个红球的概率”,10个球中任意取5个,其可能结果有C105个基本事件,
7、即n=C105,事件B=5个球中有2个红球,则B包含的基本事件数m=C32 C73,P(B)=C32 C73/C105=0.417,18,【例】在N头奶牛中,有M头曾有病史,从这群奶牛中任意抽出n头奶牛,试求:(1)其中恰有m头有病史奶牛的概率是多少?(2)若N=30,M=8,n=10,m=2,其概率是多少?,19,我们把从有M头奶牛曾有病史的N头奶牛中任意抽出n头奶牛,其中恰有m头有病史这一事件记为A,因为 从 N 头 奶 牛 中 任 意 抽 出 n 头 奶牛的基本事件总数为;事件A所包含的基本事件数为;因此所求事件A的概率为:,20,将N=30,M=8,n=10,m=2代入上式,得=0.0
8、695 即在30头奶牛中有8头曾有病史,从这群奶牛随机抽出 10 头奶牛其中有2头曾有病史的概率为6.95%。,21,一、概率基本概念,0P(A)1,任何事件,P(U)=1,必然事件,P(V)0,不可能事件,0P(A)1,随机事件,概率的基本性质,22,概率的计算,第二部分,23,二、概率的计算,(一)事件的相互关系,和事件,积事件,互斥事件,对立事件,独立事件,完全事件系,24,二、概率的计算,1,和事件,事件A和事件B中至少有一个发生而构成的新事件称为事件A和事件B的和事件,记作A+B。,n个事件的和,可表示为A1+A2+An,25,二、概率的计算,2,积事件,事件A和事件B中同时发生而构
9、成的新事件称为事件A和事件B的积事件,记作AB。,n个事件的积,可表示为A1 A2 An,26,二、概率的计算,3,互斥事件(互不相容事件),事件A和事件B不能同时发生,则称这两个事件A和B互不相容或互斥。,n个事件两两互不相容,则称这n个事件互斥。,27,二、概率的计算,4,对立事件,事件A和事件B必有一个发生,但二者不能同时发生,且A和B的和事件组成整个样本空间。即A+B=U,AB=V。我们称事件B为事件A的对立事件。,28,二、概率的计算,5,独立事件,事件A和事件B的发生无关,事件B的发生与事件A的发生无关,则事件A和事件B为独立事件。,如果多个事件A1、A2、A3、An 彼此独立,则
10、称之为独立事件群。,29,二、概率的计算,6,完全事件系,如果多个事件A1、A2、A3、An两两互斥,且每次试验结果必然发生其一,则称事件A1、A2、A3、An为完全事件系。,完全事件系的和事件概率为,任何一个事件发生的概率为1/n。即:P(A1A2An),30,二、概率的计算,(二)概率的计算法则,定理:若事件A与B互斥,则 P(A+B)=P(A)+P(B),试验的全部结果包含n个基本事件,事件A包含其中m1个基本事件,事件B包含其中m2个基本事件。由于A和B互斥,因而它们各包含的基本事件应该完全不同。所以事件AB所包含的基本事件数为m1+m2。,P(A+B)=(m1+m2)/n=m1/n+
11、m2/n=P(A)+P(B),31,二、概率的计算,推理1 P(A1+A2+An)=P(A1)+P(A2)+P(An),推理3 完全事件系的和事件的概率为1。,32,二、概率的计算,例:玉米田中,一穗株(A)占67.2%,双穗株(B)占30.7%,空 穗株(C)占2.1%,试计算一穗株和双穗株的概率。,P(A+B)=P(A)+P(B)=0.672+0.307=0.979,因为P(A)+P(B)+P(C)=1 P(A+B)=1-P(C)=1-0.021=0.979,或,33,二、概率的计算,定理:事件A和事件B为独立事件,则事件A与事件B同时发生的概率为各自概率的乘积。P(AB)=P(A)P(B
12、),推理:A1、A2、An彼此独立,则 P(A1A2A3An)=P(A1)P(A2)P(A3)P(An),34,二、概率的计算,例:播种玉米,种子的发芽率为90%,每穴两粒,则:,C:两粒种子均发芽:,求:,C=AB,P(C)=P(A)P(B)=0.81,D=AB+AB,P(D)0.9*0.1+0.1*0.9=0.18,E=A B,P(E)P(A)P(B)=0.1*0.1=0.01,35,概 率 分 布,第三部分,36,事件的概率表示了一次试验某一个结果发生的可能性大小。若要全面了解试验,则必须知道试验的全部可能结果及各种可能结果发生的概率,即必须知道随机试验的概率分布(probability
13、 distribution)。为了深入研究随机试验,先引入随机变量(random variable)的概念。,37,随机变量是指随机试验中被测定的量。作一次试验,其结果有多种可能。每一种可能结果都可用一个数来表示,把这些数作为随机变量x的取值范围,则试验结果可用随机变量x来表示。【例】对100头病畜用某种药物进行治疗,其可能结果是“0头治愈”、“1头治愈”、“2头治愈”、“”、“100头治愈”。若用x表示治愈头数,则随机变量x的取值为0、1、2、100。,38,【例】孵化一枚种蛋可能结果只有两种,即“孵出小鸡”与“未孵出小鸡”。若用随机变量x表示试验的两种结果,则可令x=0表示“未孵出小鸡”,
14、x=1表示“孵出小鸡”。【例】测定某品种猪初生重,表示测定结果的变量 x 所取的值为一个特定范围(a,b),如0.51.5kg,x值可以是这个范围内的任何实数。,39,如果表示试验结果的变量x,其可能取值为有限个,且取这些不同的值各自都有其确定的概率,则称x为离散型随机变量。如果表示试验结果的变量x,其可能取值为某范围内的任何数值,且x在其取值范围内的任一区间中取值时,其概率是确定的,则称x为连续型随机变量。,40,三、概率分布,(一)离散型变量的概率分布,要了解离散型随机变量x的统计规律,必须知道它的一切可能值xi及取每种可能值的概率pi。,对离散型变量x的一切可能值xi(i=1,2,3),
15、及其对应的概率pi,P(x=xi)=pi,i=1,2,3,41,三、概率分布,例:,此表给出了该鱼群年龄构成的全部,我们称之为该鱼群年龄的概率分布。,42,三、概率分布,此表列出了性别变量的取值及相应值的概率,揭示了观察婴儿性别试验的统计规律。,用随机变量的可能取值及取相应值的概率来表示随机试验的规律称为随机变量的分布律或概率函数。,例:,43,三、概率分布,P(x=xi)=pi,i=1,2,3,设离散型变量x的所有一切可能值xi(i=1,2,3),取相应值的概率为pi,则P(x=xi)称为离散型随机变量x的概率函数。,44,三、概率分布,离散型变量的概率分布的特点,特点,Pi 0(i=1,2
16、,),=1,45,三、概率分布,(二)连续型变量的概率分布,当试验资料为连续型变量,一般通过分组整理成频率分布表。如果从总体中抽取样本的容量n相当大,则频率分布就趋于稳定,我们将它近似地看成总体概率分布。,46,直方图中同一组内的频率是相等的。,47,三、概率分布,直方图中每一矩形的面积就表示该组的频率。,48,三、概率分布,当n无限大时,频率转化为概率,频率密度也转化为概率密度,阶梯形曲线也就转化为一条光滑的连续曲线,这时频率分布也就转化为概率分布了,此曲线为总体的概率密度曲线,曲线函数f(x)称为概率密度函数。,49,三、概率分布,50,三、概率分布,对于一个连续型随机变量x,取值于区间a
17、,b内的概率为函数f(x)从a到b的积分,即:,连续型随机变量的概率由概率分布密度函数所确定。,51,概率密度函数f(x)曲线与x轴所围成的面积为1。,52,连续型随机变量概率分布的性质:1、分布密度函数总是大于或等于0,即f(x)0;2、当随机变量x取某一特定值时,其概率等于0;即(c为任意实数)因而,对于连续型随机变量,仅研究其在某一个区间内取值的概率,而不去讨论取某一个值的概率。,53,3、在 一次试验中 随机变量x之取值 必在-x+范围内,为一必然事件。所以(4-5)(45)式表示分布密度曲线下、横轴上的全部面积为1。,54,大 数 定 律,第四部分,55,四、大数定律,大数定律:是概
18、率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。,主要内容:样本容量越大,样本统计数与总体参数之差越小。,56,四、大数定律,贝努里大数定律,辛钦大数定律,57,四、大数定律,(1)贝努里大数定律,设m是n次独立试验中事件A出现的次数,而p是事件A在每次试验中出现的概率,则对于任意小的正数,有如下关系:,58,四、大数定律,(2)辛钦大数定律,设x1,x2,x3,xn是来自同一总体的变量,对于任意小的正数,有如下关系:,59,几种常见的理论分布,第二节,60,随机变量的概率分布(probability distribution),离散型变量(discrete random vari
19、able),连续型变量(continuous random variable),二项分布泊松分布,正态分布,变量,61,一、二 项 分 布,62,离散型随机变量的分布,哺乳动物,种子,穗子,生物个体,雄性,雌性,发芽,不发芽,有芒,无芒,成活,死亡,对立事件,一、二项分布的概率函数,非此即彼,63,一、二项分布,64,在种子发芽试验中,设事件A为“种子发芽”,则 A为“种子不发芽”。取4粒种子(n=4)来做试验,求有2粒种子发芽(x=2)的概率。,在贝努里试验中,独立将此试验重复n次,求在n次试验中,一种结果A出现x次的概率P(x)是多少。,在4次试验中,事件A发生2次的方式有以下 种:,65
20、,由于试验是独立的,按概率的乘法法则,于是有:P()=P()=P()=P()P()P()P()=,其中Ax(x=1,2,3,4)表示第x粒种子发芽,p为种子发芽的概率;(x=1,2,3,4)表示第x粒种子不发芽,q为种子不发芽的概率,所以q=1-p。,66,又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 粒种子中正好有2粒种子发芽的概率为:,P4(2)=P()+P()+P()=,一般,在n重贝努利试验中,事件A恰好发生k(0kn)次的概率p(x)为 x=0,1,2,n,67,若把上式与二项展开式,Cn0qn+Cn1p1qn-1+Cn2p2qn-2+Cn3p3qn-3+
21、Cnxpxqn-x+Cnnpn,=,n,x=0,Cnxpxqn-x,68,相比较就可以发现,在n重贝努里试验中,事件A发生x次的概率恰好等于展开式中的第x+1项,所以把P(x)称为随机变量x服从参数为n和p的二项分布(binomial distribution),也称为贝努里分布,记作B(n,p)。这种“非此即彼”的事件所构成的总体称为二项总体。,69,二项总体,试验只有两个对立结果,记为A和A,出现概率分别为p和q=1-p。,重复性:每次试验条件不变时,事件A出 现为恒定概率p;独立性:任何一次试验中事件A的出现与其余各次试验结果无关。,一、二项分布,二项分布的两个条件:,70,71,n=试
22、验次数(或样本含量)n=4x=在n次试验中事件A出现的次数 x=2p=事件A发生的概率(每次试验是恒定的)p=0.91-p=事件A不发生的概率 1-p=0.1p(x)=X的概率函数=P(X=x)P(2),则4粒种子有两粒发芽的概率为:P(x)=p2 q4-2=60.920.12=0.0486,例:,72,由于二项式中p+q=1,,(p+q)n=1,p(0)+p(1)+p(2)+p(x)+p(n)=1,一、二项分布,或者n个事件构成一个完全事件系,所以有:,73,现已求出某事件发生的概率,若试验N次,则该事件发生的理论次数为:理论次数NP(x),二项分布的概率累积函数为:,74,3:1,若每次观
23、察4株,共观察100次,问红花为0、1、2、3、4株的概率各为多少?,(二)二项分布的计算,例:豌豆红花纯合基因和白花纯合基因杂交,杂交后F2红花:白花3:1,F1,F2,75,概率函数 Cnxpxqn-x P(x)F(x)NP(x)P(0)C40p0q4 0.0039 0.0039 0.39 P(1)C41p1q3 0.0469 0.0508 4.69 P(2)C42p2q2 0.2109 0.2617 21.09 P(3)C43p3q1 0.4219 0.6836 42.19 P(4)C44p4q0 0.3164 1.000 31.64 合计 1.000 100,表 观察4株出现红花的概率
24、分布表(p=0.75 q=1-p=0.25),76,例2:鸡蛋孵化率为0.90,从中每次选5个进行孵化,试求孵出小鸡的各种可能概率,若做1000次试验,其理论次数分别为多少?,77,二项分布概率函数,概率的计算,样本容量的确定,p(x)Cnxpx(1-p)n-x,78,例:某小麦品种在田间出现自然变异的概率为0.0045,(1)调查100株,获得两株或两株以上变异植株的概率是多少?(2)期望有0.99的概率获得1株或1株以上的变异植株,至少应调查多少株?,n=100,p=0.0045,P(x2)=1-P(0)-P(1)=0.0751,P(0)=0.01,n=1021(株),79,一、二项分布,
25、(三)二项分布的形状和参数,(1)当p值较小且n不大时,分布是偏倚的。随n的增大,分布趋于对称;,二项分布的形状由n和p两个参数决定。B(n,p),80,一、二项分布,(三)二项分布的形状和参数,(2)当p值趋于0.5时,分布趋于对称。,81,统计学证明,服从二项分布B(n,p)的随机变量所构成的总体的平均数、标准差与n、p这两个参数有关。,一、二项分布,(三)二项分布的形状和参数,n p,82,在二项分布中,事件A发生的频率 x/n称为二项成数,即百分数或频率。则二项成数的平均数和标准差分别为:也称为二项总体百分数的标准误,当 p 未知时,常以样本百分数 来估计。此时上式改写为:=称为样本百
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三章 概率与概率分布 第三 概率 分布

链接地址:https://www.31ppt.com/p-2338786.html