大学概率与统计第2节概率.ppt
1,第二节,概率,2,研究随机现象,不仅关心试验中会出现哪些事件,更重要的是想知道事件出现的可能性大小,也就是事件的概率.,概率是随机事件发生可能性大小的度量,事件发生的可能性越大,概率就越大!,3,现在,让我们看一个 的故事,从死亡线上生还,本来,这位犯臣抽到“生”还是“死”是一个随机事件,且抽到“生”和“死”的可能性各占一半,也就是各有 1/2 概率.但由于国王一伙“机关算尽”,通过偷换试 验条件,想把这种 概率只有1/2 的“抽到死签”的随机事件,变为概率为 1 的必然事件,终于搬起石头砸了自己的脚,反使犯臣得以死里逃生.,4,了解事件发生的可能性即概率的大小,对人们的生活有什么意义呢?下面举几个例子.,例如,了解发生意外人身事故的可能性大小,确定保险金额.,5,了解来商场购物的顾客人数的各种可能性大小,合理配置服务人员.,6,了解每年最大洪水超警戒线可能性大小,合理确定堤坝高度.,7,对一个随机事件A,我们用一个数 P(A)来表示 A 发生的可能性大小,称之为随机事件A 的概率.,那么,怎么来规定 P(A)的大小呢?,8,定义 在相同的条件下进行n次试 验,其中事件A 发生的次数nA称为频数,比值nA/n称为频率,记为fn(A).,既然概率 P(A)度量了随机事件A发生的可能性大小,可以预料,在大量的重复试验中,若P(A)较大,则频率也较大;反之,若P(A)较小,则 频 率也较小,而且概率P(A)应与频率有许多相似的性质.下面我们先对频率的性质进行一番考察.,一、事件的频率与概率,9,这个性质称为频率的可加性.,当大量重复同一试验时,事件A发生的频率往往 呈现一定的稳定性.,10,例1 历史上曾有人做过试验,试图证明抛掷匀质硬币时,出现正反面的机会均等.,11,数据引自L.Brillouin,Science and Information Theory,New York,1956,例2 英文字母被使用的频率相当稳定.,字母使用频率的研究,对键盘设计、铅字铸造、信息编码、密码破译等方面都是十分有用的.,12,请回答:,福尔摩斯破密码,请看,?,福尔摩斯为什么能破译出那份密码?,对案情的深入了解和分析;,运用字母出现的规律.,13,根据上述频率稳定性的讨论,似乎可以提出这样的猜想,即当n足够大时,fn(A)与 P(A)应充分接近.,在不少实际问题中,当概率不易求出时,人们常取实验次数很大时事件的频率作为概率的估计值.这种用频率估计概率的方法称为频率方法.,事件的频率在一定程度上能反映事件发生的概率,下面根据频率的基本特性,给出 概率的公理化定义.,14,二、概率的公理化定义,定义 如果对任意事件A,都有一个实数 P(A),满足以下条件:,(1)非负性,(2)规范性,(3)可列可加性,则称 P(A)为事件A的概率.,15,三、概率的性质,由概率的三条公理,我们可以推导出概率的若干性质.下面我们给出概率的一些重要性质.,性质1,证,利用概率的可列可加性及规范性,有,再由概率的非负性,,16,性质2(有限可加性),证,由可列可加性及性质1,得,17,性质3,证,特别地,对立事件的概率有,事件组,则有,18,性质3,证,特别地,对立事件的概率有,事件组,则有,19,性质4,证,由可加性知,移项即得结论.,20,推论,2.对任意事件A,有,注,若没有条件,则公式应改为,性质4,证,由可加性知,移项即得结论.,21,性质5(加法公式),证明,对任意两个事件A,B,有,由性质4得,推论:,一般地,,22,推广:三个事件的加法公式,证明留作练习.,一般地,23,例3,解,24,例4,解,(1)A发生但B不发生的概率为,(2)B发生但A不发生的概率为,(3)A与B至少有一个发生的概率为,25,例5,解,26,四、古典概型,假定某个试验有有限个可能的结果,假定从该试验的条件及实施方法上去分析,我们找不到任何理由认为其中某一结果例如ei 比任一其他结果例如ej 更有优势,则我们只好认为所有结果在试验中有同等可能的出现机会,即 1/N的出现机会.,e1,e2,eN,27,常常把这样的试验结果称为“等可能的”.,试验结果,28,2,3,4,7,9,10,8,6,1,5,例如,一个袋子中装有10个大小、形 状完全相同的球.将球编号为110.把球搅匀,闭上眼睛,从中任取一球.,因为抽取时这些球是完全平等的,我们没有理由认为10个球中的某一个会比另一个更容易取得.也就是说,10个球中的任一个被取出的机会是相等的,均为1/10.,29,称这种试验为古典概型.,若随机试验满足下述两个条件:(1)它的样本空间只有有限多个样本点;(2)每个样本点出现的可能性相同.,称此概率为 古典概率.这种确定 概率的方法称为古典方法.,定义(概率的古典定义)在古典概型下,若所有基本事件总数为n,而事件A包含了其中的m个(称为有利场合数),那么事件A的概率定义为,30,求概率问题转化为计数问题.,排列组合是计算古典概率的重要工具.,1.加法原理,设完成一件事有m类方式,,第一类方式有n1种方法,,第二类方式有n2种方法,第m类方式有nm种方法.,则完成这件事总共有n1+n2+nm 种方法.,特点:一步完成,31,例如,某人要从甲地到乙地去,甲地,乙地,可以乘火车,也可以乘轮船.,火车有两班,轮船有三班,乘坐不同班次的火车和轮船,共有几种方法?,3+2 种方法,回答是,32,2.乘法原理,设完成一件事有m个步骤,,第一个步骤有n1种方法,,第二个步骤有n2种方法,第m个步骤有nm种方法.,特点:多步完成,例如,A地到B地有两种走法,B地到C地有三种走法,C地 到 D地有四种走法,则 A地到 D 地共有,种走法.,33,特别,k=n时称全排列,排列、组合的定义及计算公式,1.排列:,从n个元素中取 k个不同元素的排列数为:,阶乘,若允许重复,则从n个元素中取 k个元素的排列数为:,注意,34,2.组合:,从n个元素中取 k个元素的组合数为:,推广:n个元素分为s组,各组元素数目分别为r1,r2,rs的分法总数为,35,例6 在11张卡片上分别写上 probability 这 11 个 字母,从中任取7 张,求其恰好排列成 ability 的概率.,假定字母b及i是可辨的,,解,古典概率计算举例,36,至少有两张同号的情况比较复杂,但它的反面即没有同号的概率比较容易求,,例7 某一副扑克牌13张黑桃,有放回取3次,求至少有两张同号的概率.,分析,解,37,例8 某城市的电话号码由5个数字组成,每个数字可能是从 09 这10个数字中的任一个,求电话号码由5个不同数字组成的概率.,解,问:,错在何处?,计算样本空间样本点总数和所求事件所含样本点数计数方法不同.,从10个数字中取5个不同数字的排列,允许重复的排列,38,例9 在12000的整数中任取一数,求取到的数(1)能被6或8整除的概率;(2)既不能被6也不能被8整除的概率;(3)能被6整除而不能被8整除的概率.,设A取到的数能被6整除;,解,B取到的数能被8整除.,39,例9 在12000的整数中任取一数,求取到的数(1)能被6或8整除的概率;(2)既不能被6也不能被8整除的概率;(3)能被6整除而不能被8整除的概率.,40,练习 在110000的整数中任取一数,求取到的数能被4,5,6之一整除的概率.,解,转下页,41,例10 假设电话号码为8位数(第一位数不为0),,解,引进事件:,则,易见,所以,42,例11 设有N件产品,其中有M件次品,现从这 N件中任取n件,求其中恰有k件次品的概率.,这是一种不放回抽样,称为超几何分布.,次品,正品,M件次品,N-M件正品,解,思考:若是放回抽样呢?,43,例12 全班有50个学生,问至少有两人生日相同的概率为多少?(设一年有365天),解,事件总数:,有利场合数:,概率之大有点出乎意料.从下表中可以看出,当人数超过23时,打赌说至少有两人同生日是有利的.,44,有人同生日的概率,人数,45,例13 一个家庭中,若有两个孩子,问恰都是男孩的概率为多大?假定男女出生率相同.,解,以下解法是错误的:,样本空间取为两男,两女,一男一女,所以 p=1/3.,注意:在古典概型中,样本空间中的基本事件必须是等可能的.,错误在于样本点不是等可能的.,正确的解法是:,样本空间取为(男,男),(男,女),(女,男),(女,女).,所以 p=1/4.,46,四只猫的性别,M:很容易作出错误的概率计算.这儿有两只猫已住在一起.猫先生:亲爱的,我们的新房舍中有几只小猫?猫太太:你不会数呀?4只,你这个笨蛋.猫先生:几只雄猫?猫太太:很难说,我也不知道呢.猫先生:4只猫都是雄的不太可能.猫太太:也不可能4只都是雌猫.猫先生:也许只有1只是雄猫.猫太太:或许只有1只是雌猫.,课外读物,47,M:猫先生的理由对不对?让我们来检验它的理论.用B表示雄猫,用G表示雌猫,这就很容易列出16种同等可能的情况.M:在16种中只有两种是所有猫都具有同样性别,所以,这种情况发生的概率是2/16,或1/8.猫先生认为这种情况具有最低概率是对的.M:现在,让我们检验一下22分配,猫先生认为这是可能性最大的一种.这种情况有6次,所以其 概率是6/16,或3/8.这显然比1/8高.猫先生也许是对的.,猫先生:这也不是很难想出来的,亲爱的.每只猫是雄是雌的机会是一半对一半,所以很明显,最有可能的结果是两个雄的,两个雌的.你还不能把它们算出来吗?,48,M:可是,我们还有一个更大可能的情况要考虑:31分配,由于这种情况有8次,其概率是8/16或1/2.这就比22分配高.我们大概是搞错了吧.,一家 4个孩子最可能的 情况是 3个孩子是一种性别,另一孩子是另一种性别,而不是 两个男孩、两个女孩,这一点使大多数学生感到惊讶.,M:如果我们算出的概率是对的,它们相加应等于l.加一加果然为1.这就向我们说明,三种情况都会发生,猫先生猜错了,最可能的情况是31,而不是22.,在班级里,用 4个硬币反复抛掷很容易作出试验.将每次抛掷结果记录下来.在抛了100次之后,差不多有50次是31组合,而22组合大约是33次.,49,在做了这个练习之后,大家可以考虑在一个有5个孩子或6个孩子的家庭中不同性别组合的概率.,一个类似的问题是关于一手桥牌中4种花色的最可能分布,其答案也同样违反直觉.最不可能的情形自然是 拿到同一花色的13张牌(你拿到这手牌的可能性是分之一).可是最可能出现的情况是什么呢?,即使是很有经验的桥牌手也往往猜想答案是4,3,3,3.这就错了.最可能的一手牌是4,4,3,2.你可以期望这类牌大约要5圈拿到一次;而4,3,3,3这种分布则大约要每9圈或10圈才能拿一次.就是5,3,3,2这种分布也可能是每6圈拿一次.,50,在古典概型的场合,容易知道概率有以下三个基本性质:,(1)非负性,(2)规范性,(3)可加性,(1)(2)是显然的,下面说明(3).,由于A,B互斥,故它们所包含的样本点是不重复的,,设分别为k个和l个,则AB所包含的样本点数为k+l个,,所以,51,*五、几何概率模型,几何概型借助于几何度量确定事件的概率,习惯上称这种概率为几何概率类似于古典概型的有限性和等可能性,几何概型满足下述两个特征:,52,事件A的概率为,对于几何概型下的任何事件A,若A对应于,53,例1.12 某地铁车站每隔5分钟有一列车通过,乘客到达车站的时刻是随机的,求一位乘客候车时间不超过3分钟的概率,记A=候车时间不超过3分钟,则,54,例1.1 在区间(0,1)中随机地取两个数,求两数之差的绝对值小于1/2的概率,解 设x,y为所取的两个数,则样本空间,记,55,则,56,记图中阴影部分区域为D,,所求概率为,其面积为,57,例9(蒲丰投针)平面上 有间隔为d(d0)的等距平行线,向平面任意投掷一枚长为l(ld)的针,求针与任一平行线相交的概率.(P24),注:蒲丰投针问题在概率史上非常著名。这给出了计 算圆周率的另一种方法。将此方法一般化,即可以 通过反复试验和计数的方法来估计概率大小,就是 现在广泛应用的ontearlo方法,