《概率论与数理统计课件第2章.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计课件第2章.ppt(118页珍藏版)》请在三一办公上搜索。
1、第2章 随机变量及其分布,2.1 随机变量及其分布函数,2.4 连续型随机变量及其密度函数,2.3 几种常见的离散型分布,2.2 离散型随机变量及其分布律,2.6 随机变量函数及其分布,2.5 正态分布,2.1 随机变量及其分布函数,一、随机变量,二、随机变量的分布函数,一、随机变量,例,袋中有3只黑球,2只白球,从中任意取出3只球,观察取出的3只球中的黑球的个数我们将3只黑球分别记作1,2,3号,2只白球分别记作4,5号,则该试验的样本空间为,我们记取出的黑球数为 X,则X 的可能取值为1,2,3因此,X是一个变量但是,X取什么值依赖于试验结果,即X的取值带有随机性,所以,我们称 X 为随机
2、变量X 的取值情况可由下表给出:,由上表可以看出,该随机试验的每一个结果都对应着变量 X 的一个确定的取值,因此变量 X 是样本空间上的函数:,我们定义了随机变量后,就可以用随机变量的取值情况来刻划随机事件例如,表示至少取出2个黑球这一事件,等等,表示取出2个黑球这一事件;,例,一大批产品中次品率为p,从中任取n件,求其中最多有k件次品的概率。,求P(B),Bernoulli试验中,A表示成功,可设,此处用w表示样本空间,并非样本空间中只有一个元素w,而是用w表示所有的元素。,随机变量的定义,定义:设随机试验E的样本空间是=w,如果对于每一个w,有一个实数X(w)与之对应,且对任何一个实数 是
3、随机事件,这样就得到一个定义在上的单值实值函数X=X(w),称X=X(w)为随机变量,简记为X。,说 明,例1 盒中有5个乒乓球,其中2个白球,3个黄球,从中任取3个,记X=“取到白球的个数”,则X是一个随机变量,且X的可能取值是0,1,2,且有,例2 上午 8:009:00 在某路口观察,令Y:该时间间隔内通过的汽车数则Y 就是一个随机变量它的取值为 0,1,,表示通过的汽车数小于100辆这一随机事件;,表示通过的汽车数大于 50 辆但不超过 100辆这一随机事件,随机变量概念的产生是概率论发展史上的重大事件.引入随机变量后,对随机现象统计规律的研究,使人们可利用数学分析的方法对随机试验结果
4、进行广泛而深入的研究.,随机变量因其取值方式的不同,,通常分为两类:,离散型,随机变量,连续型,非离散型,其它,称为X的分布函数,0,x,x,X,设X是一个随机变量,是任意实数,函数,几何定义:,二、随机变量的分布函数,X的分布函数为,出现的点数小于x的概率,1,2,3,4,5,6,例3,掷一枚骰子,设X表示出现的点数,其可能取值为,没有可能的点数,包含出现1点,包含出现1,2点,包含出现1,2,3点,包含出现1,2,3,4点,包含出现1,2,3,4,5点,包含出现1,2,3,4,5,6点,分布函数是累计概率,分布函数的性质,(1),(3)F(x)右连续,即,(2),如果一个函数具有上述性质,
5、则一定是某个r.v X 的分布函数.也就是说,性质(1)-(3)是鉴别一个函数是否是某 r.v 的分布函数的充分必要条件.,例4,判别下列函数是否为某随机变量的分布函数?,(1),解,(1),由题设,右连续,并有,例4,判别下列函数是否为某随机变量的分布函数?,(2),不可能是分布函数.,所以,解,用分布函数F(x)表示的事件概率计算公式,例5,解,(1)因为分布函数右连续,且,2.2 离散型随机变量及其分布律,一、离散型随机变量的分布律,二、离散型随机变量的分布函数,定义 如果一个随机变量仅可能取得有限个或可数无穷多个数值,并且所有的数可按一定的顺序排列,则称该随机变量为离散型随机变量.,设
6、离散型随机变量X其可能的取值为,称,为离散型随机变量X的概率分布或概率函数,也称为分布列或分布律,一、离散型随机变量的分布律,表格形式,分布列的性质:,概率直方图,另外还可用图形来表示分布律:线条图、概率直方图.,P,X,例1,袋中有1个白球和4个黑球,每次不放回地从中任取一个球,直至取得白球为止,求取球次数的概率分布.,解,设X为取到白球时的取球次数,X的可能取值为,1,2,3,4,5,不难求得,因此,所求的概率分布为,即,,二、离散型随机变量的分布函数,如图,,是一个阶,它在,有跳跃,,反之,,梯函数,,跳跃度恰为随机变量,例2 设一汽车在开往目的地的道路上需经过四盏信号灯,每盏信号灯以
7、1/2 的概率允许或禁止汽车通过.以X表示汽车首次停下时,它已通过的信号灯的盏数,求X的分布律.(信号灯的工作是相互独立的).,PX=3=(1-p)3p,可爱的家园,解 以p表示每盏信号灯禁止汽车通过的概率,则X的分布律为:,pk,p,或写成 PX=k=(1-p)kp,k=0,1,2,3,0,1,2,3,4,(1-p)p,(1-p)2p,(1-p)3p,(1-p)4,X,PX=4=(1-p)4,以p=1/2代入得X的分布律:,Xpk,0 1 2 3 4,0.5 0.25 0.125 0.0625 0.0625,X的分布函数为,分布函数是累计概率,例3,有人对随机变量X的分布列表述如下:,求.,
8、解,根据概率分布的性质,所以,解得,(舍去),作业,P47练习2.1 2,P51练习2.2 1 2,2.3 几种常见的离散型分布,一、两点分布,二、二项分布,三、泊松(Poisson)分布,定义,其分布为,且,特别地,点分布,即,一、两点分布,两点分布是最简单的一种分布,任何一个只有两种可能结果的随机现象,比如新生婴儿是男还是女、明天是否下雨、种籽是否发芽等,都属于两点分布.,说明,例1 抛掷一枚质地均匀的硬币,有两种可能的结果:H表示正面朝上,T表示背面朝上,引入变量X,令,pi=P X=i=0.5(i=0,1),X的概率分布表:,概率分布为,例2,200 件产品中,有 196 件是正品,则
9、,服从参数为 0.98 的两点分布.,于是,4 件是次品,今从中随机地抽取一件,若规定,二、二项分布,很显然,n重伯努利试验中成功的次数服从二项分布,事实上,二项分布就是来源于n重伯努利试验模型,n=1时,,即 PX=0=1-p,PX=1=p,PX=k=pk(1-p)1-k,(k=0,1),,(0-1)分布,性质,二项分布的图形特点:,注:,例3 一张考卷上有5道选择题,每道题列出4个可能答案,其中只有一个答案是正确的某学生靠猜测至少能答对4道题的概率是多少?,解 每答一道题相当于做一次伯努利试验,,则,例4 按规定,某种型号电子元件的使用寿命超过1500小时的为一级品.已知某批产品的一级品率
10、为0.2,现在从中随机地抽取20只,问20只元件中恰有k(k=0,1,2,20)只为一级品的概率为多少?,记X为20只元件中一级品的只数,解,解:将每次射击看成一次试验,设击中的次数为X,则XB(400,0.02),某人进行射击,设每次射击的命中率为0.02,独立射击400次,求至少击中两次的概率。,所求概率为,随机变量X所有可能取值为0,1,2,取各个值的概率,称X服从参数为的泊松分布,记为XP().,(1)P X=k0.,三、泊松(Poisson)分布,性质,泊松分布的背景及应用,二十世纪初卢瑟福和盖克两位科学家在观察与分析放射性物质放出的 粒子个数的情况时,他们做了2608次观察(每次时
11、间为7.5秒)发现放射性物质在规定的一段时间内,其放射的粒子数X服从泊松分布.,电话呼唤次数,交通事故次数,商场接待的顾客数,地震,火山爆发,特大洪水,在生物学、医学、工业统计、保险科学及公用事业的排队等问题中,泊松分布是常见的.例如地震、火山爆发、特大洪水、交换台的电话呼唤次数等,都服从泊松分布.,例5,一输电网一年中意外输电中断的次数服从参数为6的Poisson分布,问一年中不多于两次意外断电的概率.,解,设一年中的意外断电次数为X,所以,一年中不多于两次断电的概率为,=0.06197,查表(累积概率),二项分布的泊松逼近,对二项分布,计,算其概率很麻烦.,例如,,要计算n=5000,故须
12、寻求近似计算方法.,这里先介绍二项分布的,泊松逼近,,在第五章中还将介绍二项分布的正态,逼近.,泊松定理,每次试验中发生的概率为,为常数),则有,该定理于1837年由法国数学家泊松引入!,可见,当n充分大,p又很小时,可用泊松分布来近似二项分布!,实际计算中,,时近似效果变很好.,由泊松定理,n重伯努利试验中稀有事件出现的次数近似地服从泊松分布.,我们把在每次试验中出现概率很小的事件称作稀有事件.如地震、火山爆发、特大洪水、意外事故等等,例6 一家商店采用科学管理,由该商店过去的销售记录知道,某种商品每月的销售数可以用参数 的泊松分布来描述,为了以 95%以上的把握保证不脱销,问商店在月底至少
13、应进该种商品多少件?,解,设该商品每月的销售数为,的泊松分布.,设商店在月底应进该种商品,件,即,查泊松分布表,得,保险公司为了估计企业的利润,需要计算投保人在一年内死亡若干人的概率。设某保险公司的某人寿保险险种有1000人投保,每个人一年内死亡的概率为0.005个,试求在未来一年中在这些投保人中死亡人数不超过10人的概率,对每个人而言,在未来一年是否死亡相当于做一次伯努利试验,1000人就是做1000重伯努利试验,因此 XB(1000,0.005),,解,由泊松定理,作业,P58练习2.3 1 2,2.4 连续型随机变量及其密度函数,一、密度函数,二、有关事件的概率,三、几种常见的连续型分布
14、,简称密度函数或分布密度.,(或分布密度函数),一、密度函数,定义,分布函数与密度函数几何意义,根据定义,可以得到密度函数的如下性质,常利用这两个性质检验一个函数能否作为连续型随机变量的密度函数.,二、有关事件的概率,=0,事实上,积分中值定理,例1,设随机变量X的密度函数为,求常数A及X的分布函数和,解,所以,1.如果随机变量X的密度函数为,从密度函数的意义可知,三、几种常见的连续型分布,均匀分布的分布函数为,均匀分布的意义,例2,某公共汽车站从上午7时起,每15分钟来一,班车,即7:00,7:15,7:30,7:45 等时刻有汽车到达,此站,如果乘客到达此站时间,是7:00到7:30之,间
15、的均匀随机变量,试求他候车时间少于5分钟的,概率.,解,以7:00为起点 0,以分为单位,依题意,解,以 7:00 为起点 0,以分为单位,依题意,为使候车时间少于 5 分钟,乘客必须在 7:10 到,7:15 之间,或在 7:25 到 7:30 之间到达车站,故所,求概率为,即乘客候车时间少于5分钟的概率是 1/3.,例3 设随机变量 X 在 2,5 上服从均匀分布,现对 X 进行三次独立观测,试求至少有两次观测值大于3 的概率.,X 的分布密度函数为,X 3 表示“对 X 的观测值大于 3 的概率”,解,因而有,设Y 表示3次独立观测中观测值大于3的次数,则,2.如果随机变量 X的密度函数
16、为,则称X服从参数为 的指数分布,的几何图形如图.,注:,指数分布常用来描述对某,一事件发生的等待时间.例如,,乘客在公交车站等车的时间,电子元件的寿命等,因而它在可靠性理论和排队论中有广泛的应用.,指数分布的重要作用,是常用它来作为各种“寿命”的近似,如通讯、保险、随机服务系统等方面,3.分布(略),例4,某保险公司想开展一种新的寿险业务,被保险人需一次性缴纳保费1000元,若被保险人在10年内死亡,保险公司将赔负5000元,假设人的寿命服从参数为1/65的指数分布.试帮保险公司做出决策.,解,假设某人的寿命为X,假设某人投保时年龄超过S岁,则此人再活10年以上的概率为,因此,被保险人在10
17、年内死亡的概率为,所以保险公司对该被保险人的预期收益为,1000-0.1426*5000=287(元),结论:保险公司可以开展这种保险业务.,一般化,在已活s年的基础上,再活t年的概率等于寿命大于t年的概率.,指数分布永远年轻,作业,P63 练习2.4 1 2 4,2.5 正态分布,一、正态分布的密度函数及其特点,二、标准正态分布,三、一般正态分布与标准正态分布的关系,一、正态分布的密度函数及其特点,正态概率密度函数的几何特征,正态分布的分布函数,正态分布是最常见最重要的一种分布,例如测量误差,人的生理特征尺寸如身高、体重等;正常情况下生产的产品尺寸:直径、长度、重量高度等都近似服从正态分布.
18、,正态分布的应用与背景,正态分布下的概率计算,原函数不是初等函数,方法二:转化为标准正态分布查表计算,方法一:利用统计软件计算,标准正态分布的概率密度表示为,标准正态分布的分布函数表示为,二、标准正态分布,标准正态分布的图形,标准正态分布具有如下特点,标准正态分布具有如下特点,例1,=0.7517,=1-0.9591=0.0409,=0.8925,=2*0.975-1=0.95,=0.9591-1+0.7517=0.7108,=2*(1-0.9671)=0.0658,例1,=0.7517,=1-0.9591=0.0409,=0.8925,=2*0.975-1=0.95,=0.9591-1+0.
19、7517=0.7108,=2*(1-0.9671)=0.0658,例2,例2,三、一般正态分布与标准正态分布的关系,一般正态随机变量:X N(,2),其分布函数,作变量代换,(1)一般正态随机变量与标准正态随机变量的分布 函数之间的关系,三、一般正态分布与标准正态分布的关系,对一般的正态随机变量:X N(,2),其分布函数,作变量代换,(1)一般正态随机变量与标准正态随机变量的分布 函数之间的关系,命题:若,则,证明:,作变量代换,得到,。由此知:,(2)一般正态随机变量与标准正态随机变量之间的 关系,例3,=2*0.8413-1=0.6826,=2*0.97725-1=0.9545,=2*0
20、.99865-1=0.9973,事件的发生几乎是必然的,服从正态分布 的随机变量X 落在区间 内的概率为0.9973,落在该区间外的概率只有0.0027.也就是说,X几乎不可能在区间 之外取值。,由3 原则知,,服从正态分布 的随机变量X 落在区间 内的概率为0.9973,落在该区间外的概率只有0.0027.也就是说,X几乎不可能在区间 之外取值。,由3 原则知,,例4 从某地去火车站有两条路线,第一条路线经过市区,路程较短,但交通拥挤,所需时间(分钟)服从正态分布N(50,100),第二条路线经环城路,路程较长,所需时间服从正态分布N(60,16),若只有70分钟可用,应走哪一条路线?若只有
21、65分钟呢?,解 设所需时间分别为T和X,显然应走在允许的时间内有较大概率及时赶到火车站的路线.,(1)在70分钟内,两条路线能及时赶到的概率分别为,因此在这种情况下,应走第二条路线.,(2)在65分钟内,两条路线能及时赶到的概率分别为,因此在这种情况下,应走第一条路线.,作业,P68 练习2.5 2 3 4,2.6 随机变量函数及其分布,一、随机变量函数的定义,二、离散型随机变量函数的分布,三、连续型随机变量函数的分布,实例,两个赌徒用一枚骰子进行赌博,甲若掷出x点,则可得(或付)10 x-35元,分析甲在一次掷骰子中的输赢.,显然,一、随机变量函数的定义,分别就离散型随机变量和连续型随机变量进行讨论,问题,定义:设 是 上的实值函数,是 上的随机变量,在 上定义随机变量,称 为随机变量 的函数,记作,Y 的可能值为,即 0,1,4.,解,例1,二、离散型随机变量函数的分布,故 Y 的分布律为,由此归纳出离散型随机变量函数的分布的求法.,离散型随机变量的函数的分布,Y 的分布律为,解,第一步 先求Y=2X+8 的分布函数,解,例3,三、连续型随机变量函数的分布,解,例3,第二步 由分布函数求概率密度.,解,例4,再由分布函数求概率密度.,当 Y=2X+3 时,有,证明,X 的概率密度为,例5,作业,P71练习2.6 1 2,P72习题二,
链接地址:https://www.31ppt.com/p-6475409.html