概率论与数理统计22连续型随机变量及其分布.ppt
1,2.2 连续型随机变量及其分布 1.连续型随机变量 2.均匀分布3.指数分布4.正态分布,2,在前面我们学习一类离散型随机变量,主要特点是它仅取有限或可数个值,并且取每个值的概率大于0.但在实际问题中,我们时常需要考虑另外一类随机变量.如:(1)随机地向区间0,1上投点,其落点的位置,可在0,1上取值;(2)日光灯泡的使用寿命可在0,+)上取值等.更为重要的是,它们取每个给定值的可能性均为0.这时,我们该怎样刻画这些随机变量呢?,1.连续型随机变量,3,定义 设随机变量X的分布函数为F(x),若存在非负可积函数f(x),使得对于任意实数 x,都有 则称X为连续型随机变量,称 f(x)为X的概率密度函数(Probability Density Function),简称概率密度或密度函数.,4,由定义可知,连续型随机变量X的分布函数F(x)在x点的函数值等于其概率密度函数f(x)在区间(-,x 上的积分,故同时,密度函数f(x)反映了概率在 x点附近的“密集程度”,所以用密度函数描述连续型随机变量的概率分布与离散型随机变量用分布列描述,在某种意义上有相似之处。,5,一个连续型随机变量的分布由它的密度函数所决定,F(x)的值在几何上可以表达为 t 轴以上曲线 y=f(t)以下直线 t=x以左部分的面积.,6,类似于离散型随机变量,连续型随机变量X的概率密度函数f(x)具有如下基本性质:,反过来,若已知一个函数f(x)满足上述性质(1)和(2),则一定是某连续型随机变量X的概率密度函数,7,另外,对连续型随机变量X的分布,还具有如下性质:1.对于任意实数 2.即X落在区间的概率为密度函数 y=f(x)与直线 x=a,x=b及 x 轴所围面积.,8,3.连续型随机变量X取任一确定值a的概率为0,从而,即,在计算连续型随机变量X落在某一区间的概率时,可不必区分是开区间、闭区间还是半开半闭区间。,9,概率为零的事件未必是不可能事件;,注意,概率为1的事件也不一定是必然事件,事件A是不可能事件,事件A是必然事件,10,(1)0F(x)1,x,(2)F(x)是 x 的单调不减函数;(3),连续型随机变量的其它若干结论,11,例:设随机变量X的密度函数为,求分布函数F(x).,12,解:f(x)的图形如图,13,从而得,其图像为,14,例:设随机变量X的密度函数为,(1)确定常数A(2)计算概率,解 由密度函数性质,15,例:某批晶体管的使用寿命X(以小时计)具有密度函数,任取其中5只,求:使用最初150小时内,无一晶体管损坏的概率.(2)使用最初150小时内,至多有一只晶体管损坏的概率.,16,解 任一晶体管使用寿命超过150小时的概率为,设Y为任取的5只晶体管中使用寿命超过150小时的晶体管数,则Y,故有,17,练习1:试确定常数a,使,为某个随机变量X的概率密度,且计算事件1.5X 2的概率.,练习2 已知连续型随机变量X的概率密度为,求 X 的分布函数,18,2解,1解 a=2,19,两种类型的比较:,连续型,1.概率密度 f(x):,2.,4.P(aXb)=P(aXb)=P(aXb)=P(aXb)=F(b)-F(a)=,离散型,1.概率分布:pk=P(X=xk)(k=1,2,.),2.,3.P(aa)=1-F(a);P(X=a)=F(a)-F(a-0),4.P(XA)=,5.F(x)有可列个间断点,且右连续,5.F(x)连续,且,P(X=a)=0,20,几种常见的连续型随机变量的分布,均匀分布指数分布正态分布,21,2.均匀分布,定义:若连续型随机变量X的概率密度为,则称X在区间 a,b上服从均匀分布记为XUa,b,分布函数为,22,密度函数f(x)与分布函数F(x)的图形如图和图所示,23,意义:,X“等可能”地取区间a,b中的值,这里的“等可能”理解为:X落在区间a,b中任意等长度的子区间内的可能性是相同的。或者说X落在子区间内的概率只依赖于子区间的长度而与子区间的位置无关。即X取值在a,b上是均匀的。,24,若X在a,b上服从均匀分布,对区间内的任一个区间c,d,有,25,例2 102电车每5分钟发一班,在任一时刻某一乘客到了车站.求乘客候车时间不超过2分钟的概率.,解1:设随机变量X为候车时间,则XU0,5均匀分布,故,解2(几何概率),0,2,5,26,例 设随机变量X服从-1,2区间上的均匀分布,求X的分布函数.,解,如图:,-1,2,-2,1,3,F(1),x,f(x),(1)x-1时,(2)-1x 2时,(3)2x时,分布函数为,27,分布函数为,3.指数分布,定义 若连续型随机变量X的概率密度为,其中0,则称X服从参数为的指数分布.,28,指数分布的密度函数f(x)与分布函数F(x)的图形如图和图所示,29,注:在应用中,寿命问题常看作近似服从指数分布.如灯泡的寿命、动物的寿命、电话的通话时间等等都近似服从指数分布.其中表示平均寿命的倒数.,30,指数分布的无记忆性,设随机变量X服从参数为指数分布,设s 0,t 0,则,31,即,假如X表示寿命的大小,则上式表示:如果已知寿命长于s年,则再存活t年的概率与年龄s无关.,指数分布是唯一具有“无记忆性”性质的连续型分布.,32,例 设随机变量X具有概率密度,试确定常数k,并求,解 由,解得k=3.于是X的概率密度为,33,例假设某元件的寿命服从参数=0.0015的指数分布,求它使用1000小时后还没有坏的概率.,解设为该元件的寿命,则,34,4.正态分布,正态分布最早是德莫弗()在1733研究二项分布的极限分布形式时提出的,在当时没有引起学术界的重视。后来,高斯()在1809年,拉普拉斯()在1812年分别重新提出,所以正态分布又称为高斯分布或高斯拉普拉斯分布.,35,正态分布是概率论中最重要的分布之一.例如,测量的误差、一批产品的质量指标、人体的身高或体重、农作物的单位面积产量、炮弹弹着点的分布、气象中的月平均气温、湿度、降水量等都服从或近似服从正态分布.另外,正态分布又具有许多良好的性质,许多分布可用正态分布来近似,它能描述相互独立的多个微小因素的综合效果,在数理统计中解决实际问题时用得最多的就是正态分布或与正态分布有关.,36,则称随机变量X服从参数 的正态分布.记为,定义 若连续型随机变量X的概率密度函数为,服从正态分布的随机变量又称为正态变量,37,正态分布密度函数f(x)的性质与图形,定义域为(-,+);,对称性:关于 x=对称;,单调性:在区间(-,)单调上升,在区间(,+)单调下降;,极值:,38,凹凸性:凸弧(-,+),凹弧(-,-)(+,+),渐进线:y=0.,拐点:,图像:,39,当固定而值改变时,曲线沿着x轴平移,形状不变.故称为位置参数.,40,当 固定而变小时,曲线变得陡峭,即分布越集中于 的附近;反之,变大时,曲线变得平缓,即分布越分散.故称为离散参数.,41,正态分布的分布函数,42,特别地,当 即 N(0,1)分布称为标准正态分布,其概率密度函数为,标准正态分布,43,标准正态分布的概率密度函数图像如图所示:,44,服从标准正态分布的随机变量落在区间内的概率的计算:,45,由于积分 不能用常规方法计算,我们把分布函数(x)的值编制成“标准正态分布表”.,(1)当 x 0时,由标准正态分布表可以查出函数(x)的数值,(2)已知b求a使(a)=b,反过来查标准正态分布表可得a的值.如(a)=0.9750,查表得a=1.96.,(3)当 x0时,利用标准正态分布密度函数图形的对称性可得,46,一般地,若XN(0,1),则(1)P(X=a)=0;(2)P(Xa)=P(Xa)=P(Xa)=1(a);(4)P(aXb)=(b)(a);(5)P(|X|a)=P(-aXa)=(a)(-a)=(a)(1(a)=2(a)1,47,非标准正态分布的计算,证,48,意义:仅依靠标准正态分布表,便可求得所有正态分布的函数值,且可求得X落在任意区间a,b的概率:,49,例 设XN(0,1),求P(1X3),解,50,例设N(0,1),计算,解,51,例 设XN(1,22),求P(0X1.6),解,52,例 设XN(0,1),P(Xa)=0.9515,P(Xb)=0.0495,求a,b.,解:(a)=0.95151/2 所以,a0 反查表得(1.66)=0.9515 故a=1.66,而(b)=0.04950,反查表得(1.65)=0.9505,即-b=1.65故 b=-1.65,53,若,则,故,54,55,可见,服从正态分布 的随机变量X,虽然理论上可以取任意实数值,但实际上它的取值落在区间 内的概率约为68.26%;落在区间 内的概率约为95.44%;落在区间 内的概率99.74%.因此,服从正态分布 的随机变量X落在区间 之外的概率约0.26%,还不到千分之三,这是一个小概率事件,在实际问题中认为它几乎是不可能发生的,这就是著名的“3”原则它在实际中常用来作为质量控制的依据,56,例 设XN(,2),P(X-1.6)=0.036,P(X5.9)=0.758.求及.,解,反查表得:,反查表得:,联立解方程组得:=3,=3.8,57,标准正态分布的双侧分位数,设XN(0,1),满足,则称 为标准正态分布的双侧分位数,或,58,59,即,或,60,(2)设 XN(2,22),Y=a X+bN(0,1).求a,b.,所以 a=1/2 b=-1,(1)设XN(,2),P(X-5)=0.045,P(X3)=0.618.求及,课堂练习:,=1.76=4,解:(1),(2),