概率论与数理统计第2章.ppt
P43习题一 18,解:设,经过n次交换后,黑球出现在甲袋中,即,2.3 几种常见的离散型分布,一、两点分布,二、二项分布,三、泊松(Poisson)分布,定义,其分布为,且,特别地,点分布,即,一、两点分布,两点分布是最简单的一种分布,任何一个只有两种可能结果的随机现象,比如新生婴儿是男还是女、明天是否下雨、种籽是否发芽等,都属于两点分布.,说明,例1 抛掷一枚质地均匀的硬币,有两种可能的结果:H表示正面朝上,T表示背面朝上,引入变量X,令,pi=P X=i=0.5(i=0,1),X的概率分布表:,概率分布为,例2,200 件产品中,有 196 件是正品,则,服从参数为 0.98 的两点分布.,于是,4 件是次品,今从中随机地抽取一件,若规定,二、二项分布,很显然,n重伯努利试验中成功的次数服从二项分布,事实上,二项分布就是来源于n重伯努利试验模型,n=1时,,即 PX=0=1-p,PX=1=p,PX=k=pk(1-p)1-k,(k=0,1),,(0-1)分布,性质,二项分布的图形特点:,二项分布中最可能出现次数的定义与推导,则称 为最可能出现的次数,当(n+1)p 整数时,在 k=(n+1)p 处的概率取得最大值,例如:独立射击5000次,命中率为0.001,解(1)k=(n+1)p,=(5000+1)0.001=5,求(1)最可能命中次数及相应的概率;,(2)命中次数不少于1 次的概率.,(2)令X 表示命中次数,则 X B(5000,0.001),本例启示,例3 一张考卷上有5道选择题,每道题列出4个可能答案,其中只有一个答案是正确的某学生靠猜测至少能答对4道题的概率是多少?,解 每答一道题相当于做一次伯努利试验,,则,例4,一大批种子发芽率为90%,今从中任取10粒.求播种后,求(1)恰有8粒发芽的概率;(2)不小于8粒发芽的概率。,解,XB(10,0.9),(1)P(X=8)=,P(X=8)+P(X=9)+P(X=10),练习 设X B(2,p),Y B(4,p),已知 P(X1)=8/9,求 P(Y1).,解:由 P(X1)=8/9,知 P(X=0)=1/9.,由此得:P(Y1)=1 P(Y=0),所以 1/9=P(X=0)=(1p)2,,从而解得:p=2/3.,=1-(1p)4=80/81.,随机变量X所有可能取值为0,1,2,取各个值的概率,称X服从参数为的泊松分布,记为XP().,(1)P X=k0.,三、泊松(Poisson)分布,性质,泊松分布的背景及应用,二十世纪初卢瑟福和盖克两位科学家在观察与分析放射性物质放出的 粒子个数的情况时,他们做了2608次观察(每次时间为7.5秒)发现放射性物质在规定的一段时间内,其放射的粒子数X服从泊松分布.,服务台在某时间段内接待的服务次数X;交换台在某时间段内接到呼叫的次数Y;矿井在某段时间发生事故的次数;显微镜下相同大小的方格内微生物的数目;单位体积空气中含有某种微粒的数目,体积相对小的物质在较大的空间内的稀疏分布,都可以看作泊松分布,其参数 可以由观测值的平均值求出。,实际问题中若干是服从或近似服从 Poisson分布的,例5,一输电网一年中意外输电中断的次数服从参数为6的Poisson分布,问一年中不多于两次意外断电的概率.,解,设一年中的意外断电次数为X,所以,一年中不多于两次断电的概率为,=0.06197,查表(P299附表2),例6,解,二项分布的泊松逼近,对二项分布,计,算其概率很麻烦.,例如,,要计算n=5000,故须寻求近似计算方法.,这里先介绍二项分布的,泊松逼近,,在第五章中还将介绍二项分布的正态,逼近.,泊松定理,每次试验中发生的概率为,为常数),则有,该定理于1837年由法国数学家泊松引入!,证明:,可见,当n充分大,p又很小时,可用泊松分布来近似二项分布!,实际计算中,,时近似效果变很好.,在某个时段内:,大卖场的顾客数;,某地区拨错号的电话呼唤次数;,市级医院急诊病人数;,某地区发生的交通事故的次数.,一个容器中的细菌数;,一本书一页中的印刷错误数;,一匹布上的疵点个数;,放射性物质发出的 粒子数;,例7 某一地区,一个人患某种疾病的概率为0.01,设各人患病与否相互独立.现随机抽取200人,求其中至少4人患这种病的概率.,解以X记200人中患此病的人数,,所求概率为,查泊松分布表(附表),则XB(200,0.01).,利用泊松定理,,例8 一家商店采用科学管理,由该商店过去的销售记录知道,某种商品每月的销售数可以用参数=5的泊松分布来描述,为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件?,解:,设该商品每月的销售数为X,已知X服从参数=5的泊松分布.,设商店在月底应进某种商品m件,进货数,销售数,查泊松分布表得,P(Xm)0.05,也即,于是得 m+1=10,或,m=9件,例9 设一只昆虫所生虫卵数为随机变量 X,设各个虫卵是否能发育成幼虫是相互独立的.,已知X P(),且每个虫卵发育,成幼虫的概率为 p.,求一昆虫所生的虫卵发育成幼虫数 Y 的概率分布.,解,昆虫,X 个虫卵,Y 个幼虫,已知,由全概率公式,故,记为 X H(n,N,M).,超几何分布对应于不返回抽样模型:,N 个产品中有 M 个不合格品,,从中抽取n个,不合格品的个数为X.,4.超几何分布*,分析,这是不放回抽样.但由于这批元件的总数很大,且抽查元件的数量相对于元件的总数来说又很小,因而此抽样可近似当作放回抽样来处理.,例,解,图示概率分布,记为 X Ge(p),X 为独立重复的伯努里试验中,“首次成功”时的试验次数.,几何分布具有无记忆性,即:,P(X m+n|X m)=P(X n),5.几何分布*,6.负二项分布(巴斯卡分布)*,记为X Nb(r,p).,X 为独立重复的伯努利试验中,“第 r 次成功”时的试验次数.,作业,P58练习2.3 1 2 3,2.4 连续型随机变量及其密度函数,一、密度函数,二、有关事件的概率,三、几种常见的连续型分布,一 概率密度函数,定义,设X为一随机变量,若存在非负实函数 f(x),使对任意实数 a b,有,则称X为连续型随机变量,f(x)称为X 的概率密度函数,简称概率密度或密度函数.,Probability density function p.d.f.,分布函数,密度函数在区间上的积分=随机变量在区间上取值的概率,概率密度函数的性质,非负性,规范性,密度函数和分布函数的关系,积分关系,导数关系,连续型随机变量的分布函数在实数域内处处连续,P(X=a)=0,P(a X b)=P(aXb)=P(a X b)=P(aXb),X取值在某区间的概率等于密度函数在此区间上的定积分,连续型随机变量的分布函数的性质,因此,连续型随机变量取任意指定实数值a的概率为0,故 X的密度 f(x)在 x 这一点的值,恰好是X 落在区间 上的概率与区间长度 之比的极限.这里,如果把概率理解为质量,f(x)相当于线密度,概率密度的意义,要注意的是,密度函数 f(x)在某点处a 的高度,并不反映 X 取值的概率.但是,这个高度越大,则 X 取 a 附近的值的概率就越大.也可以说,在某点密度曲线的高度反映了概率集中在该点附近的程度,若不计高阶无穷小,有,它表示随机变量 X 取值于 的概率近似等于,在连续型随机变量理论中所起的作用与,在离散型随机变量理论中所起的作用相类似,分布函数与密度函数几何意义,根据定义,可以得到密度函数的如下性质,常利用这两个性质检验一个函数能否作为连续型随机变量的密度函数.,连续型,密度函数 X f(x)(不唯一),2.,4.P(X=a)=0,离散型,分布律:pn=P(X=xn)(唯一),2.F(x)=,3.F(a+0)=F(a);P(aXb)=F(b)F(a).,4.点点计较,5.F(x)为阶梯函数。,5.F(x)为连续函数。,F(a0)=F(a).,F(a0)F(a).,例1一个靶子是半径为 2m 的圆盘,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能中靶,以X 表示弹着点与圆心的距离.试求随机变量X 的分布函数.,由,X,若,则 是必然事件,故 X 的分布函数为,其图形为一连续曲线,故,X 的概率函数为,(2)由 得,(3),故有,即,所以,(3)由 得,设X与Y同分布,X的密度为,已知事件 A=X a 和 B=Y a 独立,,解:因为 P(A)=P(B),P(AB)=P(A)+P(B)P(A)P(B),从中解得,且 P(AB)=3/4,求常数 a.,且由A、B 独立,得,=2P(A)P(A)2=3/4,从中解得:P(A)=1/2,由此得 0a 2,因此 1/2=P(A)=P(X a),练习,1.如果随机变量X的密度函数为,从密度函数的意义可知,三、几种常见的连续型分布,均匀分布的分布函数为,X,X,a,b,x,l,l,0,即,在区间(a,b)上服从均匀分布的随机变量 X,落在区间(a,b)中任意等长度的子区间内的可能性是相同的,说 明,还可以将密度 写成,2.采用 的示性函数,上的均匀分布,1.类似地,我们可以定义区间,例4,某公共汽车站从上午7时起,每15分钟来一,班车,即7:00,7:15,7:30,7:45 等时刻有汽车到达,此站,如果乘客到达此站时间,是7:00到7:30之,间的均匀随机变量,试求他候车时间少于5分钟的,概率.,解,以7:00为起点 0,以分为单位,依题意,解,以 7:00 为起点 0,以分为单位,依题意,为使候车时间少于 5 分钟,乘客必须在 7:10 到,7:15 之间,或在 7:25 到 7:30 之间到达车站,故所,求概率为,即乘客候车时间少于5分钟的概率是 1/3.,例5 设随机变量 X 在 2,5 上服从均匀分布,现对 X 进行三次独立观测,试求至少有两次观测值大于3 的概率.,X 的分布密度函数为,X 3 表示“对 X 的观测值大于 3 的概率”,解,因而有,设Y 表示3次独立观测中观测值大于3的次数,则,思考,设在-1,5上服从均匀分布,求方程,有实根的概率。,解 方程有实数根,即,而 的密度函数为,所求概率为,均匀分布的背景材料,均匀分布在随机模拟(Monte Carlo 方法)理论中有重要的应用。,假设连续随机变量 X 有分布函数 F(x),则随机变量 F(X)U(0,1);反之,如果随机变量 u U(0,1),则随机变量 F 1(u)的分布函数就是 F(x)。,(0,1)区间上的均匀分布 U(0,1)在概率论的理论研究中具有特殊的意义。,2.如果随机变量 X的密度函数为,则称X服从参数为 的指数分布,的几何图形如图.,注:,指数分布常用来描述对某,一事件发生的等待时间.例如,,乘客在公交车站等车的时间,电子元件的寿命等,因而它在可靠性理论和排队论中有广泛的应用.,指数分布的重要作用,是常用它来作为各种“寿命”的近似,如通讯、保险、随机服务系统等方面,指数分布在排队论和可靠性理论中有广泛的应用,常常用它来作为各种“寿命”的分布的近似.例如,电子元件的寿命,机器的维修时间,生物体的寿命,随机服务系统中的服务时间等都可认为是近似服从指数分布.,指数分布的一个重要性质就是“无后效性”或“无记忆性”.具体叙述如下:,证,假如把服从指数分布的随机变量解释为等待时间,则上式表明,在在等待时间已经超过s小时的条件下,至少需要再等待时间t 的统计规律与已经等待了多长时间无关,就像重新开始等待一样,所以统计学中常称指数分布为“永远年青”的分布.值得指出的是,我们可以证明,指数分布是唯一具有“无记忆性”的连续型分布.,对任意的正数 s 0,t 0,都有 P X s+t|X s=P X t,比较,几何分布的“无记忆性”:P X=k=P X=m+k|X m,所有离散分布里只有几何分布具有“无记忆性”所有连续分布里只有指数分布才具有“无记忆性”它们实际上都是某种“等待分布”。,补充 指数分布的“无记忆性”,例6,已知其参数,求 3 个这样的元件使用 1000 小时,至,少已有一个损坏的概率.,解,由题设知,的分布函数为,由此得到,各元件的寿命是否超过 1000 小时是独立的,用,表示三个元件中使用 1000 小时损坏的元件数,例6,已知其参数,求 3 个这样的元件使用 1000 小时,至,少已有一个损坏的概率.,解,各元件的寿命是否超过1000小时是独立的,用,表示三个元件中使用 1000 小时损坏的元件数,所求概率为,则,例7,电话亭时乙人恰好刚刚拿起话筒通话,试求:,(1)甲人等待时间超过10分钟的概率;(2)甲人等待时间在10到20分钟之间的概率;(3)甲等待5分钟以后至少再等待10分钟的概率,解,由题意可知,甲人等待的时间与乙人通话的时间是一致的,所以实际上本题分别求的是乙人通话时间超过10分钟的概率以及乙人通话时间在10到20分钟之间的概率,由 知X的分布密度为,(1)“甲人等待时间超过10分钟”的概率为,(2)“甲人等待时间在10到20分钟之间”的概率为,(3)“甲等待5分钟以后至少再等待10分钟”的概率为,可见,(1)与(3)结果相同,这恰与指数分布的“无记忆性”相吻合.,例8 设时间 内有 粒子放射出来,设X 为第一个粒子发射出来的时刻,则,对任何 有,即X 的概率密度为,3.Gamma 分布,设 是正常数,由积分,定义.如果 X 的密度是,则称X服从参数 的Gamma分布,记作,这正是参数为 的指数分布,说 明,1、当 时,即,此时,我们称此分布为自由度为 n 的 分布,记作.它是数理统计学中重要的分布之一,2、如果,其中 n 为 自然数,则有,作业,P63 练习2.4 1 2 4,2.5 正态分布,一、正态分布的密度函数及其特点,二、标准正态分布,三、一般正态分布与标准正态分布的关系,正态分布是概率分布中最重要的一种分布,这有实践与理论两方面的原因。实践方面的原因是,正态分布是自然界最常见的一种分布,例如测量的误差、炮弹的落点、人的身高与体重、农作物的收获量、波浪的高度等等都近似服从正态分布。一般来说,如果影响某一随机变量的因素很多,而每一个因素都不起决定性作用,且这些影响是可以叠加的,则这个随机变量服从正态分布,这点可用第5章的中心极限定理来加以证明。从理论方面来说,正态分布有许多良好的性质,如正态分布可以导出一些其它分布,而某些分布(如二项分布、泊松分布等)在一定的条件下可用正态分布来近似。,若连续型随机变量 X 的概率密度函数为,则称 X 服从参数为 和 的正态分布,,正态分布是应用最广泛的一种连续型分布.,十九世纪前叶,高斯加以推广得到正态分布,,德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面.,定义(P64),记为 XN(,2).,f(x)所确定的曲线叫作正态曲线.,其中-0 为常数,,一 正态分布,所以通常称为高斯分布.,由于连续型随机变量唯一地由它的密度函数所描述,我们来看看正态分布的密度函数有什么特点.,在各种分布中具首要地位,正态分布密度的性质,(1)在 x=处取到最大值,故 f(x)以为对称轴,,令 x=+c,x=-c(c0),分别代入f(x),可得,且 f(+c)=f(-c),f(+c)f(),f(-c)f(),x=为 f(x)的两个拐点的横坐标.,(2)正态分布的密度曲线位于 x 轴的上方,且关于 x=对称,,对密度函数求导:,=0,,(3)密度曲线 y=f(x)有拐点,即曲线 y=f(x)向左右伸展时,越来越贴近 x 轴.,当 x 时,f(x)0+,决定了图形中峰的陡峭程度,若固定,改变 的值,,反之亦然,,则密度曲线左右整体平移.,(4)f(x)以 x 轴为水平渐近线;,正态分布 N(,2)的密度函数图形的特点:,两头低,中间高,左右对称的“峰”状,若固定,改变 的值,,决定了图形的中心位置,决定图形的中心位置;,大量的随机变量都服从或者近似服从正态分布.,但每个因素所起的作用不大.,经济学中的股票价格、产品的销量等等,都服从或近似服从正态分布.,正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度;,射击目标的水平或垂直偏差,测量误差,,如某地的年降雨量,某地区成年男子的身高、体重,,农作物的产量,小麦的穗长、株高;,生物学中同一群体的形态指标,,电子元器件的信号噪声、电压、电流;,有很多分布还可以用正态分布近似.,而正态分布自身还有很多良好的性质.,若影响某一数量指标的随机因素很多,,每一因素独立,,服从正态分布,在自然现象和社会现象中,若随机变量 X N(,2),则,正态分布的分布函数,X 的分布函数,下面我们介绍一种最重要的正态分布 标准正态分布,=0,=1 的正态分布称为标准正态分布.,其密度函数和分布函数常用(x)和(x)表示:,可查表得其值,标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.,求 P(X 2.5)及,Y N(0,1),设 XN(,2),,P(-1.64 X 0.82).,解,P(X 2.5)=1-(2.5),P(X 0.5)=F(0.5),查表得,=0.6915;,=1-0.9938=0.0062;,P(-1.64 X 0.82)=(0.82)-(-1.64),=(0.82)-1-(1.64),=0.7434;,=,即若 X N(,2),=,只需将标准正态分布的分布函数制成表,就可以解决正态分布的概率计算问题.,例1,设 XN(0,1),,X 的概率密度为,其中 和 2 都是常数,任意,0,整个概率密度曲线都在 x 轴的上方以为对称轴在 x=处达到最大值f(x)以 x 轴为渐近线 x=为f(x)的两个拐点的横坐标,正态分布通过线性变换可转化为标准正态分布,最重要的正态分布标准正态分布X N(0,1),正态分布,X N(,2),并求该地区明年 8 月份降雨量超过250mm的概率.,例2 某地区8月份降雨量 X 服从=185mm,=28mm 的正态分布,,XN(185,282),,写出 X 的概率密度,,解,所求概率为,P(X 250)=1-P(X 250),=1-(2.32),=1-0.9898=0.0102.,再看几个应用正态分布的例子,我们已经看到,当 n 很大,p 接近 0 或 1 时,二项分布近似泊松分布;,可以证明,如果 n 很大,而 p 不接近于 0 或 1 时,,二项分布近似于正态分布.,例3 公共汽车车门高度是按男子与车门顶头碰头机会在 0.01以下来设计的.,问门高度应如何确定?,解 设车门高度为 h cm,按设计要求应有 P(Xh)0.01,或 P(Xh)0.99,,下面求满足上式的最小 h:,若男子身高 XN(170,62),XN(170,62),查表得(2.33)=0.9901 0.99,,h=170+13.98,184.,设计车门高度为184mm时,可使男子与车门顶碰头机会不超过0.01.,若 XN(,2)时,要求满足 P(X x0)=p 的 x0:,P(X x0)=p,如果某考生得48分,求有多少考生名列该考生之前?,已知1987年全国普通高校统考物理成绩 XN(42,36),这表明有16%的考生成绩超过48分,,例4(确定超前百分位数、排定名次),解,由条件知即求 P(X 48),,查表可知,即 84%的考生名列该考生之后.,=1-(1),即成绩高于甲的人数应占考生的16.9%,对于录取考试人们最关心的是 自己能否达到录取分数线?自己的名次?,某公司招工300名(正式工280,临时工20名),例5(预测录取分数和考生名次),解,166,X N(166,932),,(1)(预测分数线),考生甲得256分,问他能否被录用?如录用能否被录为正式工?,考后由媒体得知:考试总平均成绩为166分,360分以上的高分考生有31人.,有1657人参加考试,考试满分为400分.,高于此线的考生频率为 300/1657,高于360分的考生频率为,(2)(预测甲的名次),当 X=256 时,P(X256),这表明高于256分的频率应为0.169,排在甲前应有,甲大约排在283名.,故甲能被录取,但成为正式工的可能性不大.,P(X360),设考生成绩为X,最低分数线为 x0,类似计算可得,,=0.9974,例6,解,求 P(|X-|k)k=1,2,3.,P(|X-|3)=P(-3 X+3),这表明 X 的取值几乎全部集中在区间-3,+3内,,这在统计学上称作 3 准则(三倍标准差原则).,超出这个范围的可能性不到 0.3%,,从而可以忽略不计.,为应用方便,下面引入标准正态分布分位数的概念:,设 XN(,2),,由三 原则,可认为 X 落在(-3,3)内,-3 3,若某校有200名初一学生,按能力分成 5 组参加某项测验,求各组分别应有多少人?,例7(按能力分组),学生学习能力一般服从正态分布,解,设学习能力X N(0,1),由三 原则,则每组应占 6/5 的范围,查表可知,由对称性可知 A 组和E 组应有2000.034587(人),B 组和D 组应有2000.2383747(人),C 组应有200-472-72=92(人).,现分成组距相同的五组 A,B,C,D,E(如图),-1.8-0.6 0.6 1.8,为应用方便,更一般地可以建立标准正态分布分位数的概念:,则称满足等式 P(X u)=的数 u 为标准正态分布的上侧 分位数;,定义,设 XN(0,1),,0 1,P(X u)=1-P(Xu),称满足等式 P(|X|u/2)=的数 u/2 为标准正态分布的双侧 分位数;,u,-u/2,u/2,=,,=1-(u),(u)=1-,,可查表得值,类似可得(u/2)=1-/2,,若 XN(,2)时,要求满足 P(X x0)=的 x0:,(u)=1-u,例8 已知某机器生产的螺栓长度XN(10.05,0.0036)。若规定螺栓长度在10.050.12内为合格品,试求螺栓为合格品的概率。,解:由于螺栓长度XN(10.05,0.0036),因此,即螺栓为合格品的概率为95.44%。,已知 X N(3,22),且 PXk=PXk,则 k=().,3,练习(1),设 X N(,42),Y N(,52),记 p1=PX 4,p2=PY+5,则()对任意的,都有 p1=p2 对任意的,都有 p1 p2,练习(2),作业,P68 练习2.5 2 3 4,2.6 随机变量函数及其分布,一、随机变量函数的定义,二、离散型随机变量函数的分布,三、连续型随机变量函数的分布,已知圆轴截面直径 d 的分布,,求截面面积 A=的分布.,再如,求功率 W=V 2/R(R为电阻)的分布等.,已知t=t 0 时刻噪声电压V 的分布,在实际中,人们常常对随机变量 X 的函数Y=g(X)所表示的随机变量 Y 更感兴趣,设随机变量X 的分布已知,又Y=g(X)(设g是连续函数),无论在实践中还是在理论上都是重要的,如何由 X 的分布求出 Y 的分布?,通过实例找方法,例1,(X 取某值与 Y 取其对应值是相同的事件,两者的概率应相同),一、离散型随机变量函数的分布,解,则 Y=g(X)的分布列为,X 取值分别为-2,-1,0,1,2 时,Y=2X+1 对应值为-3,-1,1,3,5.,求Y=2X+1,Y=X 2 的分布列.,X Y=X 2-2 4-1 1 0 0 1 1 2 4,-2,2 4-1,1 1 0 0,一般地,离散型随机变量 X 的分布列为,将它们对应的概率相加后和并成一项即可,若g(xk)中有相等值,(报童问题)假定报童有 5 份报纸,卖出的数量 X 分布律如下,k 0 1 2 3 4 5 pk 0.1 0.1 0.2 0.3 0.2 0.1,他每卖掉一份报纸将获得报酬 1 元,没有卖出而剩下的每份赔偿 0.5 元。计算最终所得的分布。,解.以 Y 记报童最终的所得,因此有 Y=1X 0.5(5 X)=1.5 X 2.5,k 0 1 2 3 4 5 pk 0.1 0.1 0.2 0.3 0.2 0.1,X 的分布律,k 2.5 1 0.5 2 3.5 5 pk 0.1 0.1 0.2 0.3 0.2 0.1,Y=1.5 X 2.5 的分布律,则 FY(y)=P(Y y),解 设Y 的分布函数为 FY(y),,例2,设 X 具有概率密度,求 Y=-2X+8 的概率密度.,于是Y 的概率密度为,二、连续型随机变量函数的分布,注意到 0 x 4 时,,即 0 y 8 时,,此时,=P(-2X+8 y),设 X 具有概率密度,求导可得,当 y 0 时,注意到 Y=X 2 0,故当 y 0时,FY(y)=0;,解 设Y 和X 的分布函数分别为FY(y)和 FX(x),,例3,则 Y=X 2 的概率密度为,Y 服从自由度为 1 的 分布,求Y=X 2 的概率密度.,从上述两例中可看到,在求P Y y 的过程中,关键是第一步中:设法从 g(X)y 中解出X,从而得到与 g(X)y 等价的关于 X 的不等式.,用 代替 X 2 y,即利用已知的 X 的分布,求出 X 的函数的分布,用 代替-2 X+8 y,求连续型随机变量的函数的分布的常用方法,如例2中,如例3中,定理,则 Y=g(X)是一个连续型随机变量,其概率密度为,又 y=g(x)处处可导,且有g(x)0(或恒有g(x)0),类似可证 g(x)0 时,定理的证明与前面的解题思路完全类似.,设连续型随机变量 X 具有概率密度 fX(x),定理,下面求Y 的分布函数FY(y):,证,由于,g 保号,h(y)是g(x)的反函数,综合以上即有结论成立.,a ba b,试证 X 的线性函数 Y=aX+b(a 0)也服从正态分布.,证 X 的概率密度为,例4 设随机变量 XN(,2),显然 y=g(x)=a x+b可导且g=a 保号,Y=aX+b 的概率密度为,由定理知,Y=aX+b(a+b,(|a|)2),即,注 取,验证函数可导且单调,求反函数及其导数,代入定理公式即得函数的密度,注意取绝对值,有,确定y的取值范围,求 Y=1-e X 的概率密度.,解,例5 设 X 的概率密度为,显然 y=g(x)=1-e x 可导,且g=-e x 保号,Y=1-e X 的概率密度为,由定理知,即,注意取绝对值,先转化为分布函数,再求导,已知 X 的概率密度为,求Y=sinX 的概率密度.,例6,利用分布函数求概率密度:,函数 y=g(x)=sinx 在0,上为非单调函数,,解,故不能用定理求.,x0,时,y 0 时,0y1时,=P(0 X arcsin y)(-arcsin y X),y 1时,=P(0 X arcsin y)+P(-arcsin y X),=1.,分布函数法,不必计算积分,作业,P71练习2.6 1 2,P72习题二,