随机变量及其分布 (2).ppt
1,第6次课:随机变量及其分布,随机变量的概念 随机变量的分布函数的概率意义与数学性质 离散型随机变量的概率函数或分布律 连续型随机变量的密度函数 分布函数与密度函数的关系习题二(2,3,5,7,9,11,13,15,17,19),2,试验的所有可能结果构成的集合被称作样本空间,而每一个可能的试验结果构成样本点.样本点的集合A称作事件,只包含一个样本点的集合被称作基本事件.从样本空间到实数集合的一个映射称之为随机变量,即每给定一个试验结果或者样本点,存在着唯一的一个实数()与之对应.这样就建立了一个自变量为,函数值则为实数的一个特殊的函数.,3,一些随机变量的例子,(1)一个射手对目标进行射击,击中目标记为1分,未中目标记为0分.如果用x表示射手在一次射击中的得分,则它是一个随机变量,可以取0和1两个可能的值.(2)某段时间内候车室的旅客数目记为x,它是一个随机变量,可以取0及一切不大于M的自然数,M为候车室的最大容量.(3)单位面积上某农作物的产量x是一个随机变量,它可以取一个区间内的一切实数值,即x0,T,T是一个常数.,4,按取值情况将随机变量分为两类:(1)离散型随机变量只可能取有限个或无限可列个值.(2)非离散型随机变量可能取任何实数.而非离散型随机变量中最常用的为连续型随机变量.,5,定义 2.1 如果随机变量x只取有限个或可列个可能值,而且以确定的概率取这些不同的值,则称x为离散性随机变量.为直观起见,将x可能取的值及相应概率列成概率分布表如下,此外,x的概率分布情况也可以用一系列等式表示:P(x=xk)=pk(k=1,2,)这被称作随机变量x的概率函数(或概率分布),6,其中x=x1,x=x2,x=xk,构成一完备事件组.因此概率函数具有如下性质:,一般所说的离散性随机变量的分布就是指它的概率函数或概率分布表.上面两个性质中的性质(2)经常在解题中构成解方程的一个条件.,7,例1 一批产品的废品率为5%,从中任意抽取一个进行检验,用随机变量x来描述废品出现的情况.好写出x的分布.解 用x表示废品的个数,则它只能取0或1两个值.x=0表示产品为合格,x=1表示产品为废品,则概率分布表如下,即Px=0=0.95,Px=1=0.05,或可写为Px=k=0.05k0.951-k(k=0,1),8,两点分布:只有两个可能取值的随机变量所服从的分布,称为两点分布.其概率函数为P(x=xk)=pk(k=1,2)概率分布表为:,概率分布图为,x,p1,p2,x1,x2,9,0-1分布:只取0和1两个值的随机变量所服从的分布称为0-1分布.其概率函数为P(x=k)=pk(1-p)1-k(k=0,1)概率分布表为:,概率分布图为,x,1-p,p,0,1,1,10,例2 产品有一,二,三等品及废品4种,其一,二,三等品率和废品率分别为60%,10%,20%,10%,任取一个产品检验其质量,用随机变量x 描述检验结果并画出其概率函数图.,解 令x=k与产品为k等品(k=1,2,3)相对应,x=0与产品为废品相对应.x是一个随机变量,它可以取0,1,2,3这4个值.依题意,P(x=0)=0.1P(x=1)=0.6P(x=2)=0.1P(x=3)=0.2则可列出概率分布表并画出概率分布图.,11,x 的概率分布表为,概率分布图为,x,0,1,2,3,0.1,1,p,12,例3 用随机变量描述掷一颗骰子的试验情况解:令x表示掷一颗骰子出现的点数,它可取1到6共6个自然数,相应的概率都是1/6,列成概率分布表和概率分布图如下,13,离散型均匀分布 如果随机变量x有概率函数:,则称x服从离散型均匀分布.,14,例4 社会上定期发行某种奖券,每券1元,中奖率为p,某人每次购买1张奖券,如果没有中奖下次再继续购买1张,直到中奖为止.求该人购买次数x的分布.,解 x=1表示第一次购买的奖券中奖,依题意P(x=1)=p,x=2表示购买两次奖券,但第一次未中奖,其概率为1-p,而第二次中奖,其概率为p.由于各期奖券中奖与否相互独立,所以P(x=2)=(1-p)p;x=i表示购买i次,前i-1次都未中奖,而第i次中奖,P(x=i)=(1-p)i-1p.,15,由此得到x的概率函数为P(x=i)=p(1-p)i-1(i=1,2,),称此分布为几何分布,16,例5 盒内装有外形与功率均相同的15个灯泡,其中10个螺口,5个卡口,灯口向下放着,现在需用1个螺口灯泡,从盒中任取一个,如果取到卡口灯泡就不再放回去.求在取到螺口灯泡之前已取出的卡口灯泡数x的分布.,17,解 x=0表示第一个就取到了螺口灯泡,x=1 表示第一个取到卡口而第二个才取到螺口灯泡,因此P(x=0)=10/15=2/3,P(x=1)=(5/15)(10/14)=5/21P(x=2)=(5/15)(4/14)(10/13)=20/273P(x=3)=(5/15)(4/14)(3/13)(10/12)=5/273P(x=4)=(5/15)(4/14)(3/13)(2/12)(10/11)=10/3003P(x=5)=(5/15)(4/14)(3/13)(2/12)(1/11)=1/3003概率分布表为,18,随机变量的分布函数,定义 2.2 若x是一个随机变量(可以是离散型的,也可以是非离散型的),对任何实数x,令F(x)=P(x x)称F(x)是随机变量x的分布函数(因此,要求出一个随机变量的分布函数的工作量是很大的,理论上要算无穷多个事件的概率才行),19,例6 求本节例1中的分布函数解 在例1中x的分布函数如下表所示:,其分布函数为,20,对于一般的0-1分布:其分布函数为,x,1-p,0,1,1,F(x),21,例7 求例3中的分布函数F(x)解:,22,x的概率函数及F(x)的图形为,P,0,1,2,3,4,5,6,x,1,F(x),23,分布函数与概率函数满足关系:,这是因为在一般的公式中,要考虑x1,x2,并非按从小到大的次序排列的可能性.例如,假设x1=0,x2=-1,x3=1P(x1)=0.2=p1,P(x2)=0.3=p2,P(x3)=0.5=p3,24,这时便有,25,F(x)的图形为,x2,x1,x3,F(x),26,F(x),即事件x的概率是x的一个实函数,对任意实数x1x2,有因x2x1x1x2=x2-x1P(x1x2)=P(x2)-P(x1)即P(x1x2)=F(x2)-F(x1)因此,若已知的分布函数F(x),就能知道在任何一个区间上取值的概率,从这个意义上说,分布函数完整地描述了随机变量的变化情况,27,分布函数F(x)具有如下几个性质:,28,连续型随机变量的分布,一随机变量的分布函数是描述任何类型的随机变量的变化规律的最一般的形式,但由于它不够直观,往往不常用。比如,对离散型随机变量,用概率函数来描述即简单又直观。对于连续型随机变量也希望有一种比分布函数更直观的描述方式“概率密度函数”,29,例8 在区间4,10上任意抛掷一个质点,用x表示这个质点和原点的距离,则x是一随机变量,如果这个质点落在4,10上任一子区间内的概率与这个区间的长度成正比,求x的分布函数.,4,10,x,30,解:x可以取4,10上的一切实数,即410是一个必然事件,P410=1,若c,d4,10,有Pcd=(d-c),为比例常数,特别地,取c=4,d=10,P410=(10-4)=6=1,因此=1/6.,31,F(x)的图形如下所示,0,F(x),4,10,x,32,定义:对于连续型随机变量x,如果存在一定义在(-,+)上的非负函数(x),对于任意实数x都有(x)0,且满足,x落在任意区间内的概率为j(x)在此区间的积分,即,则称j(x)为x的概率密度函数,.,33,用概率密度函数计算x落在任何区间内的概率如下图所示意.,a,b,x,0,j(x),P(axb),34,因此,概率密度函数的两个性质一个是(x)0,另一个则是,x,0,j(x),35,概率密度函数(x)与分布函数F(x)的关系为,x,0,j(x),x,36,进一步剖析可得,x,0,j(x),x,x+x,这表明j(x)不是x取值x的概率,而是它在x点概率分布的密集程度.,37,在例1中x的概率密度函数j(x)为,38,例9 若x有概率密度,则称x服从区间a,b上的均匀分布,试求F(x).解 因为,39,j(x)的图形为,求分布函数F(x)则是根据公式,0,a,b,x,(x),40,当xa时,0,a,b,x,(x),x,41,当axb时,0,a,b,x,(x),x,42,当xb时,0,a,b,x,(x),x,43,综上所述,最后得分布函数为,44,F(x)与j(x)的图形对照如下:,0,a,b,x,(x),0,a,b,x,F(x),1,45,例10 已知连续型随机变量x有概率密度,求系数k及分布函数F(x),并计算P(1.5x2.5)解 因,46,则j(x)及其图形如下,47,x,当x0时,48,x,当0 x2时,49,当x2时,x,50,综合前面最后得,1,2,0,x,F(x),51,将概率密度函数j(x)与分布函数F(x)对照,52,现根据概率密度函数和分布函数分别计算概率P1.5x2.5根据分布函数计算:P1.5x2.5=P1.5x2.5-P(x=2.5)=F(2.5)-F(1.5)-0=1-(1.52/4)+1.5=1-0.9375=0.0625根据概率密度函数进行计算则是,53,用两种方法计算P1.5x2.5的示意图,1.5,1.5,0.0625,2.5,2.5,0.0625,54,实际上,连续型随机变量x的存在给数学家们带来了很大的麻烦,因为,当任意两个实数a,b不相同时,即当ab,事件x=a和事件x=b是互斥的,而连续型随机变量x取任何单个的实数的概率为0可是x落在某一区间内的事件实际上是由所有的等于此区间内的每一个实数的事件的并,这样就出现了无限多个概率为0的事件的并的事件的概率却不为0,即加法法则不成立.因此数学家们就只好宣布可列可加性,而不可列可加性则不成立.,55,第7次课:随机变量及其分布,二元随机变量的概念 联合分布与边际分布 随机变量的独立性 习题二(21,23,25,27,28,29),56,定义 2.5:如果每次试验的结果对应着一组确的实数(x1,x2,xn),它们是随试验结果不同而变化的n个随机变量,并且对任何一组实数x1,x2,xn,事件x1x1,x2x2,xnxn 有确定的概率,则称n个随机变量的整体(x1,x2,xn)为一个n元随机变量(或n元随机向量)定义 2.6 称n元函数F(x1,x2,xn)=P(x1x1,x2x2,xnxn)(x1,x2,xn)Rn为n元随机变量的分布函数.,57,(一)离散型,1.联合分布 定义 2.7 如果二元随机变量(x,h)所有可能取的数对为有限或可列个,并且以确定的概率取各个不同的数对,则称(x,h)为二元离散型随机变量.,58,为了直观,可以把(x,h)所有的可能取值及相应概率列成表,称为(x,h)的联合概率分布表,59,也可以用一系列等式来表示二元离散型随机变量(x,h)的联合概率分布.Px=xi,h=yj=pij(i,j=1,2,)这都被称作x与h的联合分布律,具有性质:,60,例1 同一品种的5个产品中,有2个正品,每次从中取1个检验质量,不放回地抽取,连续2次,记xk=0表示第k次取到正品,而xk=1为第k次取到次品(k=1,2).写出(x1,x2)的联合分布律.,解 按乘法公式有,61,列成概率分布表为,62,边缘分布与联合分布的关系二元随机变量(x,h)中,分量x(或h)的概率分布称为(x,h)的关于x(或h)的边缘分布.如果已知(x,h)的联合分布为 Px=xi,h=yj=pij(i,j=1,2,)则,63,例1 的边缘分布的计算,即Px1=0=0.4 Px1=1=0.6Px2=0=0.4 Px2=1=0.6考虑到5个产品中有两个正品三个次品,当然一次取到正品的概率为0.4,取到次品的概率为0.6,64,例2 将两封信随机地往编号为1,2,3,4的4个邮筒内投.xi表示第i个邮筒内信的数目(i=1,2).写出(x1,x2)的联合分布及(x1,x2)中关于x1的边缘分布,65,解:试验共有42=16种不同的等可能结果,66,计算结果列于下表并计算x1的边缘分布,上表计算出的x1的边缘分布可列成下表,67,条件分布:对于二元离散型随机变量(x,h),如果Ph=yj0,称pij/pj(2)(i=1,2,)为在h=yj条件下关于x的条件分布,记为,显然Px=xi|h=yj是非负的,并且对于所有的i,它们的和为1,同样地,若pi(1)0,称,为在x=xi条件下关于h的分布.,68,求例1的各个条件分布,Px1=0|x2=0=1/4,Px1=1|x2=0=3/4Px1=0|x2=1=1/2,Px1=1|x2=1=1/2Px2=0|x1=0=1/4,Px2=1|x1=0=3/4Px2=0|x1=1=1/2,Px2=1|x1=1=1/2,69,例3 求出例2在x2=1条件下x1的分布,70,例4某射手在射击中,每次都击中目标的概率为p(0p1),射击进行到第二次击中目标为止,x1,x2表示第1,2次击中目标时所进行的射击次数,求x1和x2的联合分布以及它们的条件分布.,解 令q=1-p,事件x1=i,x2=j表示第i次及第j次击中了目标(1ij),而其余j-2次都没有击中目标.已知各次射击是相互独立的,所以pij=Px1=i,x2=j=p2qj-2(i=1,2,1ij),71,列成表为,72,边缘分布为:,这是第一次击中次数为第i次射击的概率分布,可见它是服从几何分布.,73,对于任意大于1的正整数j=2,3,有pj(2)0,因此关于x1的条件分布为,即在第二次命中是在第j次射击的条件下,第一次命中是在前j-1次射击中等可能的离散均匀分布.同样可得关于x2的条件分布为:,74,连续型 二元连续型随机变量是用联合概率密度函数j(x,y)来描述的,它具有性质,因此对于平面上任何可积区域S,(x,h)落在此区域内的概率是j(x,y)在S上的二重积分,即,75,二元概率密度函数j(x,y)从图形上看是在xy平面上方的一个曲面,包围着下方的体积为1.,76,显然,对任意实数ab及cd,有,(x,h)的分布函数F(x,y)也可由下式求出:,77,(x,h)关于x及h的边缘分布函数可按下式求出,78,若记,称j1(x)或jx(y)是(x,h)中关于x的边缘概率密度.同样地记,则称j2(y)或jh(y)是(x,h)中关于h的边缘概率密度.,79,条件概率密度,首先计算chc+条件下axb的条件概率,其中是一个非常小的数.,当0时上面的等式严格成立,80,若j2(y)0,称,为在h=y条件下,关于x的条件概率密度.而称,为在x=x条件下,关于h的条件概率密度,81,随机变量的独立性,两个随机变量x和h是相互独立的,是指的其中一个变量取任意值的事件和另一个变量取任意值的事件总是相互独立的.严格的定义为:定义 2.9 对于任何实数x,y,如果二元随机变量(x,h)的联合分布函数F(x,y)等于x和h的边缘分布函数的乘积,即F(x,y)=Fx(x)Fh(y)则称随机变量x与h相互独立.,82,离散型 x与h相互独立的充要条件是对一切i,j=1,2,pij=pi(1)pj(2)例 如果x取值1,2,3的概率为0.2,0.5,0.3,而h取值1,2的概率为0.6,0.4,x与h相互独立,则它们的联合概率分布如下表所示:,83,在给定离散型随机变量的概率分布表的情况下,如果要判定其不独立往往容易,只要任找一个pij不等于边缘概率pi(1)和pj(2)的乘积就可断定其不独立.经常的快捷办法就是,只要发现联合概率分布表中有0存在,就基本可以认为这两个随机变量不独立了.而如果要判定其独立,则需要验证每一个pij是否为各个边缘概率的乘积.,84,连续型,如x和h为连续型随机变量,则它们相互独立的充分必要条件为,对任何实数x,yj(x,y)=j1(x)j2(y)=jx(x)jh(y)当一个二元函数f(x,y)可写成两个单变量的函数乘积f(x,y)=g(x)h(y)时,称其为可分离变量的.不难证明如果x和h的联合概率密度j(x,y)可分离变量的,它们就是相互独立的,反之亦然.,85,例5 本节例2的两个随机变量x1和x2是否相互独立?,解 p22=0p2(1)p2(2)=(1/16)(1/16)因此x1和x2不独立.,86,例6 两个随机变量x1与x2相互独立,其概率密度为,求它们的联合概率密度.解:,87,第8次课:随机变量及其分布,随机变量函数的分布讲评第二章部分习题 习题二(30,32,34,36),88,定义 2.10,设f(x)是定义在随机变量x的一切可能值x的集合上的函数.如果对于x的每一可能取值x,有另一个随机变量h的相应取值y=f(x).则称h为x的函数,记作h=f(x).我们的任务是,如何根据x的分布求出h的分布,或由(x1,x2,xn)的分布求出h=f(x1,x2,xn)的分布.,89,(一)离散型随机变量函数的分布,如果相应的函数f(x)在给定的试验范围内是单调函数或者存在反函数,则h=f(x)的分布是很容易从x的分布中求出来的,即当P(x=xi)=pi时,P(h=f(xi)=pi,i=1,2,90,例1 测量一个正方形的边长,其结果是一个随机变量x(为简便起见把它看成是离散型的),x的分布如下表所示,求周长h和面积z的分布律.,91,解:根据题意知h和z都是x的函数,h=4x,z=x2,因此而计算出如下的结果,92,例2 x的分布如下表所示,求x2的分布,解 此题与上题的不同在于x存在着取负数的可能,而-1的平方与1的相同,因此,x2=1的事件是x=1和x=-1两个互斥事件的和,则Px2=1=Px=1+Px=-1,最后结果如下表:,93,例3 一个仪器的长度由两个主要部件构成,其总长度为此二部件之和,这两个部件的长度x和h为两个相互独立的随机变量,其分布律如下二表所示.求此仪器长度的分布律.,94,解 设仪器的总长度为z,x,h的可能取值的数对及概率与相应的和如下面的表所示,95,由此可计算出z的分布率如下表所示.,96,例4 求2.3例2中两个邮筒内信的数目之和x1+x2的分布律.解 x1和x2的联合分布律如下表所示,97,按斜线计算:,x1+x2=0,x1+x2=1,x1+x2=2,x1+x2=3,x1+x2=4,98,用斜线法计算x1-x2的分布,x1-x2=-2,x1-x2=-1,x1-x2=0,x1-x2=1,x1-x2=2,99,(二)连续型例5 已知x的概率密度是jx(x),h=4x-1,求h的概率密度jh(x).解 首先求h的分布函数Fh(x).依题意,有,其中Fx(x)为x的分布函数.然后对上式两边求导即得x和h的概率密度函数的关系.,100,对,101,例6 设随机变量x的分布函数为Fx(x),求x2的分布函数.解:,102,特别地,如果x是具有概率密度为jx(x)的连续型随机变量,103,例7 和的分布,已知(x,h)的联合概率密度是j(t1,t2),z=x+h,求z的概率密度jz(x).解 先求z的分布函数,再求其概率密度.,104,由概率密度函数的定义可知z的概率密度函数为,若x与h相互独立,则有,105,当固定一x时,t1+t2x积分区域的示意图,t1,t2,t1+t2=x,106,在数学上,给定两个函数g(x)和h(x),称函数,为函数g(x)和h(x)的卷积,记作f(x)=g(x)*h(x),卷积也具有某些乘法的性质,如满足交换律和结合律等等.因此我们知道两个相互独立的连续型随机变量x和h相加得到的随机变量z=x+h的概率密度是x和h的概率密度之卷积.,107,例 随机变量x和h相互独立,且概率密度都由下式表示:,求x+h的概率密度.解:因为x和h都只取正值,因此x+h也只取正值,即当x0时,jx+h(x)=0,而当x0时,它们的和的概率密度为(接后页),108,当x0时,109,例 假设n个随机变量x1,x2,.,xn相互独立且它们都有相同的概率密度函数为,试证它们的和x1+x2+.+xn的概率密度函数为,110,证:用归纳法,当n=2时,由前例已知命题成立,假设当n=k-1时,命题成立,即,则k个相互独立的随机变量相加的概率密度为jk-1(x)*j1(x),111,即有,当x0时,jk(x)=0,当x0时,112,进一步讨论,由于,