概率论与随机过程 第四章课件.ppt
第四章、随机变量的数字特征,矩、协方差矩阵,数学期望,方差,协方差及相关系数,返回目录,4.1 数学期望,例1、设甲乙二人在同样的条件下进行射击,他们各自命中的环数分别为随机变量X和Y,分别如下:,试比较甲乙二人技术水平的高低。,一、离散型随机变量的数学期望,先看一个例子:,可以这样理解:,甲乙都各发射100发子弹,甲命中10环的有1000.660发,命中9环的有1000.110发,命中8环的有1000.330发,于是甲平均命中环数为:,同理乙平均命中环数为:,因此甲射手的技术水平高于乙射手。,由此可见,平均值恰好为随机变量一切可能取值与取相应值的概率的乘积的总和。,定义1 设离散型随即变量X的分布律为,(k=1,2,3)若级数,绝对收敛,则称此级数的和为随机变量X的数学期望,简称期望,又称为均值,记为E(X),即,(1)上面的定义为什么要附加条件级数绝对收敛?,(2)若随机变量只取有限个值时,其期望是否一定存在?,(3)若X服从参数为p的两点分布,E(X)?,想一想:,例2 若X为服从参数为的泊松分布,计算这一分布的数学期望。,解,由此可见,服从参数为的泊松分布的数学期望正好为其参数值。,例3 按规定,某车站8:009:00,9:0010:00都恰有一辆客车到站,但到站的时刻是随机的,且两者到站的时间相互独立,其规律为:,一旅客8:20到车站,求他候车时间的数学期望。,解,例4 某商店对某种家用电器的销售采用先使用后付款的方式,记使用寿命为X年,规定:X1时,一台付款1500元;1X2时,一台付款2000元;2X3时,一台付款2500元;X3时,一台付款3000元。设寿命X服从参数为10的指数分布,试求该商店一台收费Y的数学期望。,分析:,先求出Y的分布律,然后求出E(Y)。,例5 在某地进行某种疾病地普查,为此检验每个人的血液,如果当地有N个人,若逐个检验就需进行N次检验,问有没有办法减少检验的工作量?,解,4.1 数学期望,二、连续型随机变量的数学期望,定义2 设连续型随机变量X的概率密度为f(x),若积分,学期望,简称期望,又称为均值,记为E(X),即,以上定义确实反映了续型随机变量X取值的“平均”,事实上可在数轴上取等分点(间距为):x-2,x-1,x0,x1,x2,.x落在区间xi,xi+1)的概率为,定义一个新的随机变量X*xi,于是,绝对收敛,则称该积分的值为随机变量X的数,E(X*),利用微积分知识得,当0时,有E(X*),例6 若XUa,b,求E(X)。,解,E(X),E(X)恰好是区间a,b的中点,这与E(X)的概率意义相符。,例7 若X服从参数为的指数分布,求E(X)。,解 E(X),即指数分布的期望正是它的参数。,例8 若XN(,2),求E(X)。,解 E(X),10,即正态分布中的参数正好是它的数学期望。,例9 有2个相互独立工作的电子装置,它们的寿命为Xk,(k=1,2)都服从参数为的指数分布,若将这两个电子装置串连组成整机,求整机寿命(以小时计)N的数学期望。,分析:,先求出N的概率密度,然后计算E(N).,二、连续型随机变量函数的数学期望,定理 设Y是随机变量X的函数,Yg(X)(g是连续函数),(1)X是离散型随机变量,它的分布为PX=xk=pk,k1,2,若,绝对收敛,则有,(2)X是连续型随机变量,它的概率密度为f(x),若,绝对收敛,则有E(Y)E(g(X),说明:,(1)本定理的重要意义在于当求E(g(X)时,不必先算出Y的分布律或密度函数,只需利用X的分布律或密度函数。,说明:,(2)上述定理还可以推广到两个或两个以上随机变量函数的情形。,若(X,Y)的概率密度为f(x,y),而Zg(X,Y),则有,E(Z)=Eg(X,Y)=,例如:,若(X,Y)的分布律为PX=xi,Y=yj=pij,i,j=1,2则有,E(Z)=Eg(X,Y)=,(3)本定理的证明较为困难,需要用到较多的数学知识,但在假定X是连续型随机变量,g(x)处处可导且恒有g(x)0(或恒有g(x)0)的情况下很容易给出证明:,例10 设X的分布列为:,求E(X2),解 E(X2),(1)2 1/8+02+22 3/8+32 1/4,=3.875,例11 风速v在(0,a)上服从均匀分布,又设飞机机翼受到的正压力w是v的函数w=kv2(k0常数),求w的数学期望。,解 E(w),例12 设随机变量(X,Y)的概率密度为,,求数学期望E(Y),E()。,解,例13,解,确定该产品的产量,他们估计出售一件产品可获利m元,而积压一件产品导致n元的损失,再者,他们预测销售量Y服从参数为的指数分布,问要获得利润Q的数学期望最大,应生产多少件产品(m,n,均为已知)?,某公司计划开发一种新产品投入市场并,四、数学期望的几个重要性质,性质1 若aXb,则E(X)存在且aE(X)b.,因为 axib,因此,证明 当X为离散型随机变量时,设分布列为PX=xi=pi,从而,即,当X为连续型随机变量时,同理可证aE(X)b,推论1 若X=C为常数,则E(X)C。,性质2 设X为随机变量,C为常数,则有E(CX)C E(X).,证明 当X为连续型随机变量时,设X的密度函数为f(x),则有,当X为离散型随机变量时,同理可证。,性质3 当X、Y相互独立时,E(XY)E(X)E(Y).,事实上,,E(X)E(Y)。,性质4 设X、Y为两个随机变量,则有E(XY)E(X)E(Y).,证明,E(X)E(Y).,推论2 设X、Y为两个随机变量,a、b为常数,则有,E(aXbY)aE(X)b E(Y),推论3 设X1、X2、Xn为随机变量,ai为常数,则,利用推论3,我们可以比较方便的计算出二项分布的数学期望。,设X表示n重Bernoulli试验中事件A出现的次数,Xi为事件A在第i次试验中出现的次数,且令,Xi,又设事件A在一次试验中出现的概率为p,于是 X=X1X2Xn为服从参数为n,p的二项分布。,由于E(Xi)p,则,E(X),np,说明:,这个例子启发我们,可把一个比较复杂的随机变量X分解成几个简单的随机变量Xi之和,由数学期望的性质,只要计算出E(Xi),就可得到E(X),这样的方法在概率论中经常用到。,例14 据统计,一位40岁的健康人在5年内仍然活着(含自然死亡)的概率为p,某保险公司开办5年人寿保险,条件是参加者身体健康,交保险费a元,5年内活着不退,5年内死亡者(非自杀死亡),公司赔偿死者家属b元(ba),问应如何制定b才能使公司有望获得收益?若有m人参加,公司可望从中收益多少元?,解,例15 一民航送客车载有20位旅客自机场开出,旅客有10个车站可以下车,如到达一个车站没有旅客下车就不停车,以X表示停车的次数,求E(X)。(设每位旅客在各车站下车是等可能的,并设各旅客是否下车是相互独立的),解,例16 设一电路中电流I(A)与电阻R()是两个相互独立的随机变量,其概率密度分别为,g(i)=,h(r)=,试求电压V=IR的均值。,解,由于I、R是相互独立的,因此,E(V)=E(IR)=,E(I)E(R),1.5(V),Return,4.2 方差,有一批灯泡,知其平均寿命为E(X)1000小时,仅由这一指标还不能判定它的质量的好坏,有可能有一半的灯泡的寿命大大低于这个值,有一半的灯泡的寿命大大高于这个值。果真如此,说明灯泡的质量不稳定,X与E(X)的偏差越小,说明质量越稳定,从这个意义上说认为质量越好。,一、方差的定义,先看一个例子:,由此可见研究随机变量与其均值的偏差程度十分必要,那么,如何度量这个偏差程度呢?,容易看到:,,能度量这个偏离程度,但运算不便,通常用,去度量X与其均值E(X)的偏离程度。,定义,设X是随机变量,若,存在,,则称它为X的方差,记为D(X)或Var(X),即,D(X)=Var(X)=,称,为X的标准差或均方差。,说明:,随机变量的方差表达了X的取值与其数学期望的偏离程度;,若X取值比较集中,则D(X)较小;反之若取值比较分散,则D(X)较大;,当D(X)C时,D(X)0。,方差实际上是随机变量函数g(X)=,的数学期望,于是,当X是离散型随机变量,有D(X),其中px=xk=pk,k=1,2,是X的分布律。,当X是连续型随机变量,有D(X),其中f(x)为X的概率密度函数。,随机变量X的方差常按下列公式计算:,D(X)=E(X2)E(X)2.,事实上,,D(X)=EX-E(X)2,EX2-2XE(X)+E(X)2,=E(X2)-2E(X)E(X)+E(X)2,=E(X2)-E(X)2,于是,当X是离散型随机变量时,有E(X),当X是连续型随机变量时,有E(X),二、几种常见分布的方差,1、两点分布:,PX=1=p,PX=0=1p=q,由于E(X)p,E(X2)=p,,因此 D(X)=p-p2=pq,2、Poisson分布:,PX=k=,,k=0,1,2,由于E(X),,E(X2)=,因此,D(X)E(X2)-E(X)2=,即,Poisson分布的方差正好是它的参数。,3、正态分布,D(X)=E(X-E(X)2=,由此可见,,正态密度中的正好是它的均方差,为数,学期望,因此,只要知道一个正态随机变量的方差与期望就可确定该随机变量的分布密度。,函数,三、方差的性质,性质,常量的方差等于0,即若XC,则D(X)=0;,事实上,D(X)D(C-C)2=0。,性质,D(X+C)=D(X),一个随机变量加上一个常量,方差不变。即,事实上,,D(X+C)=E(X+C)-E(X+C)2,=E(X+C)-E(X)-C2,=E(X-E(X)2=D(X),性质,D(kX)=k2D(X),事实上,,D(kX)E(kX)-E(kX)2,=EkX-kE(x)2,=k2E(X-E(X)2=k2D(X),性质,设X、Y是两个随机变量,则,D(X+Y)=D(X)+D(Y)+2E(X-EX)(Y-EY),特别,当X、Y相互独立时,,D(X+Y)=D(X)+D(Y),证明,D(X+Y)=E(X+Y)-E(X+Y)2,E(X-EX)+E(Y-EY)2,=E(X-EX)2+2(X-EX)(Y-EY)+(Y-EY)2,=D(X)+2E(X-EX)(Y-EY)+D(Y),当X、Y相互独立时,有,2E(X-EX)(Y-EY)2E(XY)-XEY-YEXEXEY,=2E(XY)-EXEY=2EXEY-EXEY=0,于是,当X、Y相互独立时,,D(X+Y)=D(X)+D(Y),注:,以上证明中用到了期望的一个性质:当X、Y相互独立时 E(XY)=(EX)(EY),当X1,X2,Xn相互独立时,有,D(X1+X2+Xn)=D(X1)+D(X2)+D(Xn),利用这个性质可以比较简便地计算出二项分布的方差:,二项分布可以理解为n个两点分布的和,设,Xi,(Dxi)=pq i=1,2n,令,X在n次独立试验中A发生的次数,有,Xb(n,p)且 X,于是,,D(X),npq,随机变量标准化,设X为随机变量,EX=,DX2,令Y,则称Y为X的标准化变量。,事实上,E(Y)=0,D(Y)1。此时,,如果 XN(,2),那么 Y N(0,1),重要不等式切比雪夫(Chebyshev)不等式,定理,设随机变量X具有数学期望E(X),方差D(X)=,,则对于任给的正数,不等式,成立。,证明,我们就连续型随机变量的情形来证明,设X的概律,密度为f(x),则,即,注:切比雪夫不等式可写成如下形式:,D(X)反映了X的平均偏离程度,从切比雪夫不等式可以看出,当D(X)越大,就越大。,D(X)=0 的充分必要条件是PX=c=1。(c为常数),我们知道,当Xc,有D(X)0,现在考虑其逆命题是否成立?我们有,证明,当pX=C1时,有,E(X)=C,E(X2)=C2,从而,D(X)E(X2)(EX)2=C2C2=0,若D(X)=0时,有,0,即,所以,PX=c=1,其中E(X)=c.,性质,性质,若XiN(i,i2),i=1,2,n,且X1,X2,Xn相互,独立,则 C1X1+C2X2+CnXn,证明,因为XiN(i,i2),i=1,2,n,又X1,X2,Xn相互,独立,所以 C1X1+C2X2+CnXn 服从正态分布,,又因为,E(C1X1+C2X2+CnXn)=,D(C1X1+C2X2+CnXn)=,故 C1X1+C2X2+CnXn,例1 设活塞的直径(以cm计)XN(22.40,0.032),气缸的直径YN(22.50,0.042),X、Y相互独立。任取一只活塞,任取一只气缸,求活塞能装入气缸的概率。,解,由题意知,需求PXY,即求PX-Y0的值,由,XN(22.40,0.032),YN(22.50,0.042),有,X-Y N(-0.10,0.052),从而pX-Y0=,0.9772,返回主页,4.3 协方差及相关系数,一、协方差及相关系数的定义,我们知道,如果两个随机变量X与Y相互独立,有,E(X-EX)(Y-EY)0,这意味着,E(X-EX)(Y-EY)0时,X与Y一定不相互独立。即X与Y存在一定的关系,定义,称E(X-EX)(Y-EY)为X与Y的协方差,记为,Cov(X,Y)E(X-EX)(Y-EY),称为随机变量X与Y的相关系数。,二、协方差的性质,性质1,Cov(X,Y)Cov(Y,X),性质2,Cov(X,X)D(X),性质3,D(X+Y)=D(X)+D(Y)+2 Cov(X,Y),性质4,Cov(X,Y)=E(XY)(EX)(EY),性质5,Cov(aX,bY)=ab Cov(X,Y),事实上,利用性质4,有,Cov(aX,bY)E(aXbY)E(aX)E(bY),abE(XY)abE(X)E(Y),=abCov(X,Y),性质6,若X、Y相互独立,则Cov(X,Y)0,性质7,Cov(X1X2,Y)=Cov(X1,Y)+Cov(X2,Y),证明,Cov(X1X2,Y),E(X1+X2)-E(X1+X2)Y-E(Y),=E(X1-EX1)(Y-EY)+(X2-EX2)(Y-EY),E(X1EX1)(X2EX2)Y-E(Y),=E(X1-EX1)(Y-EY)+E(X2-EX2)(Y-EY),=Cov(X1,Y)+Cov(X2,Y),例1 设(X、Y)的密度为f(x,y)=,求Cov(X,Y),解,三、相关系数的性质,定理,、,的充要条件是:存在常数c、,使,PY=c+X=1,证明,对于任意实数,有 D(Y-X)0,而,0D(Y-X),D(Y)+D(-X)+2Cov(Y,-X),=D(Y)+2D(X)2Cov(Y,X),这是关于的函数,恒大于等于零,因此其判别式,-2 Cov(X,Y)2-4D(X)D(Y),0,变形得,即,特别当0时,有,,此时D(Y-X)0,即,D(Y-X)0,PY-XC1,说明:,相关系数只是随机变量间线性关系强弱的一个度量。说得更确切些,应该称它为线性相关系数,只是因为大家习惯了,所以叫相关系数,当,时,X和Y间存在着线性关系(除去一个零,概率事件外),特别当,时,称X与Y正线性相关。,当,时,称X与Y负线性相关。,当,时,这种线性相关程度随着|xy|的减小而,减弱。,当,时,称X与Y不线性相关(或称零相关,,以概率为0事件相关)但是这时X与Y未必是相互独立得,虽然X与Y不存在线性关系,但它们之间还可能存在别得函数关系(如上例),从而是不相互独立的。,例2 设D(X)=D(Y)=1,,,求D(X-2Y)。,解,D(X-2Y),D(X)+D(-2Y)+2Cov(X,-2Y),=D(X)+4D(Y)-4Cov(X,Y),=D(X)+4D(Y)-4,例3 已知(X,Y)的分布律如下表,试判断X与Y是否相互独立?,解,易知E(X)=0,E(Y)=2.5,E(XY)=0,从而,Cov(X,Y)E(XY)-EXEY0,因此,但是PX=-2,Y=1=0,而PX=-2PY=10,即X与Y不相互独立,例4 设(X,Y)服从正态分布,它的密度函数如下,求,f(x,y)=,解,说明:,二维正态随机变量(X,Y)的密度函数中的参数即为X和Y的相关系数,,二维随机变量的分布完全由X、Y各自的数学期望,方差以及它们的相关系数确定。,若(X,Y)服从二维正态分布,那么X和Y相互独立的充要条件是相关系数0。即,对于二维正态随机变量(X,Y)来说,X和Y不相关与X和Y相互独立是等价的。,返回主页,4.4 矩、协方差矩阵,一、矩的概念。,定义,设X和Y为随机变量,若E(Xk),(k=1,2,)存在,则,称它为X的k阶原点矩,简称k阶矩。,若EX-E(X)k,(k=1,2,)存在,则称它为X的k阶中心矩阵。,若E(XkYl),(k,l=1,2,)存在,则称它为X和Y的kl阶混合矩。,若EX-E(X)kY-E(Y)l,(k,l=1,2,)存在,则称它为X和Y的kl 阶混合中心矩阵。,显然,,X的数学期望E(X)是X的一阶原点矩,方差D(X)是X的二阶中心矩,协方差Cov(X,Y)为X和Y的二阶混合中心矩。,设n维随机变量(X1,X2,Xn)的所有二阶混合中心矩为,Cij=EXi-E(Xi)Xj-E(Xj),i,j=1,2,.n,都存在,则称矩阵,为n维随机变量,(X1,X2,Xn)的协方差矩阵。,说明,由于cij=cji,因而协方差矩阵是一个对称矩阵。,一般说来,n维随机变量(X1,X2,Xn)的分布或者不知道或者太复杂,以致在数学上不易处理,因此实际应用中协方差矩阵就显得重要了。,二、协方差矩阵的定义,可以证明协方差矩阵C是非负定的,即对任意的实数t1,t2,tn有,事实上,若(X1,X2,Xn)为n维连续型随机变量,其概率密度函数为f(x1,x2,xn),则有,即,协方差矩阵为对称非负定阵。,三、n维正态概率密度函数,我们知道,对于二维正态密度函数,f(X1,X2)=,我们将其改写成另一种形式,令,X,因为(X1,X2)的协方差矩阵为,它的行列式detC,于是C的逆矩阵为,从而(X-)C-1(X-)=,于是,(X1,X2)的概率密度可以写为,f(X1,X2)=,由此,我们可以写出n维随机变量的概率密度函数。,引入列矩阵,n维正态随机变量的概率密度定义为,f(X1,X2,Xn)=,四、n维正态随机变量重要性质,性质1,n维正态随机变量(X1,X2,Xn)的每一个分量Xi,(i=1,2,n)都是正态变量;反过来,若X1,X2,Xn都是正态变量,且相互独立,则(X1,X2,Xn)是n维正态变量。,性质2,n维随机变量(X1,X2,Xn)服从n维正态分布的充要,条件是X1,X2,Xn的任意线性组合:k1X1+k2X2+knXn服从一维正态分布(其中k1,k2,kn不全为0)。,性质3,若(X1,X2,Xn)服从n维正态分布,设 Y1,Y2,,Yk是Xj(1,2,n)的线性函数,则(Y1,Y2,Yk)也服从多维正态分布。这一性质称为正态变量的线性变换不变性。,性质4,设(X1,X2,Xn)服从n维正态分布,则“X1,X2,,Xn相互独立”与“X1,X2,Xn两两不相关”是等价的。,函数的基本知识,我们称以p为参量的广义积分,,为第二类,欧拉积分。这个积分当p0时收敛,由它所确定的函数,称为p的函数,记作,一、定义,二、基本性质,(P0),三、常用的函数值,Return,例2 若X为服从参数为的泊松分布,计算这一分布的数学期望。,解 由于X的分布律为,,因此,由此可见,服从参数为的泊松分布的数学期望正好为其参数值。,Return,例5 在某地进行某种疾病地普查,为此检验每个人的血液,如果当地有N个人,若逐个检验就需进行N次检验,问有没有办法减少检验的工作量?,解 先将受检验者分组(k个人一组),设每人血液呈阳性的概率为p,X为分组时平均每人的检验次数,X的可能取值为1/k或(1+k)/k,X的分布律为,于是X的数学期望为:E(X)=1/kqk+(1+k)/k(1-qk),当E(x)1,即q,时,用分组的方法能减少,检验的工作量。,Return,证明 设X是连续型随机变量,由第二章第5节中的(5.2)式知道随机变量Yg(X)的概率密度为,fY(y)=,于是,E(Y),Return,例12 设随机变量(X,Y)的概率密度为,,求数学期望E(Y),E()。,解 E(Y)=,Return,例13 某公司计划开发一种新产品投入市场并试图确定该产品的产量,他们估计出售一件产品可获利m元,而积压一件产品导致n元的损失,再者,他们预测销售量Y服从参数为的指数分布,问要获得利润Q的数学期望最大,应生产多少件产品(m,n,均为已知)?,解 设生产x件,则获利Q是x的函数,即,Q是随机变量Y的函数,其数学期望为,E(Q)=,令,,得,x=,而,0,,故当x=,时,E(Q)取,得极大值,且可知这也是最大值.,特别,当m=500元,n=2000 元,=10000时,则当x=2231件时,获得得利润最大。,Return,例14 据统计,一位40岁的健康人在5年内仍然活着(含自然死亡)的概率为p,某保险公司开办5年人寿保险,条件是参加者身体健康,交保险费a元,5年内活着不退,5年内死亡者(非自杀死亡),公司赔偿死者家属b元(ba),问应如何制定b才能使公司有望获得收益?若有m人参加,公司可望从中收益多少元?,解,设公司从一个参加者中获取收益X元,其分布为,为了使公司获取利润,必须使公司的平均收益大于0即E(X)0,,而E(X)ap+(a-b)(1-p),,所以 ab,如果有m人参加保险,公司的平均收益为,E(mX)=mE(X)=ma-b(1-p),即公司可从中收益ma-mb(1-p)元。,Return,例15 一民航送客车载有20位旅客自机场开出,旅客有10个车站可以下车,如到达一个车站没有旅客下车就不停车,以X表示停车的次数,求E(X)。(设每位旅客在各车站下车是等可能的,并设各旅客是否下车是相互独立的),解,引入随机变量,Xi,,从而X=X1X2X10,因为,P(Xi=0)=,,有 P(Xi=1)=,,于是,E(Xi),所以,E(X),8.784(次),Return,例3 按规定,某车站8:009:00,9:0010:00都恰有一辆客车到站,但到站的时刻是随机的,且两者到站的时间相互独立,其规律为:,一旅客8:20到车站,求他候车时间的数学期望。,解 设旅客的候车时间为X分钟,X的分布律为,于是候车时间的数学期望为,(分),Return,例1 设(X、Y)的密度为f(x,y)=,求Cov(X,Y),解,由于E(X)=,同理,E(Y)0,,因此,Cov(X,Y)E(X-EX)(Y-EY),0,Return,例4 设(X,Y)服从正态分布,它的密度函数如下,求,f(x,y)=,解 我们知道,,EX=1,EY=2,DX=12,DY=22,于是,Cov(X,Y)E(X-EX)(Y-EY),=E(X-1)(Y-2),作变量替换,令,则有,12,从而,Cov(X,Y),所以,,Return,