5.5 随机变量函数的分布.docx
5.5随机变量函数的分布一、背景介绍前面从理论上探讨分析了随机变量的分布规律,然而对很多实际问题,随机变量的分布并不简洁求得;另一方面,有一些实际问题往往并不干脆对分布感爱好,而只感爱好分布的少数几个特征指标,例如分布的中心位置,散布程度等等。弓I例,要比较两个冰箱厂生产的冰箱质量,一方面要比较它们的平均运用寿命,平均寿命越长质量越好:另方面还要比较两个厂产品寿命相对于平均寿命离散程度的大小,离散程度大的质量不稳定,离散程度小的质量比较稳定,比较牢靠。可见,产品的重要质量指标,平均寿命及质量的稳定性均表现为具有肯定特征的参数或数字。知道了这类特征参数或数字,就能对随机变量分布的统计规律一目了然。这类能够直观反映出随机变量分布特征的数字就称为数字特征,包括数学期望和方差。二、随机变量的数学期望及其性质定义1设离散型随机变量的分布列为P(Ar=¾)=pix=1,2,-,A耿=P,则和式Zl称为X的数学期望。记为若X取值为可列个,无穷级数1-1肯定收敛,则称该无穷级数之和为X的数学期望,记为5(J0=¾Ai4留意:假如上述无穷级数不肯定收敛,则称该随机变量X的数学期望不存在。fg»定义2设连续型随机变量X的密度函数为F(x),若广义积分Jk肯定收敛,则称该积分为连续型随机变量X的数学期望,记为£(Ar)=二中(1滋留意:当上述广义积分不肯定收敛时,称X的数学期望不存在。数学期望亦称为期望或均值,山于完全山随机变量的概率分布所确定,所以也称为分布的数学期望。下面给出随机变量函数的期望计算公式:定理设随机变量X的函数Y=f(x),则有()1,若X高散型随机变量£(丫)=夙/"二1.(x)p(x)dx,若力连续型随机变量例1甲、乙两个工人生产同一种产品,若一天中他们生产的废品数分别为随机变量X与Y,且已知X与的概率分布分别为X0123Y0123Pk0.40.30.20.1Pk0.30.50.20设这两人的日产量相同,问哪位工人的生产技术更要好些?解:仅从概率分布看,不好干脆对哪位工人的生产技术更好一些作业评论,但由数学期望的概念,我们可以通过比较E(X),E(Y)的大小来对工人的生产技术作业评判,依题意可得3欧M=3三0×0.4+l×0.3+2×.02÷3×.01=lEa)=EyMJUO=0×0.3+l×05+2×0.2+3×0,9=09由于E(X)>E(Y),故由此判定工人乙的技术更好一些。明显,一天中乙生产的废品数平均比甲1少记。例2某公司生产的机器其无故障工作时间X有密度函数FXN】(x)十。,其他(单位:万小时)公司每售出一台机器可获利1600元,若机器售出后运用1.2万小时之内出故障,则应予以更换,这时每台号损1200元;若在1.2到2万小时之间出故障,则予以修理,由公司负担修理费400元;在运用2万小时以后出故障,则用户自己负责。求该公司售出每台机器的平均获利。解:设Y表示售出一台机器的获利。则Y是X的函数,即-1200f0X<1.2y=g(f)三1600-400,1.2MXM21600fx>2于是E(Y)=Hg(X)=13(-1200)±加+/1200/&+1600-dxJ】/Ji?X2b/=100O即该公司售出每台机器平均获利100O元。下面给出随机变量数学期望的性质性质1E(C)=C(C为常数)证明:只需将X看成为是以概率1?取常数C的随机变量即可:因为随机变量X=C,其分布列为尸(X=C=1.由期望的定义,有:S(X)=CA-Co性质2E(CX)=CX(C为常数)证明:以连续型随机变量为例,设X的密度函数为尸(力,由连续型随机变量期望的定义E(X)=xp(x)dx=CJr9(x)dx=CE(X)性质3R(*+b)=E(R+b(b为常数)证明:设连续型随机变量X的密度函数为P(X),则5(Ar+)=Jw(x+A)P(X)dx。XP(x)dx+5/p(x)dx=E(X)+b性质4B(flX+b)=aE(X)+bb为常数)由性质2,性质3,不难推出性质4成立。性质5设有两个随意的随机变量X,它们的期望E(X),月&)存在,则有E(x+y)=&(X)+E(y).性质5可以推广到n个随机变量。推论1设有n个随意的随机变量Xio=1.2,.万),它们的期望E(X)<£(局),.E(Z)存在,则有睢X总E(M)1-1/Z即n个随机变量40=1.2.-,»)和的期望等于各百期望之和。推论2设有n个随意的随机变量40=1."M,它们的期望E(Xl)E(X/E(Xa)存在,则有5(Jfi)=5()(i1.2,M»*-nM即随机变量Xi的算术平均值的期望等于随机变量Xi的期望的算术平均。这在后面数理统计中常要用到。性质6设得4是相互独立的两个随机变量,且各自的期望均存在,则有式Xo=以XJ趴Xj即两个相互独立的随机变量%。=1.2)乘积的期望等政协委员自期望的乘积。推论设n个随机变量4°=1.2万)相互独立,且各自的数学期望存在,则有B11Xi-11E(Xi)Ul/Ul留意:性质5与性质6条件上的差别。对“求和”,不要求随机变量XG=1.Z"相互独立,对于“求积”,则要求随机变量4°=1.2”)相互独立。这是因为证明“积”的性质时,用到随机变量4°=1.2/)相互概念,否则,不肯定成立。适当应用这些性质,可以简化期望的计算。例3设某仪器总长度X为两个部件长度之和,即X=X1+X2,且已知它们的分布列分别为X91011X267Pk0.30.50.2Pk0.40.6求:以4+名);(2*(X区),耿典)解:因为n=9×0.3+10X0.5+11X0.2=9.9以2=6X0.4+7X0.6=6.6所以,(1)£(X1+X2)=£(X1)+E(X2)=9.9+6.6=16.5(2) £(X1X2)=£(X1)E(X2)=9.9+6.6=65.34(3) E(X22)=62×O.4+72×O.6=43.8留意:风&)工(夙治)=66=4356,这是因为花与其自身不满意相互独立的条件。三、随机变量的方差及其性质在介绍方差的概念之前,我们先来看一个例题。例4甲、乙两人同时在医院由同一名医生检查血压,一周内七天检查的结果分别记为XI,X2,且有如下分布列:Xl120120120120120120120Pk7777777X2606060120180180180Pk777777工7试比较甲、乙两人的健康状况是否一样好?为什么?解:简洁的计算可知,两人血压的期望值均为J1.11£(%)=NXAPA=120×-+120×-=120Ui77yIllW)=A=Wx-+120×-+180×-=120Ui*77尽管,(X1)=E(占)=12°,但并不能说明两人的健康状况一样好。因为,简洁比较两张分布列表可见,甲的血压维持在正常数值(即期望血压)上,健康状况良好:而乙的血压明显地不稳定,时而很高,时而很低,极不正常,说明健康状况极差。这个例夕说明,在实际问题中,仅仅考虑期望值还不能完善地描述随机变量的分布规律,客观上还有另一个因素对分布规律起到重要影响,这就是随机变量取值对于其期望的离散程度。于是就引出了方差的概念。定义3设有随机变量X,其数学期望为E(X),假如用(XT(X)力存,则称它为随机变量X的方差,记为Z)(2r)或K,而称JD(X)或分为随机变量X的标准差或方差根,即O(X)=d=F(X-&(X)2分=疯万=MX-4尸同时,对于离散型随机变量和连续型随机变量,可按随机变量函数的数学期望公式分别给出这两类随机变量的方差为jd(x)(XKoo必1,X为离散型随机变量。=(x-K在QMx知心口JP,X为连续型随机变量。把方差的定义与期望的定义比较可知,所谓方差,乃是一个新随机变量的期望,只不过是原来随机变量X的函数”(X-耿幻尸的期望。由于夕(是一个常数,a”)也是-个常数,不过由于D(X)MX-E(M)'的期望,它恒取非负值,j(Ar)On依期望的性质,有RM=£(X-E(X)力二班二2Jffi(X)+(6(X)尸=£(犬)-2(&(x)'+(Sqr)I=RgT趴即0(冷=3(月)-(夙*)2这是一个能使方差的计算更加便利的常用公式,应给以足够地重视。例5求前例4中甲、乙两人一周内血压(测量值)的方差。解:例4中已算出两人血压的期望分别为“(X)="(XD=i20,代入离散型随机变量方差的定义式分别得到T,1D(Xo=Zw-&得)2l=(120-120)<-=07JUlf7331D(XJ=Z(Xk-£(乂)y=(180-120)2_+Q60_120尸-+0-A.I777=-3600«308577可见,甲的血压方差为0,相当稳定,健康状况极好:而乙的血压方差极大,极不稳定,健康状况也极差。例6已知随机变量X的密度函数为F(X)=3 2-(l-)t0x24 4O,其他解:因为X是连续型随机变量,故可得E(J)=r彳加=用式1-7)&=(Eg=沁-%=IFXJa-5)血=IWD=玳炉)(附W)Y所以,有5480下面给出随机变量方差的性质性质10(C)=°(C为常数)证明:由定义,0(C)=&C-3(C)f=(C-C)'=O留意:由这条性质反过来可以想到下面的结论成立,即若Q(X)=O,则尸(X=E(X)二1。也就是说,只要随机变量X的方差为0,就表明X相对于5(M的波动幅度为0,故X的全部取值必定恒为H(Ar),即以概率1取值月。性质2D(X+b)=D(r)(b为常数)。证明:由定义,。(¥+彷=研(*+b)-E(X+b)iEXb-EX-bf性质3DCX)=C'D(X)(C为常数)证明:由定义,0(因=现CX(CRf=矶C(X-醺幻f=C'0(X)留意:这条性质与期望性质的差别:常数自由出入期望符号,但不能自由出入方差符号,必需平方后才能移出符号“D”,开方后才能移入符号“D”。性质4Q(OX+b)=/。(JO这条性质不难由性质2、性质3综合归纳得到。性质5设有X,Y相互独立,且它们的均方差都存在,则有D(X±y)=D(M±z)(y)留意:这条性质必需在X,Y相互独立的条件下才能成立,故在运用该性质时,必需满意相互独立的条件。推论1设随机变量G=1.2界)相互独立,且0(4(i=1.2,M)均存在,则有1w即n个相互独立的随机变量X(J=1.2力),它们取算术平均以后的方差等于它们各自方差算2术平均的寿,这条性质在后面的数理统计中也要用到。适当运用这些性质将大大简化某些方差的计算。例7求前面例3中仪器的两部件长度差的方差。解:由例3,已解得耿苞)99,以XJ于是有D(X1)=EXl-£(%»=E(Xjk-E(%)'AJUl二(-09尸03+(01/05+(1】)202=049D(XJ=EIX厂名(出行=(X4-改XMPtUl=(-06)204+(04)2Q6=024由于两部件长度是相互独立的,故石匕相互独立,于是有D(X1.Xj=D(XJ+DQXjD(Af1)+Z)(Xa)三0.49+024=0.73Y_Xf例8设随机变量X的数学期望为,方差为封。求:的数学期望与方差。解:由数学期望和方差的性质可知E(Y)=E=15(X-)=1B(X)-川,GUr)=O)四、常见分布的期望与方差1、离散型随机变量D两点分布设XB(P),分布列为X01PkqP则有E(Jo=Og+lp=p0(幻=用X-E(X)F=(O-P)2(I-P)+。一2尸p=p(l-p)=pg即E(¥)=P»O(X)=M2)二项分布设XB(n,p),分布列为P(X=阿=R=CPvJW=OJ2M则有E(X)=卬D(X)=Npq证明:由于二项分布是n个两点分布的和分布,即il其中43(p)Jl1»=5(l)=W=p=所以MlZM又由于组成二项分布的n个两点分布是相互独立的,于是由性质5得Dg=DzXj=ZD(Xi)=Zpq=啪)Zi4Z3)泊松分布(PoiSSon)设xa),X的分布列为PX=)=(*)=(*=02.)%:则有E(JO=D(X)=4(推导略)从而可知:听从泊松分布的随机变量的分布列由它的数学期望(方差)唯一确定。2、连续型随机变量1)匀称分布设XUa,b,密度函数为P(x)=(b-O,其他则有E=啜"=11r证明:因为E=t'(x"=f廿C工卜夕"勾Ew)=匚p(x)dx=y?E=l(j+S)于是有附中“2)指数分布设Xcxp('),密度函数为P(X)=M*.x>0O,其他EQe)=4*X(V,)(fx=-Xd1.=1.3则有J类似有咐)=口口乜3$O(X)=EGd)-(AX)2=所以4=3)正态分布设XNQ,c2),密度函数为E(M=广力加=rX4,记则有Jy廊b广于瓯于是,21IlfHoE(JC)=J(5+)e2dt-=-J曲=类似地,可以导出°(X)=/(r-事实上,由D(JC)=匚(Ar-e(x)¼=1.(X")耳F-翁同样,即x=5+,dx=<h,代入即得。可见,对于听从正态分布的随机变量X,恒有3(扪=",P(Ar)=CF0即听从iE态分布的随机变量的密度函数由它的数学期望与方差所唯一确定。例9设XB(%p),RGV)=I2,D(JO=8,求11与P解:依题意以及期望与方差的学问,有E(X)=叩=12D(X)=npq=8211q=-P=I-g=-将式代入即有12q=8,解得3,所以有3,再代入(1)式有n=36。D(X)例io设XSdb,求(&(Ar)2£(Jf)=山OGr)=-1.S-C)2解:因为2,12,所以有D(X)WS-°)11仅一。丫(A(X)1.l(+)i-3l÷J