概率论与数理统计教程(茆诗松)第三章ppt课件.ppt
3.1 多维随机变量及其联合分布3.2 边际分布与随机变量的独立性3.3 多维随机变量函数的分布3.4 多维随机变量的特征数3.5 条件分布与条件期望,第三章 多维随机变量及其分布,3.3.1 多维随机变量 定义3.1.1 若X, Y是两个定义在同一个样本空间上的 随机变量,则称(X, Y) 是两维随机变量. 同理可定义 n 维随机变量 (随机向量).,3.1 多维随机变量及其联合分布,定义3.1.2,3.1.2 联合分布函数,F(x, y) = P( X x, Y y),为(X, Y) 的联合分布函数.,(以下仅讨论两维随机变量),任对实数 x 和 y, 称,注意:,F(x, y)为(X, Y)落在点(x, y)的左下区域的概率.,X1,X2,x1,x2,(x1, x2),联合分布函数的基本性质,(1) F(x, y) 关于 x 和 y 分别单调增.,(2) 0 F(x, y) 1,且,F(, y) = F(x, ) =0,,F(+, +) = 1.,(3) F(x, y) 关于 x 和 y 分别右连续.,(4) 当ab, cd 时,有,F(b, d) F(b, c) F(a, d) + F(a, c) 0.,注意:上式左边 = P(aXb, cY d).,(单调性),(有界性),(右连续性),(非负性),二维离散随机变量,3.1.3 联合分布列,若(X, Y) 的可能取值为有限对、或可列对,则称(X, Y)为二维离散随机变量.,二维离散分布的联合分布列,称,pij = P(X=xi, Y=yj), i, j=1, 2, .,为(X,Y) 的联合分布列,,其表格形式如下:,Y,X,y1 y2 yj ,x1x2xi,p11 p12 p1j p21 p22 p2j pi1 pi2 pi j ,联合分布列的基本性质,(1) pij 0, i, j = 1, 2,(2) pij = 1.,(非负性),(正则性),确定联合分布列的方法,(1) 确定随机变量 (X, Y) 的所有取值数对.,(2) 计算取每个数值对的概率.,(3) 列出表格.,例3.1.1 将一枚均匀的硬币抛掷4次,X表示正面向上的次数,Y表示反面朝上次数。求 (X, Y) 的联合分布列.,X Y0 41 3 2 2 3 14 0,P(X=0, Y=4)=,P(X=2, Y=2)=,=1/4,=6/16,P(X=3, Y=1)=,=1/4,P(X=4, Y=0)= 0.54 =1/16,P(X=1, Y=3)=,0.54=1/16,解:概率非零的(X,Y) 可能取值对为:,其对应的概率分别为:,X01234,Y 0 1 2 3 4,列表为:,0 0 0 0 1/16 0 0 0 1/4 0 0 0 6/16 0 0 0 1/4 0 0 01/16 0 0 0 0,例3.1.2 设随机变量 Y N(0, 1),解: (X1, X2) 的可能取值数对及相应的概率如下:,P(X1=0, X2=0) = P(|Y|1, |Y|2),= P(|Y|2),= 2 2(2) = 0.0455,P(X1=0, X2=1) = P(|Y|1, |Y|2),= P(1|Y|2),= 2(2) (1),= 0.2719,P(X1=1, X2=0) = P(|Y|1, |Y|2) = 0,P(X1=1, X2=1) = P(|Y|1, |Y|2),= P(|Y|1),= 0.6826,求,的联合分布列.,列表为:,X1 0 1,X2 0 1,0.0455 0.2719 0 0.6826,课堂练习,设随机变量 X 在 1,2,3 , 4 四个整数中等可能地取值,另一个随机变量 Y 在 1到X 中等可能地取一整数值。试求(X, Y)的联合分布列.,设二维随机变量(X, Y) 的分布函数为 F(x, y),若存在非负可积函数 p(x, y),使得,3.1.4 联合密度函数,则称 (X, Y) 为二维连续型随机变量。,称p(x, y) 为联合密度函数。,联合密度函数的基本性质,(1) p(x, y) 0. (非负性),(2),注意:,(正则性),一、多项分布,3.1.5 常用多维分布,若每次试验有r 种结果:A1, A2, , Ar,记 P(Ai) = pi , i = 1, 2, , r,记 Xi 为 n 次独立重复试验中 Ai 出现的次数.,则 (X1, X2, , Xr)的联合分布列为:,二、多维超几何分布,从中任取 n 只,,记 Xi 为取出的n 只球中,第i 种球的只数.,口袋中有 N 只球,分成 r 类 。,第 i 种球有 Ni 只, N1+N2+Nr = N.,则 (X1, X2, , Xr)的联合分布列为:,三、二维均匀分布,若二维连续随机变量 (X, Y) 的联合密度为:,则称 (X, Y) 服从 D 上的均匀分布,,记为 (X, Y) U (D) .,其中SD为D的面积.,四、二维正态分布,若二维连续随机变量 (X, Y) 的联合密度为:,则称 (X, Y) 服从二维正态分布,,记为 (X, Y) N ( ) .,例3.1.3,若 (X, Y) ,试求常数 A.,解:,所以, A=6,=A/6,例3.1.4,若 (X, Y) ,试求 P X 2, Y 1.,解: P X2, Y1,2,1,x2, y1,例3.1.5,若 (X, Y) ,试求 P(X, Y)D, 其中D为 2x+3y6.,3,2,2x+3y=6,解:,3.2 边际分布与随机变量的独立性,问题:已知二维随机变量 (X, Y) 的分布,,如何求出 X 和 Y 各自的分布?,3.2.1 边际分布函数,巳知 (X, Y) 的联合分布函数为 F(x, y),,则,Y FY (y) = F(+ , y).,X FX (x) = F(x, +),3.2.2 边际分布列,巳知 (X, Y) 的联合分布列为 pij,,则,X 的分布列为:,Y 的分布列为:,X,Y,3.2.3 边际密度函数,巳知 (X, Y) 的联合密度函数为 p(x, y),,则,X 的密度函数为 :,Y 的密度函数为 :,由联合分布可以求出边际分布.但由边际分布一般无法求出联合分布.所以联合分布包含更多的信息.,注 意 点 (1),二维正态分布的边际分布是一维正态: 若 (X, Y) N ( ),,注 意 点 (2),则 X N ( ),,Y N ( ).,二维均匀分布的边际分布不一定是一维均匀分布.,例3.2.1 设 (X, Y)服从区域 D=(x, y), x2+y2 1 上的均匀分布,求X 的边际密度p(x).,解: 由题意得,-1,1,当|x|1时,p(x, y)=0,所以 p(x)=0,当|x|1时,不是均匀分布,例3.2.2 设二维随机变量 (X, Y) 的密度函数为,求概率PX+Y1.,解:,PX+Y1=,y=x,x+y=1,1/2,若满足以下之一: i) F(x, y) = FX(x)FY(y) ii) pij = pipj iii) p(x, y) = pX(x)pY(y) 则称 X 与Y 是独立的,,3.2.4 随机变量间的独立性,(1) X 与Y是独立的其本质是:,注 意 点,任对实数a, b, c, d,有,(2) X 与Y 是独立的,则g(X)与h(Y)也是独立的.,例3.2.3,(X, Y) 的联合分布列为:,问 X与Y 是否独立?,解: 边际分布列分别为:,X 0 1P 0.7 0.3,Y 0 1P 0.5 0.5,因为,所以不独立,例3.2.4,已知 (X, Y) 的联合密度为,问 X 与Y 是否独立?,所以X 与Y 独立。,注意:p(x, y) 可分离变量.,解: 边际分布密度分别为:,注 意 点 (1),(1) (X, Y) 服从矩形上的均匀分布,则X与Y 独立.,(2) (X, Y) 服从单位圆上的均匀分布,则 X与Y 不独立. 见前面例子,(3) 联合密度 p(x, y) 的表达式中,若 x 的取值与 y 的 取值有关系,则 X与Y 不独立.,注 意 点 (2),(4) 若联合密度 p(x, y) 可分离变量,即 p(x, y) = g(x)h(y) 则 X与Y 独立。(习题3.2 16题),(5) 若 (X, Y) 服从二元正态 N ( ) 则 X与Y 独立的充要条件是 = 0.,3.3 多维随机变量函数的分布,问题:已知二维随机变量 (X, Y) 的分布,,如何求出 Z=g (X, Y)的分布?,(1) 设(X1, X2, , Xn) 是n维离散随机变量, 则 Z = g(X1, , Xn) 是一维离散随机变量.,3.3.1 多维离散随机变量函数的分布,(2) 多维离散随机变量函数的分布是容易求的:,i) 对(X1, X2, , Xn)的各种可能取值对, 写出 Z 相应的取值.,ii) 对Z的 相同的取值,合并其对应的概率.,3.3.2 最大值与最小值分布,例3.3.1 设X与Y 独立,且 X, Y 等可能地取值 0 和1. 求 Z = max(X, Y) 的分布列.,解:,X 0 1P 1/2 1/2,Y 0 1P 1/2 1/2,Z = max(X, Y) 的取值为: 0, 1,P(Z=0) = P(X=0, Y=0),= P(X=0)P(Y=0),=1/4,P(Z=1),= P(X=0, Y=1) + P(X=1, Y=0) + P(X=1, Y=1),= 3/4,设 X1, X2, Xn, 独立同分布,其分布函数和密度函数分别为 FX(x) 和 pX(x).,一般情况,若记,Y = max (X1, X2, Xn),Z = min (X1, X2, Xn),则,Y 的分布函数为:,FY (y) = FX(y)n,Y 的密度函数为:,pY(y) = nFX(y)n1 pX(y),Z 的分布函数为:,FZ(z) = 11 FX(z)n,Z 的密度函数为:,pZ(z) = n1 FX(z)n1 pX(z),3.3.3 连续场合的卷积公式,定理3.3.1 设连续随机变量X与Y 独立, 则 Z=X+ Y 的密度函数为,离散场合的卷积公式,设离散随机变量 X 与 Y 独立,则 Z=X+ Y 的分布列为,卷积公式的应用,例3.3.2 X与Y 是独立同分布的标准正态变 量,求 Z = X+ Y 的分布.,解:,所以 Z = X+ Y N(0, 2).,进一步的结论见后,分布的可加性,若同一类分布的独立随机变量和的分布仍是此类分布,则称此类分布具有可加性.,二项分布的可加性,若 X b(n1, p),Y b(n2, p),,注意:若 Xi b(1, p),且独立,则 Z = X1 + X2 + + Xn b(n, p).,且独立,,则 Z = X+ Y b(n1+n2, p).,泊松分布的可加性,若 X P(1) ,Y P(2),,注意: X Y 不服从泊松分布.,且独立,,则 Z = X+ Y P(1+2).,正态分布的可加性,若 X N( ),Y N( ) ,,注意: X Y 不服从 N( ).,且独立,,则 Z = X Y N( ).,X Y N( ).,独立正态变量的线性组合仍为正态变量. (见下),独立正态变量的线性组合仍为正态变量,Xi N(i, i2), i =1, 2, . n. 且 Xi 间相互独立, 实数 a1, a2, ., an 不全为零, 则,伽玛分布的可加性,若 X Ga(1, ),Y Ga(2, ) ,,注意: X Y 不服从 Ga(12, ).,且独立,,则 Z = X + Y Ga(1+2, ).,2 分布的可加性,若 X 2( n1 ),Y 2( n2 ) ,,注意: (1) X Y 不服从 2 分布.,且独立,,则 Z = X + Y 2( n1+n2).,(2) 若 Xi N(0, 1),且独立,则 Z =, 2( n ).,注 意 点,(1) 独立的0-1分布随机变量之和服从二项分布.,(2) 独立的指数分布随机变量之和服从伽玛分布.,例3.3.3 设 X 与 Y 独立,XU(0, 1), YExp(1). 试求 Z = X+Y 的密度函数.,解:,被积函数的非零区域为:,00,用卷积公式:,(见下图),x,z,1,z = x,因此有,(1) z 0 时,pZ(z) = 0 ;,(2) 0 z 1 时,pZ(z) =,(3) 1 z 时,pZ(z) =,1,3.3.4 变量变换法,已知 (X, Y) 的分布, (X, Y) 的函数,求 (U, V) 的分布.,变量变换法的具体步骤,有连续偏导、存在反函数,则 (U, V) 的联合密度为,若,其中J为变换的雅可比行列式:,增补变量法,可增补一个变量V = g2(X, Y) ,,若要求 U = g1(X, Y) 的密度 pU(u) ,,先用变量变换法求出 (U, V)的联合密度pUV(u, v),,用此方法可以求出卷积公式、积的公式、商的公式,然后再由联合密度pUV(u, v),去求出边际密度pU(u),本节主要给出 X 与 Y 的相关系数,3.4 多维随机变量的特征数,3.4.1 多维随机变量函数的数学期望,定理 3.4.1 设 (X, Y) 是二维随机变量, Z = g(X, Y),则,E(Z) = Eg(X, Y) =,课堂练习,在长为 a 的线段上任取两点 X 与 Y,求两点间的平均长度.,求 E(|XY|),3.4.2 数学期望与方差的运算性质,1. E(X+Y)=E(X)+E(Y),2. 当X与Y独立时,E(XY)=E(X) E(Y),(性质3.4.1),(性质3.4.2),讨论 X+Y 的方差,1. Var(XY) = Var(X)+ Var (Y) 2EXE(X)YE(Y),3. 当X与Y独立时,EXE(X)YE(Y) = 0.,4. 当X与Y独立时, Var(X Y) = Var(X)+ Var (Y) .,2. EXE(X)YE(Y) = E(XY) E(X)E(Y),注意:以上命题反之不成立.,3.4.3 协方差,定义3.4.1 称 Cov(X, Y) = EXE(X)YE(Y),为 X 与 Y 的协方差.,协方差的性质,(4) Cov(X, Y) = Cov(Y, X). (性质3.4.7),(1) Cov(X, Y) = E(XY) E(X)E(Y). (性质3.4.4),(2) 若 X 与 Y 独立,则 Cov(X, Y) = 0. (性质3.4.5),(6) Cov(aX, bY) = abCov(X, Y) . (性质3.4.9),(3) Var(XY) = Var(X)+ Var (Y) 2 Cov(X, Y) (性质3.4.6),(5) Cov(X, a) = 0. (性质3.4.8),(7) Cov(X+Y, Z) = Cov(X, Z) + Cov(Y, Z). (性质3.4.10),课堂练习1,X 与 Y 独立,Var(X) = 6,Var(Y) = 3, 则 Var(2XY) = ( ).,27,课堂练习2,X P(2),Y N(2, 4), X与Y独立, 则 E( XY) = ( ); E( XY)2 = ( ).,4,22,解:记 “Xi = 1” = “第 i 个人拿对自己的礼物” “Xi = 0” = “第 i 个人未拿对自己的礼物”,配对模型的数学期望和方差,n 个人、n 件礼物,任意取. X 为拿对自已礼物的人数,求 E(X), Var(X),则,因为 E(Xi) = 1/n, 所以 E(X) = 1.,又因为,所以 E(XiXj) = 1/n(n1),XiXj,P,0 1,11/n(n1) 1/n(n1),由此得,又因为,所以先计算 E(XiXj),XiXj的分布列为,所以,3.4.4 相关系数,定义3.4.2 称 Corr(X, Y) =,为 X 与 Y 的相关系数.,若记,注 意 点,则,相关系数的性质(1),(1) 施瓦茨不等式, Cov(X, Y) 2 Var(X)Var(Y).,相关系数的性质(2),(2) 1 Corr(X, Y) 1.,(3) Corr(X, Y) = 1,X 与 Y 几乎处处有线性关系。,(性质3.4.11),(性质3.4.12),P(Y=aX+b)=1,Corr(X, Y) 的大小反映了X与Y之间的线性关系:,注 意 点,Corr(X, Y) 接近于1, X 与 Y 间 正相关.,Corr(X, Y) 接近于 1, X 与 Y 间 负相关.,Corr(X, Y) 接近于 0, X 与 Y 间 不相关.,没有线性关系,例3.4.1 设 (X, Y) 的联合分布列为,求 X, Y 的相关系数.,解:,= 0,同理,= 3/4,E(Y) = E(X) = 0,另一方面,= 1/81/81/8+1/8,= 0,所以,Cov(X, Y),即 Corr(X, Y) = 0,E(Y2) = E(X2) = 3/4,= E(XY)E(X)E(Y) = 0,例3.4.2 (X, Y) p(x, y) =,求 X, Y 的相关系数,解:,= 7/6,= 5/3,所以, Var(X) = Var(Y) = 11/36,= 4/3,二维正态分布的特征数,(1) X N( 1, 12), Y N( 2, 22);,(2) 参数 为 X 和 Y 的相关系数;,(4) 不相关与独立等价.,3.4.5 随机向量的数学期望与协方差阵,定义3.4.3 记,称,,则,为,的协方差阵,记为,或,定理3.4.2 协方差阵对称、非负定.,协方差阵的性质,称,注 意 点,为,的相关矩阵.,课堂练习1,设 X N(0, 1), Y N(0, 1), Var(XY) = 0, 求 (X, Y) 的协差阵 .,课堂练习2,设 X, Y 的协差阵为,求相关阵 R.,对二维随机变量(X, Y), 在给定Y取某个值的条件下, X的分布; 在给定X取某个值的条件下, Y的分布.,3.5 条件分布与条件期望,(1) 条件分布列:,3.5.1 条件分布,(2) 条件密度函数:,(3) 条件分布函数:,3.5.2 条件数学期望,定义 3.5.4,E(X| Y=y) 是 y 的函数.,注 意 点,所以记 g(y) = E(X| Y=y).,进一步记 g(Y) = E(X| Y).,重期望公式,定理 3.5.1,