随机变量及其分布.ppt
2.1 随机变量及其分布2.2 随机变量的数学期望2.3 随机变量的方差与标准差2.4 常用离散分布2.5 常用连续分布2.6 随机变量函数的分布2.7 分布的其他特征数,第二章 随机变量及其分布,2.1 随机变量及其分布,(1)掷一颗骰子,出现的点数 X1,2,6.(2)n个产品中的不合格品个数 Y 0,1,2,n(3)某商场一天内来的顾客数 Z 0,1,2,(4)某种型号电视机的寿命 T:0,+),2.1.1 随机变量的定义,定义 设=为某随机现象的样本空间,称定义在上的实值函数X=X()为随机变量.,注 意 点,(1)随机变量X()是样本点的函数,,其定义域为,其值域为R=(,),若 X 表示掷一颗骰子出现的点数,则 X=1.5 是不可能事件.,(2)若X为随机变量,则 X=k、a X b、均为随机事件.,即 a X b=;a X()b,注 意 点,(3)注意以下一些表达式:,X=k=X kX k;,a X b=X bX a;,X b=X b.,(4)同一样本空间可以定义不同的随机变量.,掷一枚骰子,令X=出现的点数,则X 就是一个随机变量,它的取值为1,2,3,4,5,6我们还可以定义其它的随机变量,例如可以定义:,等等,实例,若随机变量 X 可能取值的个数为有限个或 可列个,则称 X 为离散随机变量.若随机变量 X 的可能取值充满某个区间 a,b,则称 X 为连续随机变量.前例中的 X,Y,Z 为离散随机变量;而 T 为连续随机变量.,两类随机变量,定义 设X为一个随机变量,对任意实数 x,称 F(x)=P(X x)为 X 的分布函数.基本性质:(1)F(x)单调不降;(2)有界:0F(x)1,F()=0,F(+)=1;(3)右连续.,随机变量的分布函数,用分布函数表示事件的概率,离散随机变量的分布列,设离散随机变量 X 的可能取值为:x1,x2,xn,称 pi=P(X=xi),i=1,2,为 X 的分布列.分布列也可用表格形式表示:,X x1 x2 xn,P p1 p2 pn,分布列的基本性质,(1)pi 0,(2),(正则性),(非负性),注 意 点(1),求离散随机变量的分布列应注意:,(1)确定随机变量的所有可能取值;,(2)计算每个取值点的概率.,例,从110这10个数字中随机取出5个数字,令 X:取出的5个数字中的最大值试求 X 的分布列,具体写出,即可得 X 的分布列:,解:X 的取值为5,6,7,8,9,10,例,已知 X 的分布列如下:,X 0 1 2,P 1/3 1/6 1/2,求X 的分布函数并画图.,解:,注 意 点(2),对离散随机变量的分布函数应注意:,(1)F(x)是递增的阶梯函数;,(2)其间断点均为右连续的;,(3)其间断点即为X的可能取值点;,(4)其间断点的跳跃高度是对应的概率值.,X 0 1 2,P 0.4 0.4 0.2,解:,例,已知 X 的分布函数如下,求 X 的分布列.,连续随机变量的密度函数,连续随机变量X的可能取值充满某个区间(a,b).因为对连续随机变量X,有P(X=x)=0,所以无法仿离散随机变量用 P(X=x)来描述连续随机变量X的分布.注意离散随机变量与连续随机变量的差别.,定义,设随机变量X 的分布函数为F(x),则称 X 为连续随机变量,,若存在非负可积函数 p(x),满足:,称 p(x)为概率密度函数,简称密度函数.,密度函数的基本性质,满足(1)(2)的函数都可以看成某个连续随机变量的概率密度函数.,(非负性),(正则性),注意点(1),(1),(2)F(x)是(,+)上的连续函数;(3)P(X=x)=F(x)F(x0)=0;,(4)PaXb=PaXb=PaXb=PaXb=F(b)F(a).,注意点(2),(5)当F(x)在x点可导时,p(x)=,当F(x)在x点不可导时,可令p(x)=0.,连续型,密度函数 X p(x)(不唯一),2.,4.P(X=a)=0,离散型,分布列:pn=P(X=xn)(唯一),2.F(x)=,3.F(a+0)=F(a);P(aXb)=F(b)F(a).,4.点点计较,5.F(x)为阶梯函数。,5.F(x)为连续函数。,F(a0)=F(a).,F(a0)F(a).,例,设 X,求(1)常数 k.(2)F(x).,(1)k=3.,(2),解:,例,设 X,求 F(x).,解:,设X与Y同分布,X的密度为,已知事件 A=X a 和 B=Y a 独立,,解:因为 P(A)=P(B),P(AB)=P(A)+P(B)P(A)P(B),从中解得,且 P(AB)=3/4,求常数 a.,且由A、B 独立,得,=2P(A)P(A)2=3/4,从中解得:P(A)=1/2,由此得 0a 2,因此 1/2=P(A)=P(X a),例,设 X p(x),且 p(x)=p(x),F(x)是 X 的分布函数,则对任意实数 a0,有()F(a)=1 F(a)=F(a)=F(a)F(a)=2F(a)1,课堂练习,2.2 随机变量的数学期望,分赌本问题(17世纪)甲乙两赌徒赌技相同,各出赌注50元.无平局,谁先赢3局,则获全部赌注.当甲赢2局、乙赢1局时,中止了赌博.问如何分赌本?,两种分法,1.按已赌局数分:则甲分总赌本的2/3、乙分总赌本的1/3 2.按已赌局数和再赌下去的“期望”分:因为再赌两局必分胜负,共四种情况:甲甲、甲乙、乙甲、乙乙所以甲分总赌本的3/4、乙分总赌本的1/4,2.2.1 数学期望的概念,若按已赌局数和再赌下去的“期望”分,则甲的所得 X 是一个可能取值为0 或100 的随机变量,其分布列为:,X 0 100,P 1/4 3/4,甲的“期望”所得是:01/4+100 3/4=75.,数学期望的定义,定义 设离散随机变量X的分布列为P(X=xn)=pn,n=1,2,.若级数,绝对收敛,则称该级数为X 的,数学期望,记为,数学期望简称为期望.数学期望又称为均值.数学期望是一种加权平均.,注 意 点,例,则,E(X)=,10.2+00.1+10.4+20.3=0.8.,X 1 0 1 2,P 0.2 0.1 0.4 0.3,例2.2.2 分组验血,解,例,解,连续随机变量的数学期望,定义 设连续随机变量X的密度函数为p(x),若积分,绝对收敛,则称该积分为X 的,数学期望,记为,例2.2.4 设随机变量 X 的概率密度函数为,求EX。,解,随机变量函数的数学期望,引例 设随机变量 X 的分布律为,则有,因此离散型随机变量函数的数学期望为,若 Y=g(X),且,则有,数学期望的性质,定理(随机变量函数的数学期望)设 Y=g(X)是随机变量X的函数,若 E(g(X)存在,则,例2.2.5 设随机变量 X 的概率分布为,求 E(X2+2).,=(02+2)1/2+(12+2)1/4+(22+2)1/4,=1+3/4+6/4=13/4,解:E(X2+2),X 0 1 2,P 1/2 1/4 1/4,数学期望的性质,(1)E(c)=c,(2)E(aX)=aE(X),例,设 X,求下列 X 的函数的数学期望.,(1)2X1,(2)(X 2)2,解:(1)E(2X 1)=1/3,(2)E(X 2)2=11/6.,2.3 随机变量的方差与标准差,数学期望反映了X 取值的中心.方差反映了X 取值的离散程度.,2.3.1 方差与标准差的定义,定义 若 E(XE(X)2 存在,则称 E(XE(X)2 为 X 的方差,记为,Var(X)=D(X)=E(XE(X)2,(2)称,注 意 点,X=(X)=,(1)方差反映了随机变量相对其均值的偏离程度.方差越大,则随机变量的取值越分散.,为X 的标准差.,标准差的量纲与随机变量的量纲相同.,方差的性质,(1)Var(c)=0.性质,(2)Var(aX+b)=a2 Var(X).性质,(3)Var(X)=E(X2)E(X)2.性质,例 设 X,求 E(X),Var(X).,解:(1)E(X)=,=1,(2)E(X2)=,=7/6,所以,Var(X)=E(X2)E(X)2,=7/6 1=1/6,课堂练习,问题:Var(X)=1/6,为什么?,随机变量的标准化,设 Var(X)0,令,则有 E(Y)=0,Var(Y)=1.,称 Y 为 X 的标准化.,切比雪夫不等式,设随机变量X的方差存在(这时均值也存在),则 对任意正数,有下面不等式成立,例设 X,证明,证明:,E(X)=,=n+1,E(X2)=,=(n+1)(n+2),所以,Var(X)=E(X2)(EX)2=n+1,(这里,=n+1),由此得,定理,Var(X)=0,P(X=a)=1,2.4 常用离散分布,二项分布 记为 X b(n,p).X为n重伯努利试验中“成功”的次数,当n=1时,称 b(1,p)为 0-1分布或两点分布.,试验次数为 n=4,“成功”即取得合格品的概率为 p=0.8,所以,X b(4,0.8),思考:若 Y 为不合格品件数,Y?,Y b(4,0.2),一批产品的合格率为0.8,有放回地抽取4次,每次一件,则取得合格品件数 X 服从二项分布.,200件产品中,有190件合格品,10件不合格品,现从中随机抽取一件,若规定,则随机变量 X b(1,0.04).,两点分布是最简单的一种分布,任何一个只有两种可能结果的随机现象,比如新生婴儿是男还是女、明天是否下雨、种籽是否发芽等,都属于两点分布.,说明,二项分布的图形,分析,解,图示概率分布,则有,两点分布的期望和方差,则有,二项分布的期望和方差,例2.4.1 设X b(2,p),Y b(4,p),已知 P(X1)=8/9,求 P(Y1).,解:由 P(X1)=8/9,知 P(X=0)=1/9.,由此得:P(Y1)=1 P(Y=0),所以 1/9=P(X=0)=(1p)2,,从而解得:p=2/3.,=1-(1p)4=80/81.,有一繁忙的汽车站,每天有大量汽车通过,设每辆汽车在一天的某段时间内,出事故的概率为0.0001,在每天的该段时间内有1000 辆汽车通过,问出事故的次数不小于2的概率是多少?,例,故所求概率为,若随机变量 X 的概率分布为,则称 X 服从参数为 的泊松分布,记为 X P().,2.4.2 泊松分布,泊松分布的图形,则有,泊松分布的期望和方差,设X P(),其分布律为,所以,泊松定理,定理,(二项分布的泊松近似),在n重伯努里试验中,记 pn 为一次试验中成功的概率.,若 npn,则,设1000 辆车通过,出事故的次数为 X,则,可利用泊松定理计算,所求概率为,解,例续 一繁忙的汽车站,每天有大量汽车通过,设每辆汽车,在一天的某段时间内出事故的概率为0.0001,在每天的该段时间内有1000 辆汽车通过,问出事故的次数不小于2的概率是多少?,记为 X h(n,N,M).,超几何分布对应于不返回抽样模型:,N 个产品中有 M 个不合格品,,从中抽取n个,不合格品的个数为X.,2.4.3 超几何分布,记为 X Ge(p),X 为独立重复的伯努里试验中,“首次成功”时的试验次数.,几何分布具有无记忆性,即:,P(X m+n|X m)=P(X n),2.4.4 几何分布,负二项分布(巴斯卡分布),记为X Nb(r,p).,X 为独立重复的伯努里试验中,“第 r 次成功”时的试验次数.,注 意 点,(1)二项随机变量是独立 0-1 随机变量之和.,(2)负二项随机变量是独立几何随机变量之和.,常用离散分布的数学期望,几何分布Ge(p)的数学期望=1/p,0-1 分布的数学期望=p,二项分布 b(n,p)的数学期望=np,泊松分布 P()的数学期望=,常用离散分布的方差,0-1 分布的方差=p(1p),二项分布 b(n,p)的方差=np(1p),泊松分布 P()的方差=,几何分布Ge(p)的方差=(1p)/p2,2.5 常用连续分布,正态分布、均匀分布、指数分布、伽玛分布、贝塔分布。,记为X N(,2),其中 0,是任意实数.,是位置参数.,是尺度参数.,2.5.1 正态分布,正态概率密度函数的几何特征,p(x),p(x),p(x),p(x),p(x),x,0,x,x,标准正态分布N(0,1),密度函数记为(x),分布函数记为(x).,(x)的计算,(1)x 0 时,查标准正态分布函数表.,(2)x 0时,用,若 X N(0,1),则(1)P(X a)=(a);(2)P(Xa)=1(a);(3)P(aXb)=(b)(a);(4)若a 0,则 P(|X|a)=P(aXa)=(a)(a)=(a)1(a)=2(a)1,例 设 X N(0,1),求 P(X1.96),P(|X|1.96),=1(1.96),=1(1(1.96),=0.975(查表得),=2(1.96)1,=0.95,=(1.96),解:P(X1.96),P(|X|1.96),=2 0.9751,设 X N(0,1),P(X b)=0.9515,P(X a)=0.04947,求 a,b.,解:(b)=0.9515 1/2,所以 b 0,反查表得:(1.66)=0.9515,故 b=1.66,而(a)=0.0495 1/2,所以 a 0,(a)=0.9505,反查表得:(1.65)=0.9505,故 a=1.65,例,一般正态分布的标准化,定理 设 X N(,2),则 Y N(0,1).,推论:,若 X N(,2),则,若 X N(,2),则 P(Xa)=,设 X N(10,4),求 P(10X13),P(|X10|2).,解:P(10X13)=(1.5)(0),=0.9332 0.5,P(|X10|2)=,P(8X12),=2(1)1,=0.6826,=0.4332,例,设 X N(,2),P(X 5)=0.045,P(X 3)=0.618,求 及.,例,=1.76=4,解:,已知 X N(3,22),且 PXk=PXk,则 k=().,3,课堂练习(1),设 X N(,42),Y N(,52),记 p1=PX 4,p2=PY+5,则()对任意的,都有 p1=p2 对任意的,都有 p1 p2,课堂练习(2),设 X N(,2),则随 的增大,概率 P|X|()单调增大 单调减少 保持不变 增减不定,课堂练习(3),正态分布的期望和方差,则有,正态分布的 3 原则,设 X N(,2),则,P(|X|)=0.6828.,P(|X|2)=0.9545.,P(|X|3)=0.9973.,记为X U(a,b),2.5.2 均匀分布,X U(2,5).现在对 X 进行三次独立观测,试求至少有两次观测值大于 3 的概率.,解:,记 A=X 3,则 P(A)=P(X 3)=2/3,设 Y 表示三次独立观测中 A 出现的次数,则 Y b(3,2/3),所求概率为,P(Y2)=,P(Y=2)+P(Y=3),=20/27,例,均匀分布的期望和方差,则有,2.5.3 指数分布,记为 X Exp(),其中 0.,特别:指数分布具有无忆性,即:,P(X s+t|X s)=P(X t),指数分布的期望和方差,则有,设 X Exp(),密度函数为,2.5.4 伽玛分布,记为 X Ga(,),其中 0,0.,为伽玛函数.,称,注意点,(1),(1)=1,(1/2)=,(n+1)=n!,(2),Ga(1,)=Exp(),Ga(n/2,1/2)=2(n),2.5.5 贝塔分布,记为 X Be(a,b),其中a 0,b 0.,称,为贝塔函数.,注意点,(1),(2),B(a,b)=B(b,a),B(a,b)=(a)(b)/(a+b),(3),Be(1,1)=U(0,1),常用连续分布的数学期望,均匀分布 U(a,b):E(X)=(a+b)/2,指数分布 Exp():E(X)=1/,正态分布 N(,2):E(X)=,伽玛分布 Ga(,):E(X)=/,贝塔分布 Be(a,b):E(X)=a/(a+b),常用连续分布的方差,均匀分布 U(a,b)的方差=(b a)2/12,指数分布 Exp()的方差=1/2,正态分布 N(,2)的方差=2,例2.5.6 已知随机变量 X 服从二项分布,且 E(X)=2.4,Var(X)=1.44,则参数 n,p 的值为多少?,例2.5.7 设 X 表示 10 次独立重复射击命中目标 的次数,每 次射中目标的概率为0.4,则 E(X2)的值为多少?,解:从 2.4=np,1.44=np(1p)中解得,解:因为 E(X)=np=4,Var(X)=2.4,所以,n=6,p=0.4.,E(X2)=Var(X)+(E(X)2=2.4+16=18.4,设 E(X)=,Var(X)=2,则对任意常 数 C,必有().,课堂练习,2.6 随机变量函数的分布,问题:已知 X 的分布,求 Y=g(X)的分布。,例如:Y1=4X+3;Y2=|X|;Y3=X2.,当 X 为离散随机变量时,Y=g(X)为离散随机变量.,将g(xi)一一列出,再将相等的值合并即可.,2.6.1 离散随机变量函数的分布,Y 的分布律为,解,第一步 先求Y=2X+8 的分布函数,解,例,2.6.2 连续随机变量函数的分布,1 当g(x)为严格单调时,第二步 由分布函数求概率密度.,2.6.2 连续随机变量函数的分布,定理 设 X pX(x),y=g(x)是 x 的严格 单调函数,记 x=h(y)为 y=g(x)的反函数,且h(y)连续可导,则Y=g(X)的密度函数为:,例2.6.3 设 X,求 Y=eX 的分布.,y=ex 单调可导,反函数 x=h(y)=lny,所以当 y 0 时,由此得,解:,解,2 当g(x)为其他形式时,再由分布函数求概率密度.,正态变量的线性不变性,定理 设 X N(,2),则当a 0 时,Y=aX+b N(a+b,a22).,由此得:若 X N(,2),则 Y=(X)/N(0,1).,对数正态分布,定理 设 X N(,2),则 Y=e X 的服从,伽玛分布的有用结论,定理 设 X Ga(,),则当k 0 时,Y=kX Ga(,/k).,均匀分布的有用结论,定理 设 X FX(x),若FX(x)为严格单调增的连 续函数,则Y=FX(X)U(0,1).,2.7 分布的其它特征数,矩、变异系数、分位数、中位数,k 阶原点矩和中心矩,k 阶原点矩:k=E(Xk),k=1,2,.,注意:1=E(X).,k 阶中心矩:k=EXE(X)k,k=1,2,.,注意:2=Var(X).,定义,变异系数,定义,为 X 的变异系数.,作用:,称,CV 是无量纲的量,用于比较量纲不同的两个随机变量的波动大小.,2.7.3 分位数,P(X xp)=F(xp)=p,定义,设 0 p 1,,若 xp 满足,则称 xp 为此分布 p-分位数,,亦称 xp 为下侧 p-分位数.,注 意 点,(1)因为 X 小于等于 xp 的可能性为 p,所以 X 大于 xp 的可能性为 1 p.,(2)对离散分布不一定存在 p-分位数.,(3),上侧 p-分位数,若记 xp 为上侧 p-分位数,即,则,P(X xp)=p,中位数,定义,称 p=0.5 时的p 分位数 x0.5 为中位数.,中位数与均值,相同点:都是反映随机变量的位置特征.,不同点:,含义不同.,统计中常用的 p-分位数,(1)N(0,1):Z,U,(2)2(n):,(3)t(n):,(4)F(n,m):,