随机变量及其分布课件.ppt

上传人：牧羊曲112

文档编号：1867510

上传时间：2022-12-22

格式：PPT

页数：85

大小：3.05MB

《随机变量及其分布课件.ppt》由会员分享，可在线阅读，更多相关《随机变量及其分布课件.ppt（85页珍藏版）》请在三一办公上搜索。

1、随机变量的概念(1),随机试验的可能结果不止一个.例如：考察投掷两颗骰子的随机试验，假设这两颗骰子是可以分辨的，其样本空间为：S = (1,1), (1,2), , (1,6), (2,1), (2,2), , (6,6)在某些情况下，人们主要感兴趣的不是试验结果本身，而是与试验结果有关的某个数.例如：如果人们关心两颗骰子掷出的点数之和是否等于7,实际上就不会在乎其结果是(1,6)还是(2,5).,有些随机试验的结果本身是一个数，例如：某出租车公司的电话订车中心，一天之内接到订车电话的次数；某射手对一活动靶进行射击，到击中目标为止，所进行的射击次数；从一批灯泡中，任取一只，测定这只灯泡的寿命.

2、有些随机试验的结果看起来与数量无关，例如：投掷一枚硬币，其基本事件为“正面向上”、“反面向上”；在有两个孩子的家庭中,考虑孩子的性别，其基本事件为“男男”、“男女”、 “女男”、 “女女”.,如果我们将随机试验的结果数量化，使之与实数对应起来，我们就有可能利用数学分析的方法对随机试验的结果进行深入广泛的研究.,随机变量的概念(2),定义：随机变量是定义在样本空间 S 上的实值函数.,P(B),P(A),是定义在样本空间 S 上的函数,附注：随机变量与普通函数有着本质的区别.随机变量是一种因变量（而非自变量），它的取值依赖于样本点，所以其定义域是抽象的样本空间.随机变量的取值随试验的结果而定，而

3、试验各个结果的出现有一定的概率，因而随机变量的取值也有一定的概率.随机变量常用大写字母X, Y, Z, 表示，而以小写字母x, y, z, 表示实数.若 L 是一个实数集合，则集合e | X(e) L表示样本空间 S 中满足X(e) L的所有样本点组成的子集（随机事件）.,实例1 掷一个硬币,观察出现的结果,共有两种情况:,若用X 表示掷一个硬币出现正面的次数,则有,即X(e)是一个随机变量.,实例2 在有两个孩子的家庭中,考虑其性别,共有4个样本点:,若用X表示该家庭女孩的人数时，则有,可得随机变量,若假设男孩和女孩的出生率相等，则,2 离散型随机变量及其分布律,离散型随机变量,定义：若随机

4、变量只能取有限个或可列个数值，则称为离散型随机变量.,随机变量,离散型随机变量,非离散型随机变量,附注：随机变量与普通函数有着本质的区别.随机变量是一种因变量（而非自变量），它的取值依赖于样本点，所以其定义域是抽象的样本空间.随机变量的取值随试验的结果而定，而试验各个结果的出现有一定的概率，因而随机变量的取值也有一定的概率.随机变量常用大写字母X, Y, Z, 表示，而以小写字母x, y, z, 表示实数.若 L 是一个实数集合，则集合e | X(e) L表示样本空间 S 中满足X(e) L的所有样本点组成的子集（随机事件）.,设离散型随机变量 X 的所有可能取值为，且,离散型随机变量的分布

5、,分布律,显然，下列两个条件必定成立：(1) (2),也可以用表格的形式来表示,例：,对技术熟练的射手甲对新手乙X和Y 是不同的随机变量.,结论：概率1，以不同的方式分布到各可能取值，就确定不同的随机变量.,游戏规则：落在e0区域得0分；落在e1区域得1分；落在e2区域得2分,例：已知随机变量 X 的概率分布描述如下：试求出 X 的分布.,例：若随机变量X 只取常数值a ，即，则称X 服从退化分布或单点分布.附注：其实X 并不随机，但有时将它看作是随机变量更为方便，这是概率集中在一点a 处的退化情形.,独立试验序列,定义：若一个随机试验只有两种可能结果： A（称为“成功”）与A（称为“失败”

6、）,两者发生的概率分别为：（成功概率）, （失败概率），则此类试验称为成功概率为 p 的伯努利试验.,定义：将一个伯努利试验独立重复进行 n 次，得到的试验序列称为 n 重伯努利试验.,附注：所谓独立重复进行一个伯努利试验，是指每一次试验都是伯努利实验，只能发生或 .“重复”是指在每次试验中成功概率 P(A) = p 保持不变.“独立”是指每一次试验的结果互不影响，即若以 Ci 表示第 i 次试验的结果，则 P(C1C2 Cn) = P(C1) P(C2) P(Cn) .,两点分布,在成功概率 P(A) = p 的伯努利试验中，事件 A 出现的次数 X 只能等于0 或 1，且它的分布律是,

7、即其中,不难验证：所以这是一个概率分布，称 X 服从两点分布.,说明,对于一个随机试验，如果样本空间只包含两个元素，即S = e1, e2我们总能在 S 上定义一个服从两点分布的随机变量来描述这个随机试验的结果（课本P.41）,二项分布(Binomial Distribution ),在成功概率 P(A) = p 的 n 重伯努利试验中，事件 A 出现的次数 X 可能等于，且它的分布律,不难验证：所以这是一个概率分布，称为二项分布，简记作 .,特别的，当 n = 1时，二项分布就是两点分布.,例：（产品抽样检验模型）设 N 件产品有 M 件次品，从中任取一件产品进行检验，则结果可能是：A（

8、“次品”）或 A（“正品”），这是成功概率的伯努利试验. 若采取“放回抽样”，接连抽取 n 次，那么这样的抽检形成一个的 n 重伯努利试验.若采取“不放回抽样”，接连抽取 n（N）次，那么这样的抽检不能视作 n 重伯努利试验.当产品总量 N 很大时，抽出少数几件不致影响次品率，故也可将不放回地接连抽取 n（远小于 N）次的检验看成 n 重伯努利试验.,例：按规定，某种型号电子元件的使用寿命超过1500小时的为一级品. 已知某一大批产品的一级品率为0.2，现在从中随机地抽查20只，问20只元件中恰有 k 只（k =0,1,20）为一级品的概率是多少？,解：记20只元件中一级品的只数为X，那么X

9、 b(20, 0.2)，于是,分析：这是不放回抽样当产品总量 N 很大时，抽出少数几件不致影响一级品率，故也可将不放回地接连抽取 n（远小于N）次的检验看成 n 重伯努利试验.,例：某人进行射击，设每次射击的命中率为0.02，独立射击400次，试求至少击中两次的概率.,解：记400次射击中命中的次数为X，那么X b(400, 0.02)，于是,结论：只要试验的次数足够多，而且试验是独立进行的，那么小概率事件几乎肯定发生，决不能忽视小概率事件.,例：设有80台同类型的设备，各台工作是相互独立的，发生故障的概率都是0.01，且一台设备的故障能由一个人处理考虑两种配备维修工人的方法，其一是由4人维修

10、，每人负责20台；其二是由3人共同维护80台试比较这两种方法在设备发生故障时不能得到及时维修的概率的大小,解：先讨论第二种方法设80台设备同一时刻发生故障的台数为X，则X b(80, 0.01)，所求概率为,再设第 i 个人负责的20台设备同一时刻发生故障的台数为X，则X b(20, 0.01)，于是,解：（续）再讨论第一种方法设Ai表示事件“第 i 个人负责的20台设备发生故障不能得到及时维修”，则所求概率为,结论：尽管第二种方法尽管任务重了（每人平均维护约27台），但工作效率不仅没降低，反而提高了.,解：假设需要发射 n 枚导弹，则击中来犯敌机的导弹数是随机变量X b(n, 0.96)，于

11、是又因为所以从而取 n = 3，即需要发射3枚导弹,例：已知发生一枚地对空导弹击中来犯敌机的概率为0.96，问需要在相同条件下发射多少枚导弹才能保证至少有一枚导弹击中来犯敌机的概率大于0.999?,解：因为全是瞎蒙，所以每道题的任一个答案被选中的概率都是相等的，每做一道题就是进行一次成功概率为1/n 的伯努利试验设答对的题目数量X b(5, 1/n)，于是这人考试及格的概率为当 n = 3 时，当 n = 4 时，,例：一个完全不懂英语的人去瞎蒙一次大学英语四级考试设此考试有5道选择题，每题给出 n 个答案以供选择，其中只有一个答案正确试问这人居然答对3题以上从而及格的概率,泊松分布(Poi

12、ssion Distribution),若随机变量 X 以作为其一切可能取值，且其中常数，则称 X 服从泊松分布，简记作 .,不难验证：所以这是一个概率分布.,历史上，泊松分布是作为二项分布的近似，于1837年由法国数学家泊松引入的近数十年来，泊松分布日益显示其重要性，成为概率论中最重要的几个分布之一在实际中，许多随机现象（近似）服从泊松分布二十世纪初罗瑟福和盖克两位科学家在观察与分析放射性物质放出的粒子个数的情况时，他们做了2608 次观察(每次时间为7.5 秒)发现放射性物质在规定的一段时间内，其放射的粒子数X 服从泊松分布.,泊松分布的背景及应用,在生物学、医学、工业统计、保险

13、科学及公用事业的排队等问题中,泊松分布是常见的.例如地震、火山爆发、特大洪水、交换台的电话呼唤次数等,都服从泊松分布.,泊松分布与二项分布的关系,3 随机变量的分布函数,随机变量是定义在样本空间 S 上的实值单值函数.若 L 是一个实数集合，则集合表示样本空间 S 中满足的所有样本点组成的随机事件.若随机变量只能取有限个或可列个数值，则称为离散型随机变量.离散型随机变量的分布律必满足：(1)(2),知识点回顾,引言,非离散型随机变量，由于其可能取的值不能一个一个地列举出来，因而就不能像离散型随机变量那样用分布律来描述在实际中，对于非离散型随机变量，如：误差，元件的寿命 T 等，人们感兴趣的

14、往往并不是误差 =0.05(mm)，寿命T = 1251.3(h)的概率，而是考虑误差落在某个区间的概率，寿命大于某个数的概率,随机变量的分布函数,随机变量 X 与任意实数 x 的关系式对应着随机事件概率与实数 x 的值有关，是实数变量 x 的函数，即，称为随机变量 X 的分布函数备注：分布函数的定义域是实数集 R,X,X,b,a,a,用数学分析的方法研究随机变量成为可能！,随机变量 X 的分布函数,0,x2,X,x1,分布函数的性质,性质1：单调不减，即若，则必有 .,性质2：，且， .,性质3：在每一点处均为右连续，即有,等价于,例：设随机变量 X 的分布律为：求

15、X 的分布函数.,解：当时，,x,当时，,x,为不可能事件,，故, 故,等价于,当时，,当时，等价于,x,，故,例：设随机变量 X 的分布律为：求 X 的分布函数.,故,综上所述，分布函数为,0,1,2,1,于是,例：设随机变量 X 的分布律为：求 X 的分布函数.,分布律与分布函数,任意随机变量都可用分布函数来刻画其概率分布.对于离散型随机变量，可经由分布律得到分布函数.反过来，离散型随机变量的分布函数只在以正概率取值的点处发生跳跃间断，其跃度正是随机变量取该值的概率，于是对F(x) 的每个跳跃间断点xk，有,例：已知离散型随机变量的分布律为,分布函数是,试确定其中的a, b,

16、 c, d, e的值,解：由F () = 0，F (+ ) =1,得 c =0, e =1,由PX = 1=F (1)F (10),得 13/4= b,b =1/4,又由1/4+a+b=1 ，从而得 a =1/2,由PX = 0=F (0)F (00),得 1/2=3/4d ，,从而 d =1/4,即a =1/2, b =1/4, c =0, d =1/4, e =1,连续型随机变量,随机变量,离散型随机变量（只能取有限个或可列个数值）,非离散型随机变量,连续型随机变量（其可能取值布满某个区间）,其它,并称 y = f (x) 的图像为 X 的分布曲线,称被积函数 f (x)为X 的概率密度，

17、,连续型随机变量,定义：如果对于随机变量 X 的分布函数，存在非负函数，使得对于任意实数 x ，有,就称 X 为连续型随机变量，,y = f (x),面积,x0,备注：连续型随机变量的分布函数是连续函数,课本P.51附注1,概率密度的几何特征：概率密度的曲线总在x轴的上方，在整个实数轴有定义对任意连续型随机变量，概率密度与x轴所围成的面积总是1.,概率密度的性质(1),(1)(2),y = f (x),面积=1,(3) 对任意实数a、b，,(4) 若 f (x) 在点 x 处连续，则有 ,（当很小时）,概率密度的性质(2),f (x)不是 X 取值 x 时的概率, 但它可以反映 X 在

18、x 点附近取值的概率的大小.,对于连续型随机变量X 来说，它取任一指定的实数值 a 的概率均等于零，即 PX = a= 0 （课本P.53）,证明：因为,由此可得：不可能事件一定是零概率的事件，零概率事件不一定是不可能事件.必然事件一定是概率为1的事件，概率为1的事件不一定是必然事件.连续型随机变量取值在某个区间的概率，可以不特别考虑区间的端点，即,，所以,因为F (x) 是连续函数，,令，得PX = a= 0 ,例：向半径为R的圆形靶射击，假定不会发生脱靶的情况，弹着点落在以靶心O为中心、r（r R）为半径的圆形区域的概率与该区域的面积成正比.设随机变量 X 表示弹着点与靶心的距离，试求

19、 X 的分布函数及其密度函数.,解：,1.若 x 0, 则是不可能事件，于是,3. 若x R, 则是必然事件，于是,x,R,F(x),x,对分布函数求导，可得,综合得：,于是,可认为概率密度函数为,思考题,连续型随机变量的分布函数F(x)一定是连续函数连续型随机变量的概率密度 f(x) 是连续函数吗？0 f(x) 1成立吗？,称为区间(a, b)上的均匀分布，记作 .,最简单的连续型随机变量是概率密度在某个有限区间(a, b)上取正的常数值，其余区间上皆为零的随机变量，即,可以证明：,定义：设连续型随机变量 X 具有概率密度则称 X 在区间(a, b) 服从均匀分布，记作 .,均匀分布（U

20、niform Distribution）,相应的分布函数为,思考题,连续型随机变量的分布函数F(x)一定是连续函数连续型随机变量的概率密度 f(x)是连续函数吗？0 f(x) 1成立吗？答：连续型随机变量的概率密度 f(x)不一定是连续函数；0 f(x) 1一定成立,说明,类似地，我们可以定义区间a, b上的均匀分布；区间(a, b上的均匀分布；区间a, b)上的均匀分布,可以证明：若，设，则,均匀分布（Uniform Distribution）,结论：服从均匀分布的随机变量落在(a, b)的子区间内的概率只依赖于子区间的长度而与子区间的位置无关.,例：设随机变量 X 在2, 5上服从均匀

21、分布，现对 X 进行三次独立观测，试求至少有两次观测值大于3的概率.,X 的分布密度函数为,令A表示“X 的观测值大于3”,解：,即A =X 3.,从而有,令Y 表示3次独立观测中观测值大于3的次数,则,由于,定义：设连续型随机变量 X 具有概率密度，则称 X 服从参数为q ( 0) 的指数分布.,指数分布,相应的分布函数为,其中a = 1/q,某些元件或设备的寿命服从指数分布.例如无线电元件的寿命 , 电力设备的寿命, 动物的寿命等都服从指数分布.,应用与背景,指数分布的重要性质 :“无记忆性”.,对任意的正数s , t，考虑条件概率,如果将 X 看作某类动物的寿命，则上式可解释为某动物已

22、活到s岁（即X s），则它再活 t 年以上的概率与已经活过的岁数无关所以指数分布又称为“永远年青”的分布,指数分布的无记忆性,设 X 服从某种概率分布，若 ,则称这种概率分布具有无记忆性.,指数分布是连续型随机变量中唯一具有无记忆性的分布.,定义：设连续型随机变量 X 具有概率密度则称 X 服从正态分布，记作 .,正态分布（Normal Distribution）,相应的分布函数为,（其中和是常数，）,曲线关于 x = 对称.当 x = 时取得最大值在 x = 处有拐点，以 x 轴为渐近线.,对于任意的，有,x 离越远，f (x) 的值越小同样长度的区间，当区间离越远， X 落在这

23、个区间上的概率越小,正态分布的分布曲线,特别地，称为标准正态分布，其密度函数及分布函数常记作,固定，改变的值，则图形沿 x 轴平移，不改变其形状.固定，改变的值，则越小，图形越尖， X 落在附近的概率越大.,正态分布的分布曲线,标准正态分布的概率密度表示为,标准正态分布的分布函数表示为,标准正态分布,正态分布是最常见最重要的一种分布，例如测量误差; 人的生理特征尺寸如身高、体重等；正常情况下生产的产品尺寸：直径、长度、重量高度等都近似服从正态分布.,正态分布的应用与背景,正态分布的概率计算(1),设，则对任意的实数 x，有,原函数不是初等函数，因此概率不能通过积分算出.,锦囊1：

24、利用标准正态分布表.,解：,查表,例：已知，试求 .,锦囊2：利用 .,查表,正态分布的概率计算(2),设，则对任意的实数a、b，有,锦囊3：转换为标准正态分布.,若，则对 X 进行“标准化”的变换，可以证明 .,正态分布的概率计算(3),于是,3s法则,若，则,结论：尽管正态变量的取值范围是(, )，但它的值落在(m3s, m3s)内几乎是肯定的事这就是人们所说的“3s法则”.,课本P.60图2-16,上a 分位点,定义：设 X N(0, 1)，若 za 满足条件则称点 za 为标准正态分布的上a 分位点,结论： z1a = za ,5 随机变量的函数的分布,离散型连续型定理及

25、其应用,引言,在一些试验中，所关心的随机变量往往不能由直接测量得到，而它却是某个能直接测量的随机变量的函数，例如：我们关心圆轴截面的面积 A，虽然 A不能直接测量得到，但是可以通过测量圆轴截面的直径d 计算得到，其中,引言,设 X 是一个随机变量，再设Y = g(X) 是 X 的函数，则 Y 也是一个随机变量当 X 等于 x 时，Y 等于g(x)本节的任务是：已知随机变量 X 的概率分布以及Y = g(X)，其中g()是已知的连续函数，试求随机变量Y 的概率分布,一、离散型随机变量的函数的分布,设 X 是离散型随机变量，其分布律为Y = g(X) 是 X 的函数，则 Y 也是离散型随机变量它

26、的取值为其中,第一种情形如果 y1, y2, , yn , 两两不同，即函数 g() 是单射，则于是随机变量Y 的分布律为或第二种情形如果 y1, y2, , yn , 有相同的项，则把这些相同的项合并（看作是一项）；把相应的概率相加，即可得到随机变量Y 的分布律,设随机变量 X 具有以下的分布律试求 Y = (X1)2 的分布律.,解: Y 有可能取的值为 0，1，4.,且 Y = 0 对应于 ( X1)2 = 0，解得 X = 1，所以PY = 0 = PX = 1 = 0.1,例1：,同理，PY = 1 = PX = 0+PX = 2 = 0.3+ 0.4 = 0.7,PY = 4 =

27、 PX =1 = 0.2,所以，Y = (X1)2 的分布律为：,Y = (X1)2,例1（续）,设随机变量 X 具有概率密度：,试求 Y = 2X+8 的概率密度.,解：(1) 先求 Y = 2X+8 的分布函数 FY(y)：,例2 ：,例2（续）,(2) 对分布函数求导，得：,整理得 Y=2X+8 的概率密度为：,本例用到变限的定积分的求导公式,例2（续）,二、连续型随机变量的函数的分布,设 X 是一个连续型随机变量，其概率密度为 fX( x )，再设 Y = g( X ) 是 X 的函数假定 Y 也是一个连续型随机变量，求 Y = g( X ) 的概率密度 fY( y )解题思路：先求

28、出 Y = g( X ) 的分布函数 FY( y )：再利用概率密度与分布函数之间的关系求出 Y = g( X ) 的密度函数 fY( y )：,设随机变量 X 具有概率密度,求 Y = X 2 的概率密度.,解：(1) 先求 Y = X 2 的分布函数 FY(y)：,例3：,10 由于 Y = X2 0，故当 y 0 时， FY(y) = 0.,20 当 y 0 时，,例3（续）,(2) 对分布函数求导，得：,例如：设 XN(0,1)，其概率密度为：,则 Y = X 2 的概率密度为：,这时称 Y 服从自由度为1的c2分布,又设函数 g(x) 处处可导且恒有,（或恒有）,定理,设随机变量

29、 X 具有概率密度,则 Y = g(X) 是连续型随机变量，其概率密度为,其中 h(y) 是 g(x) 的反函数，即,（或）,即,设随机变量 X 具有概率密度,则 Y = g(X) 是连续型随机变量，其概率密度为,其中 h(y) 是 g(x) 的反函数，即,又设函数 g(x) 处处可导且恒有（或恒有）.,若随机变量 X 的密度函数 f (x) 在有限区间a, b以外等于零，只需假设在a, b上恒有（或恒有），,定理（续）,定理（续）,若随机变量 X 的密度函数 f (x) 在有限区间a, b以外等于零，则只需假设在a, b上恒有，此时,其中a = min g(a), g(b) ， b = max g(a), g(b) .,证明： X 的概率密度为,例4：,设随机变量 X N( m, s2 )，试证明X 的线性函数 Y = aX + b (a0) 也服从正态分布,，且,Y = g(X) 的反函数为,由定理的结论得：,例4 （续）,且有反函数以及,例 5：,试求电压 V 的概率密度.,解： v = g (q ) = A sin q 在恒有,设电压 V = A sin Q ，其中 A 是一个已知的正常数，相角 Q 是一个随机变量，且有,