浙大版概率论第二章.ppt
第二章随机变量及其分布,为了全面地研究随机试验的结果,揭示随机现象的统计规律性,我们将随机试验的结果与实数对应起来,将随机试验的结果数量化,从而引入随机变量的概念。,在随机试验完成时,人们常常不是关心试验结果本身,而是对与试验结果联系着的某个数感兴趣。,1 随机变量,例如,,连续掷一颗骰子两次,观察两次出现的点数.其样本空间为=(i,j),i,j=1,2,3,4,5,6.,我们关心的并不是第一次、第二次出现的点数,而是两次出现的点数之和是多少。,如果以 X 表示两次出现的点数之和,则对于每个样本点e=(i,j),X都有一个值与之对应,X=i+j,其可能的取值为2,3,4,5,6,7,8,9,10,11,12.,X取不同的值,代表着不同的随机事件。,又例如,在一批灯泡中任取一只,测试其寿命。,其样本空间为,如果用X表示灯泡的寿命值,则每一个灯泡的测试结果即每一个样本点都对应着 X 的一个值,且X取不同值或在不同范围内取值对应着不同的事件。如,X=1000(小时)表示“灯泡的寿命为1000小时”,(小时)表示“灯泡的寿命为小于或等于1500小时”。,在上述两例中,试验的结果本身就是数量性质的随机现象,可直接用某一变量来表示。但还有一些试验的结果不能直接用数量表示。,如考察一台机器在一年内是否发生故障这一随机现象,可能的结果共有两个,“完好”或“故障”。它们并不表示为数量;又如掷硬币的试验也一样。,对这些试验的结果,我们可以把它们数量化,如引入一个只取两个值(1或0)的变量X,用“X=1”表示机器完好这一随机事件,用“X=0”表示机器发生故障这一随机事件。,由此可知,随机试验的结果往往可以用一个变量来表示,变量取什么值由试验的结果决定,而试验结果又是样本空间的一个子集。为此,我们给出随机变量的定义。,定义:,设随机试验的样本空间为S=e。X=X(e)是定义在样本空间S上的实值单值函数。称 X=X(e)为随机变量。,随机变量一般用大写的字母如X,Y,Z 等表示,而随机变量的取值一般用小写的字母如x,y,z表示。,随机变量 X 常常简记为 r.v.X。,随机变量与一般的变量有着本质的区别,主要表现在:,取值的随机性-即X取什么值在试验之前无法知道.(但在试验之前X的所有可能取值是已知的),(2)取值的统计规律性-即X取某个值或在某个区间内取值的概率是完全确定的。,随机变量的引入,使我们能用其来描述各种随机现象,使我们有可能利用数学分析的方法对随机试验的结果进行深入广泛的研究和讨论。,在实际中,常用的随机变量有如下两类:,(1)离散型随机变量,这类随机变量的主要特征是它们可能取的值是有限个或无限可列个;,除了离散型随机变量以外的随机变量。,(2)非离散型随机变量,非离散型随机变量的情况比较复杂,在实用中,常遇到的是它的一个特殊情形-连续型随机变量。,这类随机变量的主要特征是它们可能的取值充满了某个有限或无限的区间。,2 离散型随机变量及其分布,离散型随机变量只可能取有限个或无限可列个值。为了全面地描述离散型随机变量,我们不仅要知道它可能取的值是哪一些,而且还要知道它取这些值的概率是多少。只有这样,才能确切地掌握离散型随机变量的统计规律性。,设离散型随机变量X所有可能的取值为,X取各个可能值的概率,即事件,的概率为,则称上述一系列等式为离散型随机变量X的概率函数或分布列。,离散型随机变量X的分布列也可以用表格形式给出:,由概率的定义可知,离散型随机变量的分布列具有以下两个性质:,例1:设一汽车在开往目的地的道路上需经过四组信号灯,每组信号灯以1/2的概率允许或禁止汽车通过。以X表示汽车首次停下时,它已通过的信号灯的组数(设各组信号灯的工作是相互独立的),求X的分布律。,解:,以p表示每组信号灯禁止汽车通过的概率,,以 p=1/2 代入并列成表格,得,易知:,例2:一袋中装有5只球,编号为1,2,3,4,5.在袋中同时取3只,以X表示取出的3只球中的最大号码,写出X的分布律。,解:,列成表格,得,下面介绍几个常用的离散型随机变量的分布,(一)两点分布(伯努利分布),如果离散型随机变量X只取a,b两个值,且其分布律为,则称离散型随机变量X服从两点分布(伯努利分布),或称离散型随机变量X的分布为两点分布。,当 a=0,b=1 时,又称(0 1)分布,(二)伯努利概型、二项分布,则称E为伯努利试验。,将E独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验,又称为n重伯努利概型。,若在n重伯努利试验中,事件A恰好发生 k 次事件记为Bk,k=0,1,n。,人们所关心的问题是:事件A恰好发生k次的事件Bk的概率是多少?,则易证:,则有,显然,,例1:某人进行射击,设每次射击的命中率为0.02,独立射击400次,试求至少击中两次的概率。,解:,将一次射击看成是一次试验(伯努利试验),则击中 k 次的事件Bk的概率为,所以所求概率为,例2:设一枚深水炸弹击沉一潜水艇的概率为 1/3,击伤的概率为 1/2,击不中的概率为 1/6。并设击伤两次也会导致潜水艇下沉。求施放4枚深水炸弹能击沉潜水艇的概率。,解:,击不沉潜水艇的概率 P=,所以施放4枚深水炸弹能击沉潜水艇的概率为,例3:某店内有4名售货员,据以往经验,每名售货员平均在一小时内只用秤15分钟。问该店应配置几台秤较为合理?,解:,观察一名售货员是否用秤作为一次试验(伯努利试验)。,则观察四名售货员在某一时刻是否都在用秤就是4重伯努利试验。,设某一时刻有k个售货员需用秤的事件为Bk,则,则,由此可见,配置2台秤较为合理。,如果离散型随机变量X可能取的值为0,1,2,n。且其分布律为,则称离散型随机变量X服从二项分布,记为,特别地,当 n=1 时,,即为(0-1)分布。,事件A至少出现m次的概率为,例:从某工厂的产品中进行重复抽样检查,共取出200件样品,经检查后发现其中共有4件次品。问能否相信该厂出次品的概率不超过0.005?,解:,先假设该厂出次品的概率为 0.005,那么200件样品中的次品数 X 服从,则200件样品中有4件次品的概率为,这说明,当该厂出次品的概率为0.005时,检查200件产品发现有4件次品的事件是小概率事件,因为小概率事件在一次试验中几乎不可能发生,但现在居然发生了。因此,我们有理由怀疑原来的假设有问题。即该厂出次品的概率不超过0.005不可信。,例:保险事业是最早使用概率的部门之一。保险公司为了估计企业的利润,常要计算各种概率,下面是典型问题之一:若一年中某类保险者里面每个人死亡的概率为0.005,现有10000个这类人参加人寿保险,试求在未来的一年中在这些保险者里面(1)有40人死亡的概率;(2)死亡人数不超过70人的概率。,用X表示在未来的一年中在这些保险者里面的死亡人数,(1),(2),解:,(三)泊松分布,如果离散型随机变量X可能取的值为0,1,2,且其分布律为,则称离散型随机变量X服从泊松分布,记为,易知,,=1.,在现实生活中有许多随机现象服从泊松分布,这种情况特别集中在两个领域中,一是社会生活中的服务领域,如电话交换台在一段时间内来到的呼叫数;公共汽车站在一段时间内来到的乘客数;某地区在一天内邮递遗失的信件数;某一医院在一天内的急诊人数;某一地区在一段时间间隔内发生的交通事故数等。另一领域是物理学,如在一段时间内由放射性物质发出的、落在某区域内的质点数;在一段时间内由显微镜观察得到的落在某区域内血球数等。它们都服从泊松分布。,3 分布函数,设X是一个随机变量,x是任意实数,函数,(2)F(x)是单调非降函数,称为X的分布函数。,分布函数具有以下几个性质:,4 连续型随机变量及其分布,如果对于随机变量 X,存在非负可积函数f(x),使对于任意 a b,则称X为连续型随机变量,其中函数f(x)称为X的分布密度函数或概率密度函数,简称分布密度或概率密度或密度。,连续型随机变量的概率密度函数 f(x)的性质:,都有,此式表明,f(x0)不是 X 取值 x0 的概率,而是 X 在 x0点概率分布的密集程度。由 f(x0)的大小可反映出 X 在 x0 点附近取值的概率大小。,在 f(x)的连续点 处,,对连续型随机变量X,有,因此,如A是不可能事件,则 P(A)=0,但反之不然。,另外有:,以后当我们提到一个随机变量X的“概率分布”时,当 X 是连续型随机变量时指的是它的概率密度,当 X 是离散型随机变量时指的是它的分布列。,例:设连续型随机变量X的概率密度为,解:,几个常用的连续型随机变量的分布,(一)均匀分布,如果连续型随机变量 X 的概率密度为,则称连续型随机变量X在区间 a,b 上服从均匀分布。,记为,在区间 a,b 上服从均匀分布的随机变量 X,具有下述意义的等可能性:即它落在区间 a,b 中任意等长度的子区间内的可能性是相同的。,例:已知连续型随机变量X在区间 0,4 上服从均匀分布。计算概率:,解:,X 的概率密度函数为,例:已知连续型随机变量X在区间 0,4 上服从均匀分布。计算概率:,解:,X 的概率密度函数为,(二)指数分布,如果连续型随机变量 X 的概率密度为,则称连续型随机变量 X 服从参数为 的指数分布。,在实际生活中,常用指数分布作为各种“寿命”分布的近似。如电子元件的寿命、动物的寿命等都假定服从指数分布。,服从指数分布的随机变量X具有一个很有趣的性质:无记忆性。,事实上,,无记忆性的理论解释:,已知某一元件已使用了s小时,则它总共能使用至少s+t小时的条件概率,与它从开始使用时算起它至少能使用t小时的概率相等。,具体的例题可以参见教材第67页例20。,(三)正态分布,正态分布是概率论中最重要的一种分布。一方面,正态分布是自然界最常见的一种分布,如测量时的误差、农作物的收获量、炮弹弹落点的分布、人的生理特征的尺寸(身高、体重等)、学生成绩的分布等都近似服从正态分布;一般说来,如影响某一数量指标的随机因素很多,而每个因素所起的作用又不太大,且它们是相互独立的,而影响又是可以相互叠加的,则这个指标服从正态分布。这一点可以用概率论中的中心极限定理加以证明。(在第四章里将会介绍),另一方面,正态分布具有很多良好的性质,它的分布具有“两头小,中间大”的特点,许多分布可用正态分布来近似;另外一些分布又可以用正态分布来导出。因此在理论研究中,正态分布又有十分重要的地位。,如果连续型随机变量 X 的概率密度为,则称连续型随机变量 X 服从参数为,的正态分布,或高斯(Gauss)分布,,记为,x,f(x),0,f(x)具有的性质:,X 的概率密度特别记为,标准正态分布。,例:,求概率,解:,令,则,定理:,证:,由此知,证毕,于是,,则,由于正态分布在概率计算中的重要性,再加上正态分布可化为标准正态分布来处理,因此人们已编制好了标准正态分布的分布函数值表(见书后附表2)。,例:将一温度调节器放置在贮存着某种液体的容器内。调节器整定在 液体的温度X(以 计)是一个随机变量,且 求X小于89的概率;(2)若要求保持液体的温度至少为80的概率不低于0.99,问d至少为多少?,解:,(1)所求概率为,(2)按题意需求d满足,即,亦即,例:设测量从某地到某一目标的距离时带有的随机误差X具有概率密度为,求误差的绝对值不超过30的概率;如果接连测三次,各次测量是相互独立的。求 至少有一次误差的绝对值不超过30的概率。,解:,(2)三次中至少有一次误差的绝对值不超过30的逆事件即三次的误差的绝对值都超过30。,故所求的概率为,随机变量的分布函数,在前面的讨论中,对于离散型随机变量和连续型随机变量,根据它们取值的规律性,我们分别用分布列和概率密度来刻画它们,没有统一的研究方法.可是,在许多实际问题的讨论中,对所遇到的随机变量(不管它是离散型还是连续型的),例如误差,元件的寿命T等,我们并不会对误差,寿命T=1251.3(h)的概率感兴趣,而是考虑误差落在某个区间的概率,寿命大于某个值的概率,因而我们现在考虑随机变量所取的值落在一个区间的概率:,我们要从这一概率的讨论中引入随机变量的分布函数的概念.,为此,现引入随机变量的分布函数的概念。,定义:,设X是一个随机变量,,x是任意实数,函数,称为X的分布函数。,分布函数具有以下几个性质:,(2)F(x)是 x 的不减函数,,(4)F(x)至多有可列个间断点,且在其间断点处是 右连续的。,对离散型随机变量X,若其分布律为,则其分布函数为,(5)对任意实数 a b,有,对连续型随机变量X,若其分布密度为 f(x),,则其分布函数为,且在 f(x)的连续点处,有,例1:设随机变量X的分布律为,求X的分布函数,并求,解:,即分布函数F(x)为,例3:一个靶子是半径为2米的圆盘,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能中靶,以X表示弹着点与圆心的距离。试求随机变量X的分布函数。,解:,故得 k=1/4,,于是,即分布函数F(x)为,易得,如果 X在区间 a,b 上服从均匀分布。,则其概率密度为,其分布函数为,如果连续型随机变量 X 服从参数为 的指数分布。,则其概率密度为,其分布函数为,则 X 的概率密度为,X 的分布函数为,如果,5 随机变量函数的分布,在分析和解决实际问题时,经常要用到由一些随机变量经过运算或变换而得到的某些变量-随机变量的函数,它们也是随机变量,也有其自身的分布。如我们能测量圆轴截面的直径d(r.v.),而关心的却是其截面积(也是r.v.),在本节中我们将论述如何由随机变量X的分布导出它的函数 Y=g(X)(g(.)是已知的连续函数)的分布。,(一)离散型随机变量函数的分布,例1:设随机变量X的分布律为,解:,由X的分布律可得,由此可得,(二)连续型随机变量函数的分布,例2:设随机变量X的概率密度为,求随机变量 Y=2X+8 的概率密度。,解:,例3:设随机变量X的概率密度为,求随机变量 的概率密度。,解:,