概率论与数理统计知识.ppt
第一节 随机变量,随机变量概念的产生引入随机变量的意义随机变量的分类,一、随机变量概念的产生,在实际问题中,随机试验的结果可以用数量来表示,由此就产生了随机变量的概念.,1、有些试验结果本身与数值有关(本身就是一个数).,例如,掷一颗骰子面上出现的点数;,四月份哈尔滨的最高温度;,每天进入一号楼的人数;,昆虫的产卵数;,2、在有些试验中,试验结果看来与数值无关,但我们可以引进一个变量来表示它的各种结果.也就是说,把试验结果数值化.,正如裁判员在运动场上不叫运动员的名字而叫号码一样,二者建立了一种对应关系.,这种对应关系在数学上理解为定义了一种实值单值函数.,e.,X(e),R,这种实值函数与在高等数学中大家接触到的函数不一样!,(1)它随试验结果的不同而取不同的值,因而在试验之前只知道它可能取值的范围,而不能预先肯定它将取哪个值.,(2)由于试验结果的出现具有一定的概率,于是这种实值函数取每个值和每个确定范围内的值也有一定的概率.,称这种定义在样本空间S上的实值单值函数X=X(e)为,随,量,机,变,简记为 r.v.,随机变量通常用大写字母X,Y,Z,W,N 等表示,有了随机变量,随机试验中的各种事件,就可以通过随机变量的关系式表达出来.,二、引入随机变量的意义,如:单位时间内某电话交换台收到的呼叫次数用X表示,它是一个随机变量.,事件收到不少于1次呼叫,没有收到呼叫,X 1,X=0,随机变量概念的产生是概率论发展史上的重大事件.引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究扩大为对随机变量及其取值规律的研究.,事件及事件概率,随机变量及其取值规律,我们将研究两类随机变量:,如“取到次品的个数”,“收到的呼叫数”等.,随机变量,离散型随机变量,连续型随机变量,例如,“电视机的寿命”,实际中常遇到的“测量误差”等.,三、随机变量的分类,这两种类型的随机变量因为都是随机变量,自然有很多相同或相似之处;但因其取值方式不同,又有其各自的特点.,学习时请注意它们各自的特点和描述方法.,解:分析,例1 一报童卖报,每份0.15元,其成本为0.10元.报馆每天给报童1000份报,并规定他不得把卖不出的报纸退回.设X为报童每天卖出的报纸份数,试将报童赔钱这一事件用随机变量的表达式表示.,当 0.15 X1000 0.1时,报童赔钱,故报童赔钱 X 666,四、小结,在这一节中我们介绍了随机变量及其分类.,第二节 离散型随机变量及其分布律,离散型随机变量分布律的定义离散型随机变量表示方法三种常见分布小结,从中任取3 个球,取到的白球数X是一个随机变量.,(1)X 可能取的值是0,1,2;,(2)取每个值的概率为:,看一个例子,一、离散型随机变量分布律的定义,定义1:某些随机变量X的所有可能取值是有限多个或可列无限多个,这种随机变量称为离散型随机变量.,其中(k=1,2,)满足:,(2),定义2:设 xk(k=1,2,)是离散型随机变量 X 所取的一切可能值,称,为离散型随机变量 X 的分布律.,用这两条性质判断一个函数是否是分布律,解:依据分布律的性质,a0,从中解得,即,例2,设随机变量X的分布律为:,k=0,1,2,试确定常数a.,二、离散型随机变量表示方法,(1)公式法,(2)列表法,例3 某篮球运动员投中篮圈概率是0.9,求他两次独立投篮投中次数X的概率分布.,解:X可取值为0,1,2;,PX=0=(0.1)(0.1)=0.01,PX=1=2(0.9)(0.1)=0.18,PX=2=(0.9)(0.9)=0.81,常常表示为:,这就是X的分布律.,例4 某射手连续向一目标射击,直到命中为止,已知他每发命中的概率是p,求所需射击发数X 的分布律.,解:显然,X 可能取的值是1,2,,,PX=1=P(A1)=p,为计算 PX=k,k=1,2,,,Ak=第k发命中,k=1,2,,,设,于是,可见,这就是求所需射击发数X的分布律.,三、三种常见分布,1、(0-1)分布:(也称两点分布),随机变量X只可能取0与1两个值,其分布律为:,看一个试验 将一枚均匀骰子抛掷3次.,X的分布律是:,2.伯努利试验和二项分布,令X 表示3次中出现“4”点的次数,掷骰子:“掷出4点”,“未掷出4点”,抽验产品:“是正品”,“是次品”,一般地,设在一次试验E中我们只考虑两个互逆的结果:A 或.,这样的试验E称为伯努利试验.,“重复”是指这 n 次试验中P(A)=p 保持不变.,将伯努利试验E独立地重复地进行n次,则称这一串重复的独立试验为n重伯努利试验.,“独立”是指各 次试验的结果互不影响.,用X表示n重伯努利试验中事件A发生的次数,则,易证:,(1),称 r.v X 服从参数为n和p的二项分布,记作,Xb(n,p),(2),例5 已知100个产品中有5个次品,现从中有放回地取3次,每次任取1个,求在所取的3个中恰有2个次品的概率.,解:因为这是有放回地取3次,因此这3 次试验的条件完全相同且独立,它是贝努里试验.,依题意,每次试验取到次品的概率为0.05.,设X为所取的3个中的次品数,,于是,所求概率为:,则,X b(3,0.05),,若将本例中的“有放回”改为”无放回”,那么各次试验条件就不同了,此试验就不是伯努利试验.此时,只能用古典概型求解.,请注意:,伯努利试验对试验结果没有等可能的要求,但有下述要求:,(1)每次试验条件相同;,二项分布描述的是n重伯努利试验中事件 A 出现的次数 X 的分布律.,(2)每次试验只考虑两个互逆结果 A 或,,(3)各次试验相互独立.,可以简单地说,,且 P(A)=p,;,3.泊松分布,设随机变量X所有可能取的值为0,1,2,且概率分布为:,其中 0 是常数,则称 X 服从参数为 的泊松分布,记作X().,Poisson定理说明若X B(n,p),则当n 较大,p 较小,而 适中,则可以用近似公式,泊松分布与二项分布的关系,证,记,例6 一家商店采用科学管理,由该商店过去的销售记录知道,某种商品每月的销售数可以用参数=5的泊松分布来描述,为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件?,解:,设该商品每月的销售数为X,已知X服从参数=5的泊松分布.,设商店在月底应进某种商品m件,进货数,销售数,查泊松分布表得,PXm 0.05,也即,于是得 m+1=10,m=9件,或,由题意,多少个产品?,得 n+1=6,n=5,故每箱至少应装105个产品,才能符合要求.,应用Poisson定理,在实际计算中,当 n 20,p 0.05时,可用上述公式近似计算;而当 n 100,np 10 时,精度更好,0 0.349 0.358 0.369 0.366 0.368,1 0.305 0.377 0.372 0.370 0.368,2 0.194 0.189 0.186 0.185 0.184,3 0.057 0.060 0.060 0.061 0.061,4 0.011 0.013 0.014 0.015 0.015,对于离散型随机变量,如果知道了它的分布律,也就知道了该随机变量取值的概率规律.在这个意义上,我们说,这一节,我们介绍了离散型随机变量及其分布律,并给出两点分布、二项分布、泊松分布三种重要离散型随机变量.,离散型随机变量由它的分布律唯一确定.,四、小结,第三节 随机变量的分布函数,随机变量分布函数的定义分布函数的性质小结,一、分布函数的定义,(1)在分布函数的定义中,X是随机变量,x是参变量.,(2)F(x)是r.v X取值不大于 x 的概率.,(3)对任意实数 x1x2,随机点落在区间(x1,x2 内的概率为:,P x1X x2,因此,只要知道了随机变量X的分布函数,它的统计特性就可以得到全面的描述.,=P X x2-P X x1,=F(x2)-F(x1),请注意:,分布函数是一个普通的函数,正是通过它,我们可以用高等数学的工具来研究随机变量.,当 x0 时,X x=,故 F(x)=0,例1,设 随机变量 X 的分布律为,当 0 x 1 时,F(x)=PX x=P(X=0)=,求 X 的分布函数 F(x).,当 1 x 2 时,F(x)=PX=0+PX=1=+=,当 x 2 时,F(x)=PX=0+PX=1+PX=2=1,故,注意右连续,下面我们从图形上来看一下.,的分布函数图,设离散型 r.v X 的分布律是,P X=xk=pk,k=1,2,3,F(x)=P(X x)=,即F(x)是 X 取 的诸值 xk 的概率之和.,一般地,则其分布函数,二、分布函数的性质,(1),如果一个函数具有上述性质,则一定是某个r.v X 的分布函数.也就是说,性质(1)-(3)是鉴别一个函数是否是某 r.v 的分布函数的充分必要条件.,(3)F(x)右连续,即,(2),试说明F(x)能否是某个r.v 的分布函数.,例2 设有函数 F(x),解 注意到函数 F(x)在 上下降,不满足性质(1),故F(x)不能是分布函数.,不满足性质(2),可见F(x)也不能是r.v 的分布函数.,或者,解 设 F(x)为 X 的分布函数,,当 x 0 时,F(x)=P(X x)=0,0,a,当 x a 时,F(x)=1,例3 在区间 0,a 上任意投掷一个质点,以 X 表示这个质点的坐标.设这个质点落在 0,a中意小区间内的概率与这个小区间的长度成正比,试求 X 的分布函数.,当 0 x a 时,P(0 X x)=kx(k为常数),F(x)=P(X x)=P(X0)+P(0 X x),=x/a,故,这就是在区间 0,a上服从均匀分布的连续型随机变量的分布函数.,三、小结,在这一节中,我们学习了随机变量的分布函数,以及分布函数的性质.,练习题,F(x)=P(X x),故,第四节 连续型随机变量及其概率密度,连续型随机变量及其概率密度的定义概率密度的性质三种重要的连续型随机变量小结,连续型随机变量X所有可能取值充满一个区间,对这种类型的随机变量,不能象离散型随机变量那样,以指定它取每个值概率的方式,去给出其概率分布,而是通过给出所谓“概率密度函数”的方式.,下面我们就来介绍对连续型随机变量的描述方法.,则称 X为连续型随机变量,称 f(x)为 X 的概率密度函数,简称为概率密度.,一、连续型随机变量及其概率密度的定义,有,连续型随机变量的分布函数在 上连续,二、概率密度的性质,1 o,2 o,利用概率密度可确定随机点落在某个范围内的概率,对于任意实数 x1,x2,(x1 x2),若 f(x)在点 x 处连续,则有,故 X的密度 f(x)在 x 这一点的值,恰好是X 落在区间 上的概率与区间长度 之比的极限.这里,如果把概率理解为质量,f(x)相当于线密度.,若 x 是 f(x)的连续点,则,对 f(x)的进一步理解:,若不计高阶无穷小,有,表示随机变量 X 取值于 的概率近似等于.,要注意的是,密度函数 f(x)在某点处a的高度,并不反映X取值的概率.但是,这个高度越大,则X取a附近的值的概率就越大.也可以说,在某点密度曲线的高度反映了概率集中在该点附近的程度.,a,(1)连续型r.v取任一指定实数值a 的概率均为0.即,这是因为,请注意:,当 时,得到,(2)对连续型 r.v X,有,由P(B)=1,不能推出 B=S,由P(A)=0,不能推出,1.均匀分布,则称X在区间(a,b)上服从均匀分布,,X U(a,b),三、三种重要的连续型随机变量,若 r.v X的概率密度为:,记作,公交线路上两辆公共汽车前后通过某汽车停车站的时间,即乘客的候车时间等.,均匀分布常见于下列情形:,如在数值计算中,由于四舍五 入,小数点后某一位小数引入的误差;,例2 某公共汽车站从上午7时起,每15分钟来一班车,即 7:00,7:15,7:30,7:45 等时刻有汽车到达此站,如果乘客到达此站时间 X 是7:00 到 7:30 之间的均匀随机变量,试求他候车时间少于5 分钟的概率.,解,依题意,X U(0,30),以7:00为起点0,以分为单位,为使候车时间X少于 5 分钟,乘客必须在 7:10 到 7:15 之间,或在7:25 到 7:30 之间到达车站.,所求概率为:,即乘客候车时间少于5 分钟的概率是1/3.,指数分布常用于可靠性统计研究中,如元件的寿命.,2.指数分布,若 r.v X具有概率密度,为常数,则称 X 服从参数为 的指数分布.,若X 服从参数为 的指数分布,则其分布函数为,事实上,当 时,当 时,3.正态分布,若连续型 r.v X 的概率密度为,记作,其中 和(0)都是常数,则称X服从参数为 和 的正态分布或高斯分布.,事实上,则有,曲线 关于 轴对称;,x=为 f(x)的两个拐点的横坐标;,当x 时,f(x)0.,f(x)以 x 轴为渐近线,根据对密度函数的分析,也可初步画出正态分布的概率密度曲线图.,决定了图形的中心位置,决定了图形中峰的陡峭程度.,正态分布 的图形特点,正态分布 的分布函数,正态分布由它的两个参数和唯一确定,当和不同时,是不同的正态分布。,标准正态分布,下面我们介绍一种最重要的正态分布,的正态分布称为标准正态分布.,其密度函数和分布函数常用 和 表示:,标准正态分布,的性质:,标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.,定理1,证,Z 的分布函数为,则有,根据定理1,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.,于是,书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表.,正态分布表,当 x 0 时,表中给的是 x 0 时,(x)的值.,若,若 XN(0,1),由标准正态分布的查表计算可以求得,,这说明,X的取值几乎全部集中在-3,3区间内,超出这个范围的可能性仅占不到0.3%.,当XN(0,1)时,,P(|X|1)=2(1)-1=0.6826,P(|X|2)=2(2)-1=0.9544,P(|X|3)=2(3)-1=0.9974,3 准则,将上述结论推广到一般的正态分布,这在统计学上称作“3 准则”.,N(0,1),时,,标准正态分布的上 分位点,设,若数 满足条件,解,P(X h)0.01,或 P(X h)0.99,,下面我们来求满足上式的最小的h.,看一个应用正态分布的例子:,例 公共汽车车门的高度是按男子与车门顶头碰头机会在 0.01 以下来设计的.设男子身高XN(170,62),问车门高度应如何确定?,设车门高度为h cm,按设计要求,因为 XN(170,62),故 P(X h)=,查表得(2.33)=0.99010.99,因而=2.33,即 h=170+13.98 184,设计车门高度为184厘米时,可使男子与车门碰头机会不超过0.01.,所以.,这一节,我们介绍了连续型随机变量及三种重要分布.即均匀分布、指数分布、正态分布.其中正态分布的应用极为广泛,在本课程中我们一直要和它打交道.,后面第五章中,我们还将介绍为什么这么多随机现象都近似服从正态分布.,四、小结,练习题,故,第五节 随机变量的函数的分布,问题的提出离散型随机变量的函数的分布连续型随机变量的函数的分布小结,一、问题的提出,在实际中,人们常常对随机变量的函数更感兴趣.,求截面面积 A=的分布.,比如,已知圆轴截面直径 d 的分布,,在比如,已知 t=t0 时刻噪声电压 V 的分布,,求功率 W=V2/R(R 为电阻)的分布等.,设随机变量 X 的分布已知,Y=g(X)(设g 是连续函数),如何由 X 的分布求出 Y 的分布?,下面进行讨论.,这个问题无论在实践中还是在理论上都是重要的.,二、离散型随机变量函数的分布,解:当 X 取值 1,2,5 时,Y 取对应值 5,7,13,,而且X取某值与Y取其对应值是两个同时发生的事件,两者具有相同的概率.,故,如果g(x k)中有一些是相同的,把它们作适当并项即可.,一般地,若X是离散型 r.v,X 的分布律为,则 Y=X2 的分布律为:,三、连续型随机变量函数的分布,解 设Y的分布函数为 FY(y),,FY(y)=P Y y=P(2X+8 y),=P X=FX(),于是Y 的密度函数,故,注意到 0 x 4 时,,即 8 y 16 时,,此时,Y=2X+8,当 y0 时,注意到 Y=X2 0,故当 y 0 时,.,解 设Y 和 X 的分布函数分别为 和,,若,则 Y=X2 的概率密度为:,求导可得,从上述两例中可以看到,在求P(Yy)的过程中,关键的一步是设法从 g(X)y 中解出X,从而得到与 g(X)y 等价的X 的不等式.,用 代替 X2 y,这样做是为了利用已知的 X的分布,从而求出相应的概率.,这是求r.v的函数的分布的一种常用方法.,例4 设随机变量X的概率密度为,求 Y=sinX 的概率密度.,当 y 0 时,当 y 1时,故,解,注意到,解 当 0 y 1 时,例4 设随机变量 X 的概率密度为,求 Y=sinX 的概率密度.,=P(0 X arcsiny)+P(-arcsiny X),而,求导得:,例5 已知随机变量X的分布函数F(x)是严格单调的连续函数,证明Y=F(X)服从0,1上的均匀分布.,又由于X的分布函数F是严格递增的连续函数,其反函数 F-1 存在且严格递增.,证明 设 Y 的分布函数是 G(y),于是,对 y 1,G(y)=1;,对 y 0,G(y)=0;,由于,对0y1,G(y)=P(Y y),=P(F(X)y),=P(X(y),=F(y)=y,即Y的分布函数是,求导得Y的密度函数,可见,Y 在0,1上服从的均匀分布.,下面给出一个定理,在满足定理条件时可直接用它求出随机变量函数的概率密度.,其中,,x=h(y)是 y=g(x)的反函数.,定理 设 X是一个取值于区间a,b,具有概率密度 f(x)的连续型 r.v,又设y=g(x)处处可导,且对于任意x,恒有 或恒有,则Y=g(X)是一个连续型r.v,它的概率密度为,解,四、小结,对于连续型随机变量,在求 Y=g(X)的分布时,关键的一步是把事件 g(X)y 转化为X在一定范围内取值的形式,从而可以利用 X 的分布来求 P g(X)y.,这一节我们介绍了随机变量函数的分布.,练习题,