大连理工大学概率统计复习ppt课件.ppt
数理统计学,教材:数理统计学,大连理工大学出版社,滕素珍,冯敬海编,概率论与数理统计,复 习Email: dlut_Password: dlutstat,背 景,概率统计是研究什么的?,客观世界中发生的现象,确定性的在一定条件下必然发生的现象1)抛出物体会下落。2)充满气的气球受到挤压会破。随机性的在一定条件下,具有多种可能的结果,但事先又不能预知确切的结果1)拋掷一枚硬币,其结果可能是国徽面朝上,也可能是国徽面朝下。2)足球比赛,其结果可能是胜、平、负。3)投掷一个骰子,其结果有6种,即可能出现1,2,3,4,5,6点。4)股市的变化。5)人的寿命。,经典的数学理论如微积分、微分方程等都是研究确定性现象的有力的数学工具。对于某些随机现象,虽然对个别试验来说,无法预言其结果,但在相同的条件下,进行大量的重复试验或观察时,却又呈现出某些规律性(如拋掷硬币)。随着社会生产与科学技术的发展,研究随机现象的统计规律性的理论和方法获得了迅速的发展,形成了数学的一个重要分支,并被广泛应用于工业、农业、军事、科技、经济等领域。,概率统计研究和揭示随机现象统计规律性的学科 应用范围广泛。例如: 气象预报、水文预报、地震预报、产品质量检验、产品的可靠性评估、寿命预测、生物统计、卫生统计、保险、金融等各领域。 经典数学与概率论与数理统计是相辅相成,互相渗透的。,第一章 概率论的基本概念,随机事件及其运算频率与概率,1.1随机试验、样本空间、随机事件,一、随机试验(简称“试验”)随机试验的特点 (1)试验可以在相同条件下重复进行;(2)每次试验的可能结果不止一个,并且事先可以知道试验所有可能的结果;(3)进行一次试验之前不能确定出现的是哪个结果;满足上述特点的试验称为随机试验,一般记为E。,E1:拋掷一枚质地均匀的硬币,观察正面和反面出现的情况;E2:掷一颗质地均匀的骰子,观察其出现的点数;E3:记录某网站一分钟内受到的点击次数;E4:在某高楼上任意掷下一朵玫瑰花,观察其在地面上的位置;E5:从某品牌的电视机中任取一台,观察其使用寿命。,随机试验的例子,二、样本空间,1、样本空间:由随机试验的一切可能的结果组成的一个集合称为试验E的样本空间,记为S或; 2、样本点:试验的每一个可能的结果(或样本空间的元素)称为一个样本点,记为e。,三、随机事件,例 将一颗骰子连掷两次,依次记录所得点数,则所有可能出现的结果即该试验的样本空间是:,其中有36个可能的结果,即36个样本点。每做一次试验,这36个样本点必有一个且仅有一个出现。在很多时候,我们是对样本空间中某些子集感兴趣,称之为事件。如事件A:两次投掷所得点数之和为8。事件B:两次投掷所得点数相等。A发生(2,6),(3,5),(4,4),(5,3),(6,2)记作:A=(2,6),(3,5),(4,4),(5,3),(6,2),A是S的子集。类似地,B=(1,1),(2,2),(6,6),B也是S的子集。,1、随机事件随机试验E的样本空间S的子集为E的随机事件,简称事件。通常用大写字母A、B、C表示。 任何事件均可表示为样本空间的某个子集.称事件A发生当且仅当试验的结果是子集A中的元素。当一个事件仅包含一个样本点时,称为基本事件 2、两个特殊事件 必然事件S 包含所有的样本点,每次试验它总是发生 不可能事件 空集,不包含任何样本点,每次试验总是不发生,1.事件的包含与相等A中的样本点一定属于B,记为AB,也称A是B的子事件。A与B两个事件相等:AB AB且BA。,四、事件之间的关系,2.和事件 :“事件A与B至少有一个发生”,记作AB,2n个事件A1, A2, An至少有一个发生,记作,2” 可列个事件A1, A2, An 至少有一个发生,记作,3.积事件 :A与B同时发生,记作 ABAB,3n个事件A1, A2, An同时发生,记作,3”可列个事件A1, A2, An , 同时发生,记作,4.差事件 :AB称为A与B的差事件,表示事件A发生而B不发生,它是由属于A而不属于B的样本点所构成的事件。,5.互斥的事件 :AB= ,指事件A与B不能同时发生。又称A与B互不相容。,基本事件是两两互不相容的,6. 互逆的事件 AB , 且AB,A与B互逆:事件A与B既不能同时发生,又不能同时不发生。即在每次试验中,A与B有且仅有一个发生。,五、事件的运算,1、交换律:ABBA,ABBA2、结合律:(AB)CA(BC), (AB)CA(BC)3、分配律:(AB)C(AC)(BC), (AB)C(AC)(BC)4、对偶(De Morgan)律:,1.2 频率与概率,一、频率定义1.设在相同的条件下,进行了n次试验。若随机事件A在这n次试验中发生了nA次,则比值,称为事件A在这n次试验中发生的频率,记作fn(A),即,fn(A)=,实践证明:当试验次数n增大时, 随机事件A的频率fn(A) 逐渐趋向一个稳定值。这是随机现象固有的性质,即频率的稳定性,也就是我们所说的随机现象的统计规律性。,二、概率,从直观上来看,事件A的概率是指事件A发生的可能性,1、概率的统计定义,设随机事件A在n次重复试验中发生的次数为nA,若当试验次数n很大时,频率nA/n稳定地在某一数值p的附近摆动,且随着试验次数n的增加,其摆动的幅度越来越小,则称数p为随机事件A的概率,记为P(A)=p。由定义,显然有0P(A)1, P(S)=1,P()=0。,设E是随机试验,S是它的样本空间,对于E的每一个事件A,赋予一个实数P(A)与之对应,如果集合函数P()具有如下性质:非负性:对任意一个事件A,均有P(A)0 ;规范性:P(S)=1;可列可加性:若A1,A2,An,是两两互不相容的事件序列,即AiAj=(ij, i, j=1,2,),有P(A1A2An)= P(A1)+ P(A2) + P(An)+则称P(A)为事件A的概率。,2、概率的公理化定义,3、概率的性质,不可能事件的概率为零,即P()=0;概率具有有限可加性,即若事件A1,A2,An两两互不相容,则必有P(A1A2An)= P(A1)+ P(A2) + P(An)设A,B是两个事件,则P(A-B)=P(A)-P(AB)特别地,若AB,则AB=B,有P(A-B)=P(A)-P(B),且P(A)P(B),此性质称为单调不减性。,互补性 对任一事件A,有,加法公式 对任意两个事件A,B,有P(AB)=P(A)+P(B) - P(AB)可推广。,可分性 对任意两事件A,B,有,二、条件概率,在事件B发生的条件下,事件A发生的条件概率,记为,乘法法则,全概率公式:,贝叶斯公式:,二、事件的独立性,两个事件的独立,第二章 随机变量及其分布,随机变量离散型随机变量随机变量的分布函数连续型随机变量随机变量函数的分布,用实数来表示随机试验的各种结果,即引入随机变量的概念。这样,不仅可以更全面揭示随机试验的客观存在的统计规律性,而且可使我们用(高等数学)微积分的方法来讨论随机试验。,在随机试验中,如果把试验中观察的对象与实数对应起来,即建立对应关系X,使其对试验的每个结果e,都有一个实数X(e)与之对应,,试验的结果e,实数X(e),对应关系X,X的取值随着试验的重复而不同, X是一个变量,且在每次试验中,究竟取什么值事先无法预知,也就是说X是一个随机取值的变量。由此,我们称X为随机变量。,关于随机变量(及向量)的研究,是概率论的中心内容对于一个随机试验,我们所关心的往往是与所研究的特定问题有关的某个或某些量,而这些量就是随机变量随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点,2.1随机变量的概念,定义2.1 设E是一个随机试验,S=e是试验E的样本空间,如果对于S中的每一个样本点e,有一实数X(e)与之对应,这个定义在S上的实值函数X(e)就称为随机变量。,由定义可知,随机变量X(e)是以样本空间S为定义域的一个单值实值函数。,有关随机变量定义的几点说明:(1)随机变量X是样本点e的函数,常用大写字母X、Y、Z 或小写希腊字母、 等表示。(2)随机变量X随着试验结果而取不同的值,因而在试验结束之前,只知道其可能的取值范围,而事先不能预知它取什么值,对任意实数区间(a,b),“aXb”的概率是确定的;(3)随机变量X(e)的值域即为其一切可能取值的全体构成的集合;(4)引入随机变量后,就可以用随机变量描述事件,而且事件的讨论,可以纳入随机变量的讨论中。,随机变量的分类:随机变量,2.2 离散型随机变量,一、 离散型随机变量及其分布律,1、离散型随机变量的概念,若某个随机变量的所有可能取值是有限多个或可列无限多个,则称这个随机变量为离散型随机变量。 讨论随机变量的目的是要研究其统计规律性,要知道离散型随机变量X的统计规律必须且只须知道X的所有可能取值以及X取每一个可能值的概率。,2、分布律,设离散型随机变量X,其所有可能取值为x1, x2, , xk, , 且取这些值的概率依次为p1, p2, , pk, , 即,则称P(X=xk)=pk(k=1, 2, ) 为随机变量X 的概率分布律(列),简称分布律。分布律可用表格形式表示为:,P(X=xk)=pk, (k=1, 2, )满足(1)P(X=xk)=pk0,(k=1, 2, )(2),二、几个常用的离散型随机变量的概率分布律,1、 (0-1)分布 若随机变量X的分布律为: P(X=k)=pk(1-p)1-k, k=0,1,(0p1)则称X服从以p为参数的0-1分布,记为XB(1,p)。,0-1分布的分布律也可写成,即随机变量只可能取0,1两个值,且取1的概率为p,取0的概率为1-p (0p1),亦即P(X=1)=p, P(X=0)=1-p。,若某个随机试验的结果只有两个,如产品是否合格,试验是否成功,掷硬币是否出现正面等等,它们的样本空间为S=e1,e2,我们总能定义一个服从0-1分布的随机变量,即它们都可用0-1分布来描述,只不过对不同的问题参数p的值不同而已。,2、二项分布,(1)贝努里(Bernoulli)试验模型。 设随机试验满足:1在相同条件下进行n次重复试验;2每次试验只有两种可能结果,A发生或A不发生;3在每次试验中,A发生的概率均一样,即P(A)=p;4各次试验是相互独立的,则称这种试验为贝努里概型或n重贝努里试验。 在n重贝努里试验中,人们感兴趣的是事件A发生的次数。,以随机变量X表示n次试验中A发生的次数,X可能取值为0,1,2,3,n。设每次试验中A发生的概率为p,,发生的概率为1-p=q。,(X=k)表示事件“n重贝努里试验中A出现k次”,即,这里每一项表示k次试验中出现A,而另外n-k次试验中出现,,且每一项两两互不相容,一共有Cnk项。,由4独立性可知每一项的概率均为pk(1-p)1-k,因此,此为n重贝努里试验中A出现k次的概率计算公式,记为,(2)二项分布定义,若随机变量X具有概率分布律,其中p+q=1,则称随机变量X服从以n,p为参数的二项分布,记为XB(n,p) (或称贝努里分布)。,特别地,当n=1时P(X=k)=pkq1-k(k=0,1)即为0-1分布。,3、泊松(Poisson)分布,若随机变量X所有可能取值为0,1,2,,且,其中0是常数,则称X服从参数为的泊松分布,记为XP()。,4、几何分布,设随机变量X的可能取值是1,2,3,且P(X=k)=(1-p)k-1p=qk-1p,k=1,2,3, ,其中0p1是参数,则称随机变量X服从参数p为的几何分布。,几何分布背景:,随机试验的可能结果只有2种,A与,试验进行到A发生为止的概率P(X=k),即k次试验,前k-1次失败,第k次成功。,2.3 随机变量的分布函数,离散型随机变量,我们可用分布律来完整地描述。而对于非离散型随机变量,由于其取值不可能一个一个列举出来,而且它们取某个值的概率可能是零。例如:灯泡的寿命 由于许多随机变量的概率分布情况不能以其取某个值的概率来表示,因此我们往往关心随机变量X取值落在某区间 (a,b上的概率(ab)。 由于aXb=Xb-Xa,(ab),因此对任意xR,只要知道事件Xx发生的概率,则X落在(a,b的概率就立刻可得。因此我们用P(Xx)来讨论随机变量X的概率分布情况。P(Xx):“随机变量X取值不超过x的概率”。,定义 设X是一随机变量,X是任意实数,则实值函数F(x)P Xx, x(-,+)称为随机变量X的分布函数。 有了分布函数定义,任意x1,x2R, x1x2,随机变量X落在(x1,x2里的概率可用分布函数来计算:P x1X x2PX x2PXx1 F(x2)F(x1).,在这个意义上可以说,分布函数完整地描述了随机变量的统计规律性,或者说,分布函数完整地表示了随机变量的概率分布情况。,一、分布函数的概念,二、分布函数的性质,1、单调不减性:若x1x2, 则F(x1)F(x2); 2、归一 性:对任意实数x,0F(x)1,且,3、右连续性:对任意实数x,,反之,具有上述三个性质的实函数,必是某个随机变量的分布函数。故该三个性质是分布函数的充分必要性质。,2.4 连续型随机变量,1、概念 设F(X)是随机变量X的分布函数,若存在非负可积函数f(x),(-x+),使对一切实数x,均有,则称X为连续型随机变量,且称f(x)为随机变量X的概率密度函数,简称密度。常记为X f(x) , (-x+),一、连续型随机变量及其概率密度函数,X连续型随机变量,则X的分布函数必是连续函数。,(1) 非负性 f(x)0,(-x+);,2、密度函数的性质,(2),(3) 归一性,事实上,(4) 若f(x)在x0处连续,则有,(5) f(x)在x0处连续,且h充分小时,有,f(x)称为概率密度的原由。,密度函数的几何意义为,即 y=f(x),x=a,x=b,x轴所围成的曲边梯形面积。,二、几个常用的连续型随机变量的分布,若随机变量X具有概率密度函数,1. 均匀分布,则称X在a, b上服从均匀分布,记作XUa, b。,正态分布是实践中应用最为广泛,在理论上 研究最多的分布之一,故它在概率统计中占有特 别重要的地位。,2、正态分布,A,B,A,B间真实距离为,测量值为X。X的概率密度应该是什么形态?,则称X服从参数为 ,2的正态分布,记为XN(, 2)。,若随机变量X的概率密度函数为,(其中 ,为实数,0),f(x)的图像为,(1) 单峰对称 密度曲线关于直线x=对称,即f( +x)=f( -x),x(-,+),正态分布密度函数f(x)的性质,(2)x= 时, f(x)取得最大值f()= ;,(3)x= 处有拐点;,(4)的大小直接影响概率的分布,越大,曲线越平坦,越小,曲线越陡峭。(如图),正态分布也称为高斯(Gauss)分布,(5)曲线f(x)以x轴为渐近线。,正态分布随机变量X的分布函数为,其图像为,O x,F(x),1,标准正态分布 当参数0,21时,称随机变量X服从标准正态分布,记作XN(0, 1)。,分布函数表示为,其密度函数表示为,O x,1,(x),标准正态分布的密度函数与分布函数的图像分别为,可得,正态随机变量的3原则:设XN(,2),在工程应用中,通常认为 ,忽略 的值。质量控制中,常用标准指标值3作两条线,当生产过程的指标观察值落在两线之外时发出警报,表明生产出现异常。,在一次试验中,正态分布的随机变量X落在以为中心,3为半径的区间(-3, +3)内的概率相当大(0.9974),即X几乎必然落在上述区间内,或者说在一般情形下,X在一次试验中落在(-3, +3)以外的概率可以忽略不计。,3、指数分布,设连续型随机变量X具有概率密度,则称X服从参数为0的指数分布。其分布函数为,指数分布的另一种表示形式,则称X服从参数为0的指数分布。其分布函数为,2.5 随机变量函数的分布,Y=g(X),如sin(X),离散型随机变量:总结Y不同取值对应的X的概率,连续型随机变量:确定Y的取值范围;列出Y的分布函数(化作X落在一定范围的积分);求导得Y的密度函数,第三章 多维随机变量及其分布,二维随机变量随机变量的独立性,3.1 二维随机变量及其分布,1、二维随机变量 设S=e是随机试验E的样本空间,X=X(e),Y=Y(e)是定义在S上的随机变量,则由它们构成的一个二维向量(X,Y)称为二维随机变量或二维随机向量。 二维随机变量(X,Y)的性质不仅与X及Y有关,而且还依赖于这两个随机变量的相互关系。因此,单独讨论X和Y的性质是不够的,需要把(X,Y)作为一个整体来讨论。,一、二维随机变量及其分布函数,定义3.1 设(X,Y)是二维随机变量,二元实值函数F(x,y)=P(XxYy)=P(Xx,Yy) x(-,+),y(-,+)称为二维随机变量(X,Y)的分布函数,或称X与Y的联合分布函数。即F(x,y)为事件Xx与Yy同时发生的概率。,2、二维随机变量的联合分布函数,几何意义:若把二维随机变量(X,Y)看成平面上随机点的坐标,则分布函数F(x,y)在(x,y)处的函数值F(x0,y0)就表示随机点(X,Y)落在区域 -X x0, -Y y0中的概率。如图阴影部分:,(x0,y0),x,y,O,对于(x1, y1), (x2, y2)R2, (x1 x2, y1y2 ),则随机点(X,Y)落在矩形区域x1X x2,y1Yy2内的概率可用分布函数表示为P(x1X x2,y1Yy2)F(x2, y2)F(x1, y2) F (x2, y1)F (x1, y1),(x1, y1),(x2, y2),O x1 x2 x,y1,y2,y,分布函数F(x, y)具有如下性质:,(1)对任意(x, y) R2 , 0 F(x, y) 1。(2)F(x, y)是变量x或y的非降函数,即 对任意yR, 当x1x2时,F(x1,y)F(x2,y); 对任意xR, 当y1y2时,F(x,y1)F(x,y2)。(3),(4)函数F(x,y)关于x是右连续的,关于y也是右连续的,即对任意xR,yR,有,(5)对于任意(x1, y1),(x2, y2)R2,(x1x2,y1y2),F(x2,y2)F(x1,y2)F(x2,y1)F(x1,y1)0。,反之,任一满足上述五个性质的二元函数F(x,y)都可以作为某个二维随机变量(X,Y)的分布函数。,二、二维离散型随机变量及其分布,1、二维离散型随机变量 若二维随机变量(X,Y)的所有可能取值是有限多对或可列无限多对,则称(X,Y)是二维离散型随机变量。,2、联合分布律 设(X,Y)是二维离散型随机变量,其所有可能取值为(xi,yi),i=1,2,,j=1,2,。若(X,Y)取数对(xi,yi)的概率P(X=xi, Y=yi)=pij,满足(1)pij0 ;(2),则称P(X=xi, Y=yi)=pij ,i=1,2,,j=1,2,为二维离散型随机变量(X,Y)的联合分布律或分布律。,二维离散型随机变量的分布律也可用表格形式表示为:,三、二维连续型随机变量及其密度函数,1、定义 设二维随机变量(X,Y)的分布函数为F(x,y),若存在非负可积函数f(x,y),使对任意实数x,y,有,则称 (X,Y)为二维连续型随机变量,且称函数f(x,y)为二维随机变量(X,Y)的密度函数(概率密度),或X与Y的联合密度函数,可记为(X,Y) f (x,y),(x,y)R2,2、联合密度f(x, y)的性质 (1)非负性:f(x,y)0,(x,y)R2;(2)归一性:,(3)若f (x, y)在(x0,y0) 处连续,则有,(4)设G是平面上一个区域,则二维连续型随机变量(X,Y)落在G内的概率是概率密度函数f(x, y)在G上的积分,即,分布函数的概念可推广到n维随机变量的情形。事实上,对n维随机变量(X1, X2, , Xn), F(x1, x2, , xn)P(X1 x1, X2 x2, , Xn xn)称为的n维随机变量(X1, X2, , Xn)的分布函数,或随机变量X1,X2,Xn的联合分布函数。,定义 若(X1, X2, , Xn)的全部可能取值为Rn上的有限或可列无限多个点,称(X1, X2, , Xn)为n维离散型随机变量,称P(X1=x1,X2=x2,.Xn=xn),为n维随机变量(X1, X2, , Xn)的联合分布律。,则称(X1, X2, , Xn)为n维连续型随机变量,称f(x1,x2,xn)为n维随机变量(X1, X2, ,Xn)的概率密度。,定义 n维随机变量(X1, X2, , Xn),如果存在非负的n元函数f(x1,x2,xn)使对任意的n元立方体,3.4 随机变量的独立性,一、两个随机变量的独立性定义 设F(x,y)是二维随机变量(X,Y)的分布函数,FX(x),FY(y)分别是X与Y的边缘分布函数,若对一切x,yR,均有P(Xx,Yy)=P(Xx) P(Yy)即 F(x,y)= FX(x)FY(y)则称随机变量X与Y是相互独立的。,若(X,Y)是二维离散型随机变量,其分布律为P(X=xi,Y=yj)= pij ,i,j=1,2,则X与Y相互独立的充分必要条件是对任意i,j,P(X=xi,Y=yj)= P(X=xi)P(Y=yj),即pij =pipj 。 若(X,Y)是二维连续型随机变量,则由分布函数与概率密度函数的关系可知,X与Y相互独立,即F(x,y)=FX(x)FY(y)成立的充分必要条件是f(x,y)=fX(x)fY(y) 几乎处处成立。,由上述结论可知,要判断两个随机变量X与Y的独立性,只需求出它们各自的边缘分布,再看是否对(X,Y)的每一对可能取值点,边缘分布的乘积都等于联合分布即可。,二、n维随机变量的独立性,设n维随机变量(X1,X2,Xn),对任意实数(x1,x2,xn),有 P(X1x1,X2x2,Xnxn) =P(X1x1)P(X2x2)P(Xnxn)则称随机变量X1,X2,Xn是相互独立的。 若(X1,X2,Xn)的联合分布函数以及关于Xi的边缘分布函数分别记为F(x1,x2,xn),FXk(xk),k=1,2,n,则X1,X2,Xn相互独立等价表示为F(x1,x2,xn)= FX1(x1)FX2(x2) FXn(xn)。,对于离散型随机变量(X1,X2,Xn)的情形, X1,X2,Xn相互独立,当且仅当对Xk的每个可能取值,k=1,2,n, 有等式,对于连续型随机变量(X1,X2,Xn)的联合密度函数为f(x1,x2,xn), X1,X2,Xn相互独立,当且仅当f(x1,x2,xn)=fX1(x1)fX2(x2) fXn(xn)其中fXk(xk),(k=1,2,n)是关于Xk的边缘密度函数。,设n维随机变量(X1,X2,Xn) ,m维随机变量(Y1,Y2,Ym),如果对于任意的(x1,x2,xn)Rn,以及任意的(y1,y2,ym)Rm,均有P(X1x1,X2x2,Xnxn;Y1y1,Y2y2,Ymym)=P(X1x1,X2x2,Xnxn) P(Y1y1,Y2y2,Ymym)则称n维随机变量(X1,X2,Xn)与m维随机变量(Y1,Y2,Ym)相互独立。,三、随机向量之间的独立性,设(X1,X2,Xn)与(Y1,Y2,Ym)相互独立,则Xi (i=1, 2, , n)与Yi (i=1, 2, , m)相互独立;又若h, g是连续函数,则h (X1,X2,Xn)与g (Y1,Y2,Ym)相互独立。,用分布函数形式表示即为F(x1,x2,xn,y1,y2,ym)=FX(x1,x2,xn)FY(y1,y2,ym),第四章 随机变量的数字特征,数学期望方差几种重要分布的数学期望与方差协方差和相关系数,定义(期望). 设X是离散型随机变量,其分布律为XP(X=xi)=pi, i=1,2,如果级数,绝对收敛,,并称级数,的和为随机变量X的数学期望,记作,则称X的数学期望存在,,E(X),即,则称随机变量X的数学期望不存在。,注意:随机变量X的数学期望E(X)完全是由X的分布律确定的,而不应受X的可能取值的排列次序的影响,因此要求级数,绝对收敛。若级数,不绝对收敛,,定义. 设X是连续型随机变量,概率密度函数为f(x),若积分,绝对收敛,则称X的数学期望存在,,且称积分,为随机变量X的数学期望,记为E(X),即,数学期望简称期望或均值。,1、设C是常数,则E(C)=C;2、设C是常数,X为随机变量,则E(CX)=CE(X); 3、设X,Y为任意两个随机变量,则有E(X+Y)=E(X)+E(Y);4、若X,Y是相互独立的随机变量,则E(XY)=E(X)E(Y)。,数学期望的性质,定义 设X是随机变量,若EX-EX2存在,则称EX-EX2为随机变量X的方差,记为D(X)或Var(X),即D(X)=EX-EX2,称为随机变量X的均方差或标准差。,方差,一、方差的概念,由方差的定义可知,D(X)0。,在实际计算中,通常使用如下公式,即方差是“随机变量平方的期望减去随机变量期望的平方”。,二、方差的性质,1、设C是常数,则D(C)=0,且D(X+C)=D(X);2、设C是常数,X为随机变量,则D(CX)=C2D(X);,3、设X,Y为任意两个随机变量,则有D(X+Y)=D(X)+D(Y)+2EX-E(X)Y-E(Y);,特别地,当X,Y相互独立时,E(XY)=E(X)E(Y)由于EX-E(X)Y-E(Y)=EXY-XE(Y)-YE(X)+E(X)E(Y)=E(XY)-E(X)E(Y)-E(X)E(Y)+E(X)E(Y)=E(XY)-E(X)E(Y)=0,所以 D(X+Y)=D(X)+D(Y)推论:若随机变量X1, X2,Xn相互独立,则D(X1+X2+Xn)=D(X1)+D(X2)+D(Xn)又X,Y相互独立, C1,C2为常数,则D(C1X+C2Y)= C12 D(X)+C22D(Y)特别注意: D(X-Y)=D(X)+D(Y),几个重要分布的数学期望和方差,一、01分布XB(1,p),P(X=1)=p,P(X=0)=1-p=qE(X)=1p+0(1-p)=p,E(X2)=12p+02(1-p)=pD(X)= E(X2)-(E(X)2=p-p2=pq=p(1-p),二、二项分布XB(n,p),分布律为P(X=k)=Cnkpkqn-k,(p+q=1),k=0,1,2,n,在计算时,若将X表示成若干个相互独立的01分布变量之和,计算就极为简便。,在n重Bernoulli试验中,A发生的概率为p,不发生的概率为q=1-p。设,则A发生的次数,XB(n,p),三、Poisson分布,XP(),练习,四、几何分布,练习,五、均匀分布,XUa, b,练习,六、正态分布,N(,2)中两个参数和2 ,分别是正态分布中的数学期望和方差。,练习,七、指数分布,练习,协方差,相关系数,定义 设(X,Y)是二维随机变量,如果EXE(X)YE(Y)存在, 则称它是X与Y的协方差,记为Cov(X,Y)即 Cov(X,Y)= EXE(X)YE(Y)。并称,一、概念,为X与Y的相关系数,XY是一个无量纲的量。,由协方差定义可得,对任意的随机变量X、Y,有Cov(X,Y)= EXE(X)YE(Y)= E(XY)E(X)E(Y)这是协方差的一个计算公式又有 D(X+Y)=D(X)+D(Y)+2Cov(X,Y) D(X-Y)=D(X)+D(Y)-2Cov(X,Y),二、协方差的性质,(1) Cov(X,Y)=Cov(Y,X);(2) Cov(X,X)=D(X),Cov(X,C)=0;(3) Cov(aX,bY)=abCov(X,Y),其中a,b为常数;(4) Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z);(5),称,为X的标准化变量,即“随机变量与期望之差除以标准差”,若记,则E(X*)=0, D(X*)=1,三、相关系数的性质,1、|XY|1,即“相关系数的绝对值小于等于1”。,2、|XY|=1的充分必要条件是X与Y以概率1存在线性关系,即P(Y=aX+b)=1,a0,a,b为常数。,定义 若XY=0,则称X与Y不相关。3、若X与Y相互独立,则必有X与Y不相关。注意:X与Y不相关, X与Y未必相互独立。所谓不相关只是就线性关系而言,而相互独立是就一般关系而言的。,第五章 大数定律和中心极限定理,大数定律中心极限定理,大数定律,概率论与数理统计是研究随机现象统计规律性的学科. 随机现象的规律性只有在相同的条件下进行大量重复试验时才会呈现出来. 也就是说,要从随机现象中去寻求必然的法则,应该研究大量随机现象.,定理:(独立同分布下的大数定律)设X1,X2, 是独立同分布的随机变量序列,且E(Xi)= ,Var(Xi)= , i=1,2,则对任给 0,大数定律以严格的数学形式表达了随机现象最根本的性质之一:,平均结果的稳定性,中心极限定理,自从高斯指出测量误差服从正态分布之后,人们发现,正态分布在自然界中极为常见. 观察表明,如果一个量是由大量相互独立的随机因素的影响所造成,而每一个别因素在总影响中所起的作用不大. 则这种量一般都服从或近似服从正态分布.,定理:(独立同分布下的中心极限定理),它表明,当n充分大时,n个具有期望和方差的独立同分布的r.v之和近似服从正态分布.,设X1,X2, 是独立同分布的随机变量序列,且E(Xi)= Var(Xi)= ,i=1,2,,则,第六章 数理统计的基本概念,总体和样本几个常用的分布和抽样分布,总体和样本,一、总体 在数理统计中,把所研究的对象的全体称为总体。通常指研究对象的某项数量指标,一般记为X。 把总体的每一个基本单位称为个体。如全体在校生的身高X,某批灯泡的寿命Y。对不同的个体,X的取值是不同的。X是一个随机变量。X的分布也就完全描述了我们所关心的指标,即总体就是指分布。,二、随机样本从总体X中抽出若干个个体称为样本,一般记为(X1,X2,Xn)。n称为样本容量。而对这n个个体的一次具体的观察结果(x1,x2,xn)是完全确定的一组数值,但它又随着每次抽样观察而改变。(x1,x2,xn)称为样本观察值。,如果样本(X1,X2,Xn)满足(1)代表性:样本的每个分量Xi与X有相同的分布;(2)独立性: X1,X2,Xn是相互独立的随机变量,则称样本(X1,X2,Xn)为简单随机样本。,设总体X的分布为F(x),则样本(X1,X2,Xn)的联合分布为,当总体X是离散型时,其分布律为,样本的联合分布律为,当总体X是连续型时, Xf(x),则样本的联合密度为,总体、样本、样本观察值的关系,总体,样本,样本观察值,?,理论分布,统计是从手中已有的资料样本观察值,去推断总体的情况总体分布。总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而可以用样本去推断总体。,三、统计量,样本是我们进行分析和推断的起点,但实际上我们并不直接用样本进行推断,而需对样本进行“加工”和“提炼”,将分散于样本中的信息集中起来,为此引入统计量的概念。,(X1,X2,Xn),g(X1,X2,Xn),其中g(x1,x2,xn)是(x1,x2,xn)的连续函数。如果g(X1,X2,Xn)中不含有未知参数,称g(X1,X2,Xn)为统计量。(不含未知参数的样本的函数),如,未知:,是统计量,不是统计量,若已知,2未知:,是统计量,几个常用的统计量样本均值,样本方差,样本标准差,样本k阶原点矩,样本k阶中心矩,几个常用的分布和抽样分布,(一) 2分布1、定义:设n个r.v. X1,X2,Xn,XiN(0,1),i=1,2,n则称,一、常用分布 2分布、 t 分布和F分布。,服从自由度为n的2分布。,2分布的密度函数f(y)曲线,2、性质(1),(2) 2分布的可加性,X1, X2 相互独立,则X1+X2 2(n1+n2),练习,3、2分布表及有关计算(1)构成 P2(n)=p,已知n,p可查表求得;(2)有关计算,分位点,1、定义 若XN(0, 1),Y2(n),X与Y独立,则,t(n)称为自由度为n的t分布。,(二) t分布,t(n) 的概率密度为,2、基本性质: (1) f(t)关于t=0(纵轴)对称;(2) f(t)的极限为N(0,1)的密度函数,即,3、t分布表及有关计算(1)构成: Pt(n)=p(2)有关计算Pt(n)=p,=tp(n),p,注:,(三) F分布,1、定义 若X2(n1),Y2(n2) ,X,Y独立,则,称为第一自由度为n1 ,第二自由度为n2的F分布,其概率密度为,2、 F分布表及有关计算(1)构成:PF(n1,n2)=p(2)有关计算PF(n1,n2)=p=Fp(n1,n2),一、抽样分布 统计量的分布,1、设(X1,X2,Xn)是正态总体N(,2)的样本,则 (1),(2),(3),与S2独立,2、设(X1i,X2i,Xnii)是来自具有相同方差2 ,均值为i的正态总体N(i,2)的样本,i=1,2,t,且设这t个样本之间相互独立,设,分别是第i个总体的样本均值和样本方差,i=1,2,t,则有(1)2t个随机变量,是相互独立的。,(2),其中,(3)当t=2时,有,3、设(X1,X2,Xn)是正态总体N(,2)的样本,则,4、设(X1,X2,Xn1)是N(1,12)的样本,(Y1,Y2,Yn2)是N(2,22)的样本,且相互独立,S12,S22是样本方差,则(1),第六章 参数估计,参数的点估计 估计量的评选标准正态总体参数的区间估计,参数的点估计,一、参数估计的概念问题的提出:已知总体X的分布函数F(x;1,2,k),其中1, 2, k是未知参数。点估计:由总体的样本(X1,X2,Xn)对每一个未知参数i(i=1,2,k)构造统计量,作为参数i,的估计,称,为参数i的估计量。,样本(X1,X2,Xn)的一组取值(x1,x2,xn)称为样本观察值,将其代入估计量,,得到数值,称为参数i的估计值。,由于,现用它来估计未知参数,故称这种估计为点估计。,是实数域上的一个点,,点估计的经典方法是: (1)矩估计法 (2)极大似然估计法,二、矩估计法(简称“矩法”) 英国统计学家皮尔逊(Karl Pearson)提出1、矩法的基本思想:以样本矩作为相应的总体同阶矩的估计;以样本矩的函数作为相应的总体矩的同一函数的估计。,2、矩法的步骤:设总体X的分布为F(x;1,2,k),k个参数1,2,k待估计,(X1,X2,Xn)是一个样本 。(1)计算总体分布的i阶原点矩E(Xi)=i(1,2,k),i=1,2,k,(计算到k阶矩为止,k个参数);(2)列方程,从中解出方程组的解,记为,则,为参数1,2,k的矩估计。,二、极大似然估计法(R.A.Fisher),例 设总体X服从01分布,即分布律为,i=0,1,其中01未知,(X1,X2,Xn)为X的一个样本,设其观察值为(x1,x2,xn),则事件(X1=x1,X2=x2,Xn=xn)发生的概率为,对于给定的样本观察值,上述概率为的函数,称其为似然函数,并记为L()为使上述随机事件的概率达到最大,应选取使L()达到最大的参数值(如果存在),即,1、极大似然估计法的基本思想,一般说,事件A发生的概率与参数有关,取值不同,则P(A)也不同。因而应记事件A发生的概率为P(A|)。若A发生了,则认为此时的值应是在中使P(A|)达到最大的那一个。,使得取该样本值发生的可能性最大。,由样本的具体取值,选择参数的估计量,对每一样本值(x1,x2,xn),在参数空间内使似然函数L(x1,x2,xn;)达到最大的参数估计值,称为参数的极大似然估计值,它满足,称统计量,为参数的极大似然估计量。,记为,2、似然函数与极大似然估计,设,则称,为该总体X的似然函数。,3、求极大似然估计的步骤,设总体X的分布中,有m个未知参数1,2,m,它们的取值范围。(1)写出似然函数L的表达式如果X是离散型随机变量,分布律为P(X=k),则,如果X是连续型随机变量,密度函数为f(x),则,(2)在内求出使得似然函数L达到最大的参数的估计值,它们就是未知参数1,2,m的极大似然估计。,一般地,先将似然函数取对数lnL,然后令lnL关于1,2,m的偏导数为0,得方程组,从中