数理统计基础知识.ppt
第4 章 数理统计的基础知识 从第4章开始,将研究数理统计的基本内容。数理统计与概率论的基本概念与方法有着密切的联系。概率论是数理统计的理论基础和工具,而数理统计则是概率论的应用。数理统计也是研究随机现象的学科。当我们用一个随机变量去描述一种随机现象时,通常我们对这个随机变量所服从的分布类型可能一无所知,或者根据该随机现象的某些特征、以及人们的经验而知道随机变量分布的类型,但不知道其分布中所含参数的值。,例如,某灯泡厂每年生产上万只灯泡,这些灯泡中的每一个都具有这样的特征:“不是合格品,就是次品”。因此,随机检查一个灯泡时,它或者是合格品,或者是次品。这是一个随机现象。当用随机变量 X 去描述这个随机现象时,记 X 任取一件产品中的次品数,则,随机变量 X 服从参数为 p 的 0 1 分布 b(1,p),其概率分布列为,其中 p 是次品率,是随机变量 X 的分布中所含的未知参数。,要想了解当天所生产的灯泡的质量(即次品率),一个可行的方法就是,抽取一定量的灯泡(如 20 个)进行质量检查,并根据这一部分灯泡的质量情况对整批灯泡的质量进行估计或做出某种判断。数理统计学就是以概率论为理论基础,研究如何获取有用的观察资料,如何根据所得到的有限资料对整个随机现象所具有的统计规律性进行科学的分析,从而做出尽可能准确可靠的推断这类问题的数学分支。数理统计的中心任务是:从局部的观测资料的统计特性出发,利用科学的方法,来推断事物整体的统计特性。,数理统计学通常由两个主要部分组成。一个是抽样理论和实验设计,研究如何更合理地获取观察资料,如何进行抽样、抽多少等问题。由于数理统计学所涉及研究的对象一般为数很大,而限于时间和经济上的考虑,人们只可能收集一部分数据。例如,在收集某批电器产品的使用寿命的实验数据时,往往需要对产品进行破坏性的检验,因此只能检验其中的一小部分产品,观察其使用寿命,并依此推断整批产品的使用寿命。这就要求人们研究有效地收集数据的方式,精心设计收集数据的方法,以保证所收集到的一小部分数据能够尽可能多地提供与所研究的整个问题有关的真实的信息。,另一个是统计推断,研究如何对所获取的有限的资料进行科学地分析,用科学的方法提取和分析寓于所收集到的有限数据中的信息,并运用统计推断的方法,在更大的范围内对所研究的问题做出尽可能准确、可靠的推断,得出某种合理的结论。统计推断是数理统计学的基本问题之一,在此主要介绍统计推断的一些基本知识。,由于统计推断是由部分来推断整体,是借助在小范围内所提取的信息来推断整体的规律性,这就不可避免地会使这种推断带有某种不确定性,也就是说,人们不能保证所推断的结果是百分之百正确的。因此,在进行统计推断的同时,还必须寻求一些有意义的指标来衡量推断的正确程度,评价推断过程中所含有的不确定性。下面给出数理统计学的一些基本概念。,4.1 总体与样本 一、总体与总体分布 总体是具有一定共同属性的研究对象的全体。一旦总体确定了,便称组成总体的每一个个别的成员为个体。总体与个体的关系,即集合论中集合与元素之间的关系。例如,为研究灯泡厂一天中所生产的灯泡的质量,该厂在一天中所生产的所有灯泡就是待研究的总体,每一个灯泡就是一个个体。,在统计学的研究过程中,人们关心的并不是所研究对象(总体)的所有特征,而仅仅是关心反映所研究对象某一特征的某一项或某几项数量指标。例如,反映学生“概率统计”课程的学习情况的数量指标,就是学生这门课程的考核成绩(并不需要考虑学生的身高、体重等指标)。对于所选定的数量指标 X(可以是向量)而言,由于每个个体的取值是不同的,且每个个体的取值在测试结束之前是不能确定的,因此数量指标 X 是一个随机变量(或随机向量)。,为了研究方便,通常把总体(具有一定共同属性的研究对象的全体)与数量指标 X 等同起来,并把数量指标 X 的分布称为总体的分布。即 定义 4.1(P.124)统计学中,称随机变量(或随机向量)X 为总体,并把随机变量(或随机向量)X 的分布称为总体分布。注(P.124):总体 X 的分布一般是未知的。有时虽然已知总体分布的类型(如正态分布、伯努利分布等),但这些分布中所含的参数(如、2,p 等)也是未知的。统计学的主要任务,就是对总体的未知的分布或参数进行推断。,对于所研究对象的定性指标,也可以转化为定量指标(即数量指标)来研究,进而可以设定一个随机变量来表示所研究的总体。例如,“考察学生的学习成绩是优秀、合格还是不合格”时,仍然可以用一个随机变量 X 来描述:令。,二、样本与样本分布 由于总体的分布一般是未知或部分未知的,为了获取对总体分布的知识,就需要对总体进行观察,收集有关总体的信息和资料。在实际研究过程中,由于受到人力、时间和财力方面的限制,人们往往不能收集到有关总体的全部信息;而且在有些情况下,根本就不允许人们去获取有关总体的全部数据(如在测试灯泡的使用寿命时,测试本身具有破坏性)。因此,通常总是从总体中抽取一部分个体来进行观察,这种做法称之为“抽样”。,假设从总体 X 中抽取了 n 个个体 X1,X2,X n 来对总体 X 进行抽样观察,由于在观察测试结束之前,这 n 个个体的观测值是不确定的,而且反复抽样所得到 n 个个体的观测结果也是不相同的。因此,所抽取的 n 个个体 X1,X2,X n 实际上就是一个随机向量(X1,X2,X n),称之为一个“样本”,每一个个体 X i 称之为一个样品;对样本(X1,X2,X n)的一次观测值(x1,x2,x n),就是样本的一个“实现值(样本值)”。统计学的主要任务,就是提供科学的方法,借助样本值(x1,x2,x n),对未知的总体进行合理的推断。,为了更准确地对总体分布进行分析和推断,就要求所抽取的样本能够很好地反映总体的特性。下面的定义给出了一个好的样本应该具备的条件。定义4.2(P.125)称(X1,X2,X n)为总体 X 的简单随机样本,如果 X1,X2,X n 是相互独立、同分布的随机变量,而且它们都与总体 X 同分布。样本中所含分量的个数 n,称为该样本的容量。1)人们要求样本中的每一个分量 X i(i=1,2,n)都与总体 X 同分布,表明抽样观察的每一个个体都是从总体中抽取的,因而它们对总体具有很好的代表性;2)人们要求样本中的各分量 X1,X2,X n 相互独立,则表明所得到的每一个观察结果既不影响其它观察结果,也不受其它观察结果的影响。,定义(P.125)获取简单随机样本的方法,称为简单随机抽样。并称样本(X1,X2,X n)的一组具体的观察值(x1,x2,x n)为样本值,全体样本值组成的集合为样本空间。容量为 n 的样本空间是 n 维向量空间 Rn 的一个子集。这里假定所考虑的样本都是简单随机样本,简称为样本。约定:以大写的英文字母 X i 表示随机变量,而以相应的小写英文字母 xi 表示随机变量 X i 的观察值。,设总体 X 的分布函数为 F(x),则由定义 4.2(P.125知,样本(X1,X2,Xn)的分布函数为,并称之为样本分布。特别地,如果总体 X 为连续型随机变量,其密度函数为f(x),则样本(X1,X2,Xn)的密度函数为,并分别称 f(x)和 f(x1,x2,xn)为总体密度和样本密度。如果总体 X 为离散型随机变量,.,如果总体 X 为离散型随机变量,其概率分布为 p(x)=P(X=x),x 取遍 X 所有可能的取值,则样本(X1,X2,Xn)的概率分布为,并分别称 p(x)和 p(x1,x2,x n)为总体概率分布和样本概率分布。,例 4.1(P.126)称总体 X 为正态总体,如果 X 服从正态分布。正态总体是统计应用中最常见的总体。现假设总体 X N(,2),总体密度 则其样本(X1,X2,Xn)的密度为,例 4.2(P.126)称总体 X 为伯努利总体,如果它服从以 p(0 p 1)为参数的伯努利分布,即 X b(1,p)。从而有 P(X=1)=p,P(X=0)=1 p,即 p(i)=P(X=i)=pi(1p)1 i,i=0,1。于是,其样本(X1,X2,Xn)的概率分布为其中 xi(i=1,2,n)取值 1 或 0,它恰好等于样本中取值为 1 的分量之总和。,例 4.3 设总体 X 服从参数为 p 的几何分布,(X1,X2,Xn)为其样本,求样本的概率分布。解 p(k)=P(X=k)=p(1 p)k 1,k=1,2,;(X1,X2,Xn)是来自总体 X 的样本,样本的概率分布为 其中 xi(i=1,2,n)取值正整数。,例 4.4 设总体 X 服从参数为 的指数分布,(X1,X2,,Xn)为其样本,求样本密度。解 总体 X e(),;(X1,X2,Xn)是来自总体 X 的样本,样本密度为,对样本概率分布和样本密度的理解:在例 4.3 和例 4.4 中,算得样本概率分布和样本密度分别为,xi 取值正整数,i=1,2,n;和,xi 0,i=1,2,n。在概率论的研究中,人们通常假定随机变量(即总体)的分布及其参数(如:p、等)都是已知的,因而把p(x1,x2,xn)和 f(x1,x2,xn)理解为关于未知量 x1,x2,xn 的 n 元函数。,例 设总体X服从参数为 的泊松分布,则样本的概率分布为,在统计学的实际应用中,根据知识与经验,人们往往可以确定总体分布所属的类型,例如,认为学生的考试成绩服从正态分布;描述一件产品是否为废品的随机变量服从伯努利分布(0 1 分布);记录电话呼叫次数的随机变量服从泊松分布;电子元件的寿命服从指数分布等等。因此,在总体分布中,往往只是其中的参数是未知的。从这个意义上来讲,可以从另一个角度来理解例 4.3 和例 4.4 中的样本概率分布和样本密度:把式中的(x1,x2,x n)看作是一个样本值,通过试验观察就可以确定下来,因而它们是一组已知量(或可知量),而各总体的参数(如 p、等)是未知量,即分别把p(x1,x2,xn)和 f(x1,x2,xn)理解为关于未知参数 p 和 的一元函数:,,0 0。在统计学中,就是要由样本值(x1,x2,x n)出发,来推断总体中未知的参数。因此,统计学中又把例 4.3 和例 4.4 中的样本概率分布和样本密度函数称为未知参数的似然函数。关于似然函数的概念,将在5.2 中做详细的介绍。,三、统计推断问题简述(P.122)统计学要解决的主要问题,就是借助总体 X 的一个样本(X1,X2,Xn),利用其样本值(x1,x2,xn),对总体 X 的未知分布或参数进行科学地、合理地推断。人们将这类问题统称为统计推断问题。在进行统计推断的过程中,为了保证推断的科学性与合理性,需要借助样本构造一些合适的统计量(即样本的函数,它是一个随机变量),然后再利用所构造的统计量的“良好”性质,对总体分布所属的类型以及总体分布中所含的未知参数进行统计推断。,作业P127:4,6,4.2 统计量 一、统计量的定义 定义 4.3(P.127)设(X1,X2,Xn)为总体 X 的一个样本,称此样本的任一不含总体分布未知参数的函数为该样本的统计量。例 4.4(P.127)设总体 X 服从正态分布,EX=5,DX=2(2 未知),(X1,X2,Xn)为总体 X 的一个样本。,(1)令 Sn=X1+X2+Xn,则 Sn 与 X 都是样本(X1,X2,Xn)的统计量,且具有下面的性质:E Sn=E(X1+X2+Xn)=EX1+EX2+EXn=n EX=5 n,D Sn=D(X1+X2+Xn)=DX1+DX2+DXn=n DX=n 2;,。(2)令,则 U 不是该样本的统计量。因为 U 的表达式中含有总体分布的未知参数。,对于一个给定的样本,根据统计量的定义,可以构造出很多统计量来,但常用的、具有“良好”性质的统计量并不多.下面介绍一些在统计学中常用的统计量。二、常用的统计量(P.128)设(X1,X2,Xn)为来自总体 X 的一个容量为 n 的样本。1、样本均值称样本中各分量的算术平均值为样本均值,记做X,即(随机变量)。注:其实现值为:。,注意区分符号 E X 与X!EX 是总体期望(总体均值),是一个常数;X 是样本均值,是随机向量(样本)(X 1,X 2,X n)的函数,是一个随机变量。因而,E X X!,2、样本方差 样本方差和样本标准差都是用来描述样本中各分量与样本均值的均方差异的统计量。样本方差有两种定义方式:一种是,并称 S02 是样本的未修正的样本方差。3、样本标准差 更常用的是样本方差的另一种定义,并称 S2 是修正的样本方差。S2 比 S02 有更好的统计性质。今后使用的主要是修正的样本方差,简称为样本方差.前者的数学期望是正好是方差.同总体的方差与其标准差之间的关系一样,样本标准差 S 定义为样本方差 S2 的算术平方根,即。,例4.5 样本方差的简化计算问题。其中。,例 4.6 设(x1,x2,x6)是来自总体 X 的样本值,已知,。求(1)样本均值x;(2)样本方差 s2,以及样本标准差 s。解(1);(2)。,例4.7 设(X1,X2,Xn)是来自总体 X 的样本,EX=,DX=2,求 EX,DX。解(X1,X2,Xn)是来自总体 X 的样本,EX=,DX=2,E Xi=,D Xi=2,i=1,2,n;且 X1,X2,Xn 相互独立,;。进而有,若总体 X N(,2)(即 X 是正态总体),则。,注:,样本方差的统计意义 就样本的某一组观察值(x1,x2,xn)而言,与总体方差类似,样本方差 刻画了样本值对其样本均值的平均偏离程度:样本方差越小,样本数据就围绕着其样本均值分布得越集中;样本方差越大,样本数据就围绕着其样本均值分布得越分散。4、样本原点矩(P.129)记,k 1。并称 Ak 为样本的 k 阶原点矩。当 k=1 时,一阶样本原点矩 就是样本均值X。可见,样本原点矩是样本均值概念的推广。,5、样本中心矩(P.129)记,k 1。并称 Bk 为样本的 k 阶中心矩。当 k=2 时,二阶样本中心矩 就是未修正的样本方差。可见,样本中心矩是未修正的样本方差概念的推广。以上各统计量(样本均值、样本方差、样本标准差、样本原点矩、样本中心矩)统称为样本的矩统计量,或简称为样本矩。它们都可以表示成样本的显示函数。除样本矩以外,还可以定义不能表为样本的显示函数的统计量。,6、顺序统计量 设(X1,X2,Xn)为总体 X 的一个样本,将样本中的各分量按由小到大的顺序排列成 X(1)X(2)X(n),则称(X(1),X(2),X(n))为样本的一组顺序统计量,称X(i)为样本的第 i 个顺序统计量。特别地,称 X(1)与 X(n)分别为样本的极小值与极大值,并称 X(n)X(1)为样本的极差。,三、枢轴量 在样本的统计量中不应该包含总体分布的任何未知参数。但是在统计推断问题中,又常常需要利用样本资料对总体分布中的某一个未知参数 进行推断。为此,需要构造一个样本的仅含有待推断的未知参数,而不含有其它未知参数的函数 U(X1,X2,Xn;),同时要求如此构造的样本函数 U(X1,X2,Xn;)的分布已知。将这种只含有一个未知参数、且分布已知的样本函数,称为枢轴量。人们利用枢轴量的已知分布,就可以对总体分布中的未知参数 进行统计推断。由此可见,枢轴量应该满足三点要求:首先,它必须是一个样本的函数;其次,在这个样本的函数中仅含有一个未知参数;最后,此样本函数的分布是已知的。,例4.8(P.129 例 4.5)设总体 X,其中 已知,未知,(X1,X2,Xn)为总体 X 的一个样本,令,则 U N(0,1)。证(X1,X2,Xn)是来自正态总体 的一个样本,X1,X2,Xn 相互独立,且,i=1,2,n。,于是,。,另外,由于 U 是样本(X1,X2,Xn)的函数,且仅含有一个未知参数,同时 U 的分布已知,所以 U 是一个枢轴量。,4.3 常用的统计分布 统计推断的基本做法是:在取得总体 X 的样本(X1,X2,Xn)之后,借助样本统计量(或枢轴量)来对未知的总体分布进行推断。为了实现统计推断的目的,一般需要确定相应的统计量(或枢轴量)所服从的分布。本节将介绍一些统计学中常用的统计分布。,一、分位数 分位数是统计分布的数字特征。定义 4.4(P.130)随机变量 X 的分布函数为 F(x),对给定的实数(0 F)=,或 F(F)=1。则称 F 为随机变量 X 的分布的水平 的上侧分位数。或直接称为分布函数 F(x)的水平 的上侧分位数。特别地,如果 F(x)是严格单调增的,则其在水平 的上侧分位数 F 为 F=F 1(1)。,当 X 是连续型随机变量时,设其密度函数为 f(x):X f(x),则其在水平 的上侧分位数 F 应满足(P(X F)=):,其中 F 也称为水平 的右侧分位数;为图中阴影部分的面积,通常表示一个小概率事件的概率,也称为(右侧)尾部概率,常取值为 0.01、0.05 和 0.10,一般要求 0.20。,在有些情况下,也需要考虑左侧尾部的概率(如图 1)。此时,考虑水平 1 的上侧分位数 F1(F1 也称为水平 的左侧分位数)。F1 应满足:P(X F1)=1,或 F(F1)=。注:当密度函数为 f(x)为偶函数时,成立 F1=F(如图 2)。图 1 图 2,如:标准正态分布 N(0,1)在水平 的上侧分位数通常记为 u,且 u 应满足 0(u)=1。于是,通过查标准正态分布的分布函数表(附表 2),即可以得到分位数 u 的值。例如,当=0.05 时,0(u 0.05)=0.95,查表得 u 0.05=1.645,由对称性,得 u 0.95=1.645;当=0.10 时,0(u 0.10)=0.90,查表得 u 0.10=1.28,由对称性,得 u 0.90=1.28。,总注:,(1)分布函数的图像在 左侧的面积为,(2)若F(x)是严格单调递增的,则,(3)标准正态分布N(0,1)水平 的上側分位数通常记为,(4)根据图形的关系,可以得到,(5)对于具有对称分布的分布函数的上側分位数,在统计学中,还要用到另一种分位数双侧分位数。定义 4.5(P.131)设 X 是对称分布的随机变量,其分布函数为 F(x),对给定的实数(0 T)=,即 P(X T)+P(X T)=,或 F(T)F(T)=1。则称 T 为随机变量 X 的分布的水平 的双侧分位数,简称为分位数,或直接称为分布函数 F(x)的水平 的分位数。,由 P(X T)=,得 P(X T)+P(X T)=/2 且 P(X F)=,知:T=F/2,即水平 的双侧分位数 T,就是水平/2 的上侧分位数 F/2(通常不使用符号 T,而使用符号 F/2 来表示双侧分位数)。当X 是连续型随机变量时,设其密度函数为 f(x),T 的意义如右图所示。可见,T=F/2,且有 P(X F/2)=/2 或 F(F/2)=1/2,以及 P(F/2 X F/2)=1。,当随机变量 X 不是对称分布时,有时也需要考虑两个分位数 F1/2 和 F/2,此时,F1/2 满足:P(X F1/2)=1/2,或 F(F1/2)=/2;F/2 满足:P(X F/2)=/2,或 F(F/2)=1/2。且有 P(F1/2 X F/2)=1。当 X 是连续型随机变量时,且 X f(x)时,有下图。,例 4.9 当=0.05 时,求标准正态分布的水平 的(双侧)分位数。解 当=0.05 时,0(u 0.025)=0.975,查表得 u 0.025=1.96;且有 P(1.96 X 1.96)=1 0.05=0.95。,二、2 分布 命题 4.1 设 X1,X2,Xn 是 n 个相互独立的随机变量,且 Xi N(0,1),i=1,2,n。则 X=X12+X22+Xn2 的密度函数为,其中 是(伽马)函数。定义 4.6(P.128)一个随机变量 X 称为服从以 n 为自由度的 2 分布,如果其密度函数为。记作 X 2(n)。可见,服从 2 分布的随机变量一定是非负随机变量。,定理:设X1,X2,Xn是相互独立的随机变量,且XiN(0,1),则统计量,2 分布的密度函数的图形见 P.128 图 4-4。当自由度 n 取不同的值时,2 分布的密度函数的图形具有不同的形状。当 n 3 时,2 分布的密度函数的曲线都为单峰曲线,曲线从原点开始递增,在 x=n 2 处达到最大值,然后递减,并以 x 轴为渐进线。函数的图形关于直线 x=n 2 不对称,但随着自由度 n 的增大,曲线的峰值向右移动,图形变得比较平缓,并且趋于对称。因此,当自由度 n 充分大以后,2 分布可以用正态分布来近似。,2分布的的密度函数的示意图,当 n=2 时,是参数 的指数分布 的密度函数,即自由度为 2 的 2 分布 2(2)就是参数 的指数分布。其密度函数的曲线在 x=0 处取到最大值,然后递减,并以 x 轴为渐进线。当 n=1 时,2 分布的密度函数的曲线在 x=0 处取无穷大值并以 x 轴和 y 轴分别为其水平渐进线和垂直渐进线。根据定义 4.6 和正态分布的性质,可以得到下面的命题。命题 4.2(1)若 X 2(m),Y 2(n),且随机变量 X 与 Y 相互独立,则 X+Y 2(m+n)。(也称之为独立 2 变量的可加性。)(2)若 X 2(n),则 EX=n,DX=2n。,证明(1)设随机变量 X1,X2,Xm,Xm+1,Xm+n 相互独立,同服从标准正态分布 N(0,1),则由命题 4.1 及定义 4.6 得 X12+X22+Xm2 2(m),Xm+12+Xm+22+Xm+n2 2(n),X12+X22+Xm+n2 2(m+n)。X 2(m),Y 2(n),X 与 X12+X22+Xm2 同分布,Y 与 Xm+12+Xm+22+Xm+n2 同分布。又 X 与 Y 相互独立,X+Y 与 X12+X22+Xm+n2 同分布。X+Y 2(m+n)。,(2)设随机变量 X1,X2,Xn 相互独立,同服从标准正态分布 N(0,1),则 X12+X22+Xn2 2(n),且 EXi=0,DXi=1,i=1,2,n。于是,EXi2=DXi+(EXi)2=1,i=1,2,n;i=1,2,n。,X 2(n),X 与 X12+X22+Xn2 同分布,于是,;(注:)又 随机变量 X1,X2,Xn 相互独立,X12,X22,Xn2 也相互独立,而 X 与 X12+X22+Xn2 同分布,从而。2 分布是常用的统计分布之一,但由于其密度函数的结构比较复杂,难于进行直接的计算。通常将其制成统计用表(附表 3)。附表 3 给出了自由度为 n 的 2 分布的水平 的上侧分位数 2(n)的值,即若随机变量 X 2(n),0 2(n)=,或 P(X 21(n)=1。,由于 2 分布的密度函数 2(x;n)不是对称的,因而2 分布不存在双侧分位数。但在统计推断中,常常会使用两个分位数 21/2(n)和 2/2(n),使 P(X 2/2(n)=。通常采用式子 P(X 21/2(n)=1/2 和 P(X 2/2(n)=/2 通过查表来确定分位数 21/2(n)和 2/2(n)。且有 P(21/2(n)45 或 n 50)时,可以用正态分布来近似 2 分布,用正态分布的分位数近似地求得 2 分布的分位数。,例 4.10 设 r.v.X 2(16),=0.05,求1)21(16);2)21/2(16)。解 1)由 P(X 20.95(16)=0.95,查表得21(16)=20.95(16)=7.962;2)由 P(X 20.975(16)=0.975,查表得21/2(16)=20.975(16)=6.908,且有 P(6.908 X 28.845)=0.95。,三、F 分布 F 分布也是一种常用的统计分布。命题 4.3 设 X 2(m),Y 2(n),且 X 与 Y 相互独立,记,则 Z 的密度函数为其中(p 0,q 0)是(贝塔)函数。,定义 4.7 一个随机变量 X 称为服从第一自由度为 m,第二自由度为 n 的F 分布,如果其密度函数为 记作 X F(m,n)。可见,服从 F 分布的随机变量一定是非负随机变量。,F分布的的密度函数的示意图,F 分布的密度函数曲线的形状因自由度 m、n 的不同取值而异。当第一自由度 m 3 时,F 分布的密度函数的曲线是单峰曲线,曲线在 处达到最大值,且 x*1,即图形的峰值恒在小于 1 处达到。当两个自由度 m 与 n 都变得越来越大时,x*就越来越接近于 1,从而函数的图形就在非常接近于 1 的地方达到最高点,同时,曲线也接近于对称;当 m 与 n 都趋于无穷大时,F 分布趋于正态分布。,综合定义 4.7 和命题 4.3,得 结论 设随机变量 X 与 Y 相互独立,分别服从 2(m)与 2(n)分布。令随机变量,则 Z 服从第一自由度为 m,第二自由度为 n 的F 分布,即 Z F(m,n)。进而还有 结论 若随机变量 Z 服从 F(m,n)分布,则 服从 F(n,m)分布。,由此可得:F(m,n)分布的水平 1 的上侧分位数 F1(m,n),等于F(n,m)分布的水平 的上侧分位数 F(n,m)的倒数,即。证 设 X F(n,m),则 X 是非负随机变量,且 于是,同时有。,3 F分布的上分位点,设F(n1,n2),对于给定的a,0a1,满足条件,的点F(n1,n2)为F分布的上分位点.,F 分布也是常用的统计分布,其分布也难于利用密度函数进行直接计算。因此,对于 F 分布也制出了统计用表(附表 4),供查阅。在附表 4 中,仅对充分小的(0.10)的一些特殊值列出了 F(m,n)分布的水平 的上侧分位数 F(m,n)(若 X F(m,n),则 P(X F(m,n)=)的值;此时由于 1 的值较大(0.90),因此不可以利用附表 4 直接查到 F(m,n)分布的水平 1 的上侧分位数 F1(m,n)的值,必须先查出 F(n,m)的值,然后再利用关系式,计算出 F1(m,n)的值。,另外,由于服从 F(m,n)分布的随机变量 X 是非负随机变量,其密度函数 f(x;m,n)不是对称函数,因而 F 分布也不存在双侧分位数。但在统计推断中,也常常会使用两个分位数 F1/2(m,n)和 F/2(m,n),使 P(X F/2(m,n)=。这时通常采用关系式 P(X F/2(m,n)=/2 来确定分位数 F/2(m,n)(直接查表);采用关系式 P(X F1/2(m,n)=1/2 来确定分位数 F1/2(m,n)。,在确定分位数 F1/2(m,n)时,通常需要先查表得到 F/2(n,m)的值,然后再利用关系式计算出 F1/2(m,n)的值。此时成立 P(X F/2(m,n)=1。例 4.13 设随机变量 F F(12,9),=0.05,试求 F0.95(12,9)。解 查表得 F0.05(9,12)=2.80,于是,F0.95(12,9)=1/F0.05(9,12)=1/2.80 0.3571。,四、t 分布 命题 4.4(P.131)设 X N(0,1),Y 2(n),且 X 与 Y 相互独立,记,则随机变量 T 的密度函数为 其中(p 0,q 0)是(贝塔)函数.定义 4.8(P.131)一个随机变量 X 称为服从自由度为 n 的 t 分布,如果其密度函数为,记作 X t(n)。,t 分布是科塞特()于 1908 年在一篇署名为“学生”(Student)的论文中首先提出来的,因此,t 分布也称为“学生分布”。综合定义 4.8 和命题 4.4,得 结论 设随机变量 X 与 Y 相互独立,X N(0,1),Y 2(n)。令随机变量,则 T 服从自由度为 n 的t 分布,即 T t(n)。进而有:随机变量 T 2 F(1,n)。这也说明了t 分布与 F 分布的关系:若 r.v.T t(n),则 r.v.T2 F(1,n)。,T分布的的密度函数的示意图,由于 t 分布的密度函数满足 t(x;n)=t(x;n),因而 t 分布的密度函数曲线的形状关于纵轴(y 轴)对称;同时,t 分布的密度函数的曲线为单峰曲线,在 x=0 处达到最大值;以 x 轴为水平渐进线.当自由度 n 很大时,t 分布接近于标准正态分布,这是由于,且可以证明,即标准正态分布 N(0,1)是 t 分布的极限分布。,这也就是说,当 t 分布的自由度 n 充分大(如 n 50)时,t 分布 t(n)可以近似地看作是标准正态分布;然而对于比较小的 n 值(如 n P(X x 0),即 t 分布的尾部比标准正态分布的尾部具有更大的概率。,t分布的上分位点,设Tt(n),对于(0,1)给定,称满足条件:,的点tn()为t分布的上分位点.,注:,对于 t 分布,也编制了相应的统计用表(附表 5)。在附表 5 中,仅对充分小的(0.10)的一些特殊值列出了 t 分布的水平 的上侧分位数 t(n)(若 X t(n),则 P(X t(n)=)的值;此时由于 1 的值较大(0.90),在附表 5 中是不可以直接查到 t 分布的水平 1 的上侧分位数 t1(n)的值,这时可以利用 t 分布具有对称的密度函数的性质,得到t1(n)=t(n)。另外,由于 t 分布具有对称的密度函数,从而具有双侧分位数 t/2(n),满足 P(X t/2(n)=,其中 t/2(n)由关系式 P(X t/2(n)=/2 来确定。且有 P(X t/2(n)=P(t/2(n)X t/2(n)=1.,当自由度 n 充分大(如 n 50)时,t 分布 t(n)可以近似地看作是标准正态分布 N(0,1),于是由标准正态分布的水平 的上侧分位数 u,可以近似地得到 t 分布的水平 的上侧分位数 t(n),即 t(n)u。根据 t 分布与 F 分布的关系:若 r.v.T t(n),则 r.v.T 2 F(1,n)。当手头上只有一张 F 分布表,而没有 t 分布表时,则可以利用 t 分布与 F 分布的关系来处理 t 分布的有关问题。,例 4.14 设随机变量 X t(10),=0.10,分别求水平 和 1 的上侧分位数,以及水平 的(双侧)分位数。解 查表得 t 0.10(10)=1.372,从而有 t 0.90(10)=1.372;查表得 t 0.05(10)=1.812,且有 P(X 1.812)=0.90。,作业P137:5.,4.4 抽样分布 在统计推断问题中,经常需要利用总体的样本构造出合适的统计量(或枢轴量),并使其服从或渐进服从某一已知的确定分布。统计学中泛称统计量(或枢轴量)的分布为抽样分布。讨论抽样分布的途径有两个。一种是精确地求出抽样分布,并称相应的统计推断为小样本统计推断;另一种是让样本容量趋于无穷,并求出抽样分布的极限分布,然后在样本容量充分大的情形下,利用该极限分布作为抽样分布的近似分布,进而对未知参数进行统计推断,并称相应的统计推断为大样本统计推断。,一、正态总体的抽样分布 正态总体的抽样分布是可以精确地求出来的,它属于小样本统计的范畴。定理 4.1 设总体 X N(,2),(X1,X2,Xn)是其容量为 n 的一个样本,X 与 S2 分别为此样本的样本均值与样本方差,则有(1);(进而有)(2);(3)X 与 S2 相互独立。,证明(1)总体 X N(,2),(X1,X2,Xn)是其容量为 n 的一个样本,Xi N(,2),i=1,2,n;且 X1,X2,Xn 相互独立。(2)、(3)略。,1、单正态总体的抽样分布 定理 4.2 设(X1,X2,Xn)为正态总体 X N(,2)的样本,与 分别为该样本的样本均值与样本方差,则有(1);(2);(3)。证明(1)由定理 4.1(1)知,再由正态分布的性质知,,(2)由定理 4.1(2)知,。(3)由定理 4.1(3)知,X 与 S2 相互独立,从而 与 相互独立。于是,,定理 4.2 中的有关结论,无论正态总体中的两个参数 和 2 是否已知,都是成立的。但在统计学的应用中,则需要关心这两个参数是否已知,从而可以决定所选用的样本的函数是统计量、枢轴量还是其它随机变量。具体情况列于下表中:利用适当的统计量或枢轴量,可以对未知参数 和 2 进行统计推断。,2、双正态总体的抽样分布 在统计学的应用中,有时需要比较两个正态总体的参数。下面的定理为比较两个正态总体的参数提供了合适的统计量(或枢轴量)。在讨论双正态总体的置信区间(5.3?)和假设检验(5.6)时将会用到。,定理 4.3(P.139)设 X N(1,12)与 Y N(2,22)是两个相互独立的正态总体,又设 是总体 X 的容量为 n1 的样本,X 与 S12 分别为该样本的样本均值与样本方差。再设 是总体 Y 的容量为 n2 的样本,Y 与 S22 分别为该样本的样本均值与样本方差。另记 S2 是 S12 与 S22 的加权平均,即令,则有(1);(2);(3)当 12=22=2 时,.,二、一般总体抽样分布的极限分布 如果取消定理 4.2中总体服从正态分布的条件,相应的总体就是非正态总体。对于一般的非正态总体,可以推导出定理 4.2 中的样本函数 U 与 T 的极限分布。定义(P.141)设 Fn(x)为随机变量 Xn 的分布函数,F(x)为随机变量 X 的分布函数,并记 C(F)为由 F(x)的全体连续点组成的集合,若,x C(F),则称随机变量 Xn 依分布收敛于 X,简记为 或。,定理 4.4(P.141)设(X1,X2,X n)为总体 X 的样本,并设总体 X 的数学期望与方差均存在,分别记为EX=,DX=2,再记,其中 X 与 S2 分别为上述样本的样本均值与样本方差。则有(1);(2)。其中 与 0(x)分别表示 Un、Tn 与标准正态分布 N(0,1)的分布函数。,注:比较定理 4.2与定理 4.4的结论,知:当总体 X N(,2)时,成立 和(精确分布);当总体 X 的分布未知、总体方差 2 存在(不一定已知),且样本容量 n 充分大(如 n 50)时,成立 和(近似分布)。,因此,定理 4.4 常用于大样本的情况下,非正态总体参数的统计推断问题(如非正态总体的数学期望 的区间估计和假设检验问题)。如果总体方差 2 已知,而总体数学期望 未知,则利用枢轴量()近似地对总体中的未知参数 进行统计推断(5.3、5.5);如果总体方差 2 和总体数学期望 都未知(但方差 2 存在),则利用枢轴量()近似地对总体中的未知参数 进行统计推断(5.5)。作业:P142:3,4,