6.2(统计量与抽样分布).ppt
总体,选择个体,样本,观测样本,样本观察值,(数据),数据处理,样本有关结论,推断总体性质,统计量,统计的一般步骤,这种不含任何未知参数的样本的函数称为统计量.它是完全由样本决定的量.,6.2 统计量与抽样分布6.2.1 统计量定义6.2 设X1,X2,Xn为来自总体X的样本,称不含未知参数的样本的函数g(X1,X2,Xn)为统计量若x1,x2,.,xn为样本观测值,则称g(x1,x2,.,xn)为统计量g(X1,X2,Xn)的观测值.统计量是处理、分析数据的主要工具对统计量的一个最基本的要求就是可以将样本观测值代入进行计算,因而不能含有任何未知的参数,6.2 统计量与抽样分布,【例6.4】设X1,X2,Xn是来自总体X的样本,XN(,2),其中、2为未知参数,则X1,min X1,X2,Xn 均为统计量,但诸如等均不是统计量,因它含有未知参数 或常用的统计量有如下几种:,6.2.1 统计量,1.有关一维总体的统计量 设X1,X2,Xn为总体X的样本,x1,x2,.,xn为样本观测值,(1)样本均值 常用来作为总体期望(均值)的估计量,其观测值为,6.2.1 统计量,(2)样本方差(3)样本标准差 样本方差和样本标准差刻画了样本数据的分散程度,常用来作为总体方差和标准差的估计量.观测值分别为,6.2.1 统计量,(4)样本k阶原点矩(简称样本k阶矩),(k=1,2,)(5)样本k阶中心矩,(k=2,3,)显然Ak和Bk的观测值分别记为,6.2.1 统计量,设(X1,X2,Xn)是来自总体X的一个样本,则,定理6.1 设总体X的期望E(X)=,方差D(X)=2,X1,X2,Xn为总体X的样本,S2分别为样本均值和样本方差,则,6.2.1 统计量,由辛钦大数定理和依概率收敛的性质可以证明定理6.2 设总体X的k阶原点矩E(X k)=k存在(k=1,2,m),X1,X2,Xn为总体X的样本,g(t1,t2,tm)是m元连续函数,则特别有,6.2.1 统计量,2.有关二维总体的统计量 设(X1,Y1),(X2,Y2),(Xn,Yn)为二维总体(X,Y)的样本,其观测值为(x1,y1),(x2,y2),(xn,yn),则下列各量为统计量:(1)样本协方差(2)样本相关系数其中SXY和RXY常分别用来作为总体X和Y的协方差Cov(X,Y)与相关系数XY的估计量,6.2.1 统计量,6.2 统计量与抽样分布,6.2.2 抽样分布 统计量的分布称为抽样分布为了研究抽样分布,先研究数理统计中三种重要的分布,1.2分布 定义6.3 设X1,X2,Xn为相互独立的随机变量,它们都服从标准正态N(0,1)分布,则称随机变量服从自由度为n的2分布,记为2 2(n)此处自由度指2中包含独立变量的个数可以证明,2(n)的概率密度为其中()称为伽马函数,,6.2.2 抽样分布,2分布概率密度 图6-9 2(n)分布的概率密度曲线可以看出,随着n的增大,的图形趋于“平缓”,其图形下区域的重心亦逐渐往右下移动,6.2.2 抽样分布,2分布具有下面性质:(1)(可加性)设 是两个相互独立的随机变量,且(2)设 证明(1)由2分布的定义易得证明(2)因为 存在相互独立、同分布于N(0,1)的随机变量X1,X2,Xn,使则,6.2.2 抽样分布,由于Xi独立,且注意到N(0,1)的四阶矩为3,可得 英国统计学家费歇(R.A.Fisher)曾证明,当n较大时,近似服从,6.2.2 抽样分布,2.t分布定义6.4 设X N(0,1),Y 2(n),X与Y独立,则称随机变量 服从自由度为的t分布,又称为学生氏分布(Student distribution),记为T t(n)可以证明t(n)的概率密度为 图6-10 t分布的概率密度曲线,6.2.2 抽样分布,图6-10 t分布的概率密度曲线 显然t分布的概率密度是x的偶函数,图6-10描绘了n=1,3,7时t(n)的概率密度曲线作为比较,还描绘了N(0,1)的概率密度曲线,6.2.2 抽样分布,可看出,随着n的增大,t(n)的概率密度曲线与N(0,1)的概率密度曲线越来越接近可以证明t分布具有下面性质:即当n趋向无穷时,t(n)近似于标准正态分布N(0,1)一般地,若n 30,就可认为t(n)基本与N(0,1)相差无几了,6.2.2 抽样分布,3.F分布定义6.5 设X2(n1),Y2(n2),且X与Y独立,称随机变量 服从自由度为(n1,n2)的F分布,记为FF(n1,n2)可以证明的概率密度函数为,6.2.2 抽样分布,6.2.2 抽样分布,图6-11 F分布的概率密度曲线 由F分布的定义容易看出,若F F(n1,n2),则1/F F(n2,n1),4.正态总体的抽样分布定理 在数理统计问题中,正态分布占据着十分重要的位置,一方面因为在应用中,许多随机变量的分布或者是正态分布,或者接近于正态分布;另一方面,正态分布有许多优良性质,便于进行较深入的理论研究因此,我们着重讨论正态总体下的抽样分布,给出有关最重要的统计量样本均值和样本方差S2的抽样分布定理,6.2.2 抽样分布,定理6.3 设X1,X2,Xn为来自总体N(,2)的样本,S 2分别为样本均值和样本方差,则有(1)(2)(3)与S 2相互独立;(4)证明:由正态分布的性质容易得到(1),略去(2)和(3)的证明,下面仅证明4.,6.2.2 抽样分布,证明(4):由(1)知,从而 由(2)(3)知 根据t分布的定义,6.2.2 抽样分布,【例6.5】某厂生产的灯泡寿命近似服从正态分布N(800,402),抽取16个灯泡的样本,求平均寿命小于775小时的概率.解:设灯泡寿命总体为X,因为XN(800,402),n=16,所以样本均值 故,6.2.2 抽样分布,【例6.6】设总体XN(,102),抽取容量为n的样本,样本均值记为 欲使 与 的偏差小于5的概率大于0.95,样本容量n至少应该取多大?解:依题令,即因为总体,从而所以即查表知,由于 单调不减,应有 故n至少应该取为16,6.2.2 抽样分布,【例6.7】设X1,X2,Xn为总体X N(,2)的样本,求样本方差的均值和方差 解:本题可以通过2分布的均值和方差简单求出由定理6.3,所以有 于是,6.2.2 抽样分布,6.2.3 分位数 设X为一随机变量,我们知道对于给定的实数x,PX x是事件X x的概率在统计中,我们常常需要对给定事件X x的概率,由此确定的x取是一个临界点,称为分位数(点),有如下定义:定义6.6 设X为随机变量,若对给定的(0,1),存在x满足 PX x=,则称x为X的上 分位数(点),6.2 统计量与抽样分布,若X具有密度f(x),PX x=说明分位数x右边的一块阴影面积为,即 容易看出,X的上分位数x是关于 的减函数,即增大时x减少.下面给出几种常用分布的上分位数的求法:,6.2.3 分位数,1.设Z N(0,1),记N(0,1)的上分位数为z,即有PZ z=.由于(z)=PZ z=1 PZ z=1,由标准正态分布函数表(附表2)反过来查,即可以得到z的值.为使用方便,表6-1列出了标准正态分布的几个常用分位数z的值,6.2.3 分位数,由N(0,1)的概率密度的对称性(见图6-13)可知所以 z1-=z 图6-13 z1-与z,6.2.3 分位数,2.设2 2(n),记2(n)的上分位数为2(n),即有P2 2(n)=.附表3中给出了时2(n)的值,当n40时,由2(n)的渐近性质,有,6.2.3 分位数,3.设T t(n),记t(n)的上分位数为t(n),即有PT t(n)=;由t(n)的概率密度的对称性t1-(n)=t(n)图6-14 t1-(n)与t(n)附表4中给出了 时t(n)的值,当n40 时,由于t(n)近似N(0,1),所以t(n)z,6.2.3 分位数,4.设F F(n1,n2),记F(n1,n2)的上分位数为F(n1,n2),即有 PF F(n1,n2)=附表5中给出部分F(n1,n2)的值.另外,由于FF(n1,n2)时,1/F F(n2,n1),所以故,6.2.3 分位数,【例6.8】求下列分位数:(1)z0.025;20.5(20);t0.1(25);F0.05(10,15);(2)t0.975(4);(3)t0.05(55);(4)F0.9(14,10);(5)20.975(200).,6.2.3 分位数,【例6.9】设X1,X2是总体X N(1,2)的样本,试求概率P(X1 X2)2 20.08 解法一:因为X N(1,2),所以Xi N(1,2),i=1,2,从而记,所以查表知,即 所以,6.2.3 分位数,【例6.9】设X1,X2是总体X N(1,2)的样本,试求概率P(X1 X2)2 20.08 解法二:因X N(1,2),所以从而,6.2.3 分位数,由定理6.3容易证明下述有关两个总体的抽样分布定理定理6.4 设,分别为来自N(1,12)和N(2,22)的样本,且它们相互独立,设,S12,S22,分别为相应样本的样本均值和样本方差,则(1)(2),6.2.3 分位数,(3)当 时,其中,6.2.3 分位数,【例6.10】设X1,X2,X25,Y1,Y2,Y25分别为来自两个独立总体N(0,16)和N(1,9)的样本,和 分别表示相应的样本均值,求 解:因为,且相互独立,所以故=1 0.8413=0.1587,6.2.3 分位数,【例6.11】若从方差相等的两个正态总体中分别抽出n1=8和n2=12的独立样本,样本方差分别为S12和S22,求 解:由于,n1=8,n2=12,所以因此 查表知F0.01(7,11)=4.89,即PF 4.89=0.01,故,6.2.3 分位数,