《第五章参数估计和假设检验.ppt》由会员分享,可在线阅读,更多相关《第五章参数估计和假设检验.ppt(51页珍藏版)》请在三一办公上搜索。
1、第五章 参数估计和假设检验,推断统计:利用样本统计量对总体某些性质或数量特征进行推断。,随机原则,总体,样本,总体参数,统计量,推断估计,参数估计,检验,假设检验,抽样分布,抽样分布,简单随机抽样和简单随机样本的性质,无限总体,有限总体,不放回,放 回,样本,样本,放回,不放 回,样本,样本,独立性和同一性,同一性,当n/N5%时,有限总体不放回抽样等同于放回抽样,无限总体,统计量与抽样分布,统计量:即样本指标。,样本均值,样本成数,样本方差,如:,抽样分布:,某一统计量所有可能的样本的取值形成的分布。,性 质,数字特征,0P(Xi)1,P(Xi)=1,均值E(X),方差Ex-E(x)2,方差
2、的平方根即抽样分布的标准差就是推断的,抽样误差。,样本均值的抽样分布(简称均值的分布),抽样,总体,样本,均值,X,(N),均值=Xi/N,x,(n),样本均值是样本的函数,,故样本均值是一个统计量,,统计量是一个随机变量,,样本均值的概率分布称为,样本均值的抽样分布。,均值分布的数学期望和方差,抽 样 方 法 均 值 方 差 标 准差,(1)从无限总体抽 样和有限总体放回抽样,(2)从有限总体不放回抽样,抽样误差,抽样误差,从正态总体中抽样得到的均值的分布也服从正态分布。,从非正态总体中抽样得到的均值的分布呢?,中心极限定理:无论总体为何种分布,只要样本n足够大(n30),均值()标准化为(
3、z)变量,必定服从标准正态分布,均值()则服从正态分布,即:,关于均值的抽样分布有如下的一些结论:,1.对于多数总体分布来说,不论其形态如何,如果样本观察值超过30个,那么均值的抽样分布将近似于正态分布。,2.如果总体分布是明显对称的,那么只要样本观察值超过15个,均值的抽样分布也近似于正态分布。,3.如果总体是正态分布的,则不管样本大小如何,均值的抽样分布一定是正态分布的。,两个样本均值之差的抽样分布,抽样,总体,样本,X1,(N1),x1,(n1),抽样,总体,样本,X2,(N2),x2,(n2),估计,(1)如:,(2如果两个总体都是非正态总体,只要n1、n2足够大,根据中心极限定理,可
4、知:,样本成数(即比例)的抽样分布(简称成数的分布),抽样,总体,样本,成数,X,(N),成数P=Ni/N,x,(n),所有可能的样本的成数()所形成的分布,称为样本成数的抽样分布。,成数分布的数学期望和方差,抽 样 方 法 均 值 方 差 标 准差,(1)从无限总体抽 样和有限总体放回抽样,(2)从有限总体不放回抽样,根据中心极限定理,只要样本足够大,的分布就近似正态分布。(np和nq大于5时),抽样误差,抽样误差,两个样本成数之差的抽样分布,抽样,总体,样本,X1,(N1),x1,(n1),抽样,总体,样本,X2,(N2),x2,(n2),估计,当n1、n2都足够大时,样本成数 都近似服从
5、正态分布,两个样本成数之差()也近似服从正态分布。,P1-P2=?,一个样本方差的抽样分布,抽样,总体,样本,若:从一个正态总体中抽样所得到的样本方差的分布,n,S2,则,当,则,两个样本方差之比的抽样分布,抽样,总体,样本,从两个正态总体中分别独立抽样所得到的两个样本方差之比的抽样分布。,n1,S12,则,抽样,总体,样本,n2,S22,参数估计,点估计,以样本指标直接估计总体参数。,评价准则,的数学期望等于总体参数,即,该估计量称为无偏估计。,无偏性,有效性,当 为 的无偏估计时,方差 越小,无偏估计越有效。,一致性,对于无限总体,如果对任意 满足条件,则称,的一致估计。,是,充分性,一个
6、估计量如能完全地包含未知参数信息,即为充分量,估计量,点估计,常用的求点估计量的方法,1.数字特征法:,当样本容量增大时,用样本的数字特征去估计总体的数字特征。,例如,我们可以用样本平均数(或成数)和样本方差来估计总体的均值(或比率)和方差。,2.顺序统计量法:,如果把取得的样本观测值按大小排列起来,那么与排列位置有关的统计量就称为顺序统计量。常用的顺序统计量有样本中位数和极差。,当总体服从正态分布时,用样本中位数来估计总体的数学期望:,3.极大似然估计法:,极大似然估计是根据样本的似然函数对总体参数进行估计的一种方法。其实质就是根据样本观测值发生的可能性达到最大这一原则来选取未知参数的估计量
7、,其理论依据就是概率最大的事件最可能出现。,区间估计,估计未知参数所在的可能的区间。,评价准则,随机区间,置信度,精确度,随机区间,包含,(即可靠程度)越大越好。,的概率,的平均长度,(误差范围)越小越好,一般形式,或,总体参数,估计值,误差范围,:一定倍数的抽样误差,例如:,抽样误差,一定时,,越大,,概率(可靠性)大;,随之增大,,精确度就差。,参数的区间估计,简单随机抽样,待估计参数,已知条件,置信区间,正态总体,2已知,正态总体,2未知,非正态总体,n30,有限总体,n30(不放回抽样),总体均值(),未知时,用S,未知时,用S,两个正态总体,已知,两个正态总体,未知但相等,两个非正态
8、总体,n1,n230,两个总体均值之差1-2,简单随机抽样,待估计参数,已知条件,置信区间,无限总体,np和nq都大于5,总体成数(p),无限总体,n1p15,n1q1 5n2p25,n2q25,两个总体成数之差(P1-P2),有限总体,np和nq都大于5,有限总体,,n1p15,n1q1 5n2p25,n2q25,简单随机抽样,待估计参数,已知条件,置信区间,正态总体,总体方差,两个正态总体,两个总体方差之比,样本数的确定,待估计参数,已知条件,样本数的确定,正态总体,2已知,总体均值(),例:误差范围,简单随机抽样,有限总体,不放回抽样,2已知,总体成数(P),服从正态分布,有限总体,不放
9、回抽样,假设检验,基本思想,检验规则,检验步骤,常见的假设检验,方差分析,基本思想,小概率原理:,如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。,总 体(某种假设),抽样,样 本(观察结果),检验,(接受),(拒绝),小概率事件未 发 生,小概率事件发 生,假设的形式:,H0原假设,H1备择假设,双侧检验:H0:=0,H1:0,单侧检验:H0:=0,H1:0 H0:=0,H1:0,假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝
10、H0,就接受H1。,检验规则,确定检验规则,检验过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝H0;反之,差异不显著,接受H0,差 异,临界点,拒绝H0,接受H0,c,c,判 断,两类错误,接受或拒绝H0,都可能犯错误,I类错误弃真错误,发生 的概率为,II类错误取伪错误,发生 的概率为,检验决策 H0为真 H0非真,拒绝H0 犯I类错误()正确,接受H0 正确 犯II类错误(),怎样确定c?,大就小,小就大,基本原则:力求在控制前提下减少,显著性水平,取值:0.1,0.05,0.01,等。如果犯I类错误损失更大,为减少损失,值取小;如果犯II类错误损失更,值取大。,确定
11、,就确定了临界点c。,设有总体:XN(,2),2已知。,随机抽样:样本均值,标准化:,确定值,,查概率表,知临界值,计算Z值,作出判断,0,接受区,拒绝区,拒绝区,当检验判断为接受原假设H0时,就有可能犯取伪的错误即II类错误。确定犯第类错误的概率比较困难,具体计算可根据书上的例子。统计上把 称为统计检验的势,它是原假设实际上是错误的应该被拒绝的概率。,II类错误的概率的计算,检验步骤,根据具体问题的要求,建立总体假设H0,H1,1,2,选择统计量确定H0为真时的抽样分布,3,给定显著性水平,当原假设H0为真时,求出临界值。,计算检验统计量的数值与临界值比较,4,几种常见的假设检验,总体均值的
12、检验,条件,检验条件量,拒绝域,H0、H1,(1)H0:=0 H1:0,z,(2)H0:=0 H1:0,(3)H0:=0 H1:,z,0,z,0,正态总体2已知,总体均值的检验,条件,检验条件量,拒绝域,H0、H1,(1)H0:=0 H1:0,t,(2)H0:=0 H1:0,(3)H0:=0 H1:,t,0,t,0,0,正态总体2未知(n30),总体均值的检验,条件,检验条件量,拒绝域,H0、H1,(1)H0:=0 H1:0,z,(2)H0:=0 H1:0,(3)H0:=0 H1:,z,0,z,0,0,非正态总体n302已知或未知,两个总体均值之差的检验,条件,检验条件量,拒绝域,H0、H1,
13、(1)H0:1=2 H1:1 2,z,(2)H0:1=2 H1:1 2,(3)H0:1=2 H1:1 2,z,0,z,0,0,两个正态总体,已知,两个总体均值之差的检验,条件,检验条件量,拒绝域,H0、H1,(1)H0:1=2 H1:1 2,t,(2)H0:1=2 H1:1 2,(3)H0:1=2 H1:1 2,t,0,t,0,0,两个正态总体,未知,但相等,两个总体均值之差的检验,条件,检验条件量,拒绝域,H0、H1,(1)H0:1=2 H1:1 2,(2)H0:1=2 H1:1 2,(3)H0:1=2 H1:1 2,0,z,0,0,两个非正态体n130 n230,已知或未知,z,z,总体成
14、数的检验,条件,检验条件量,拒绝域,H0、H1,(1)H0:P=P0 H1:PP0,z,(2)H0:P=P0 H1:PP0,(3)H0:P=P0 H1:PP0,z,0,z,0,0,np5nq5,两个总体成数之差的检验,条件,检验条件量,拒绝域,H0、H1,(1)H0:P1=P2 H1:P1 P2,z,(2)H0:P1 P2 H1:P1 P2,(3)H0:P1 P2 H1:P1 P2,z,0,z,0,0,n1p15n1q15n2p25n2q25,一个总体方差的检验,条件,检验条件量,拒绝域,H0、H1,总体服从正态分布,两个总体方差之比的检验,条件,检验条件量,拒绝域,H0、H1,总体服从正态分
15、布,F,F,F,方差分析,一、问题的提出,同一原材料加工产品质量,产地,各组产品的质量是否有显著差异?,随机 原则,一个班级 的学生,某门课程的成绩,专业 分组,各组学生的成绩是否有显著差异?,差异,随机误差,系统误差,随机 原则,加以比较,若存在显著性差异,则说明该因素的影响是显著的,二、假定条件,各组水平都服从正态分布,均值和方差未知,但方差相同,(i=1,2,3,k),三、单因素方差分析,H0:各水平的均值相等 H1:各水平均值不全相等,总离差平方和=组间离差平方和+组内离差平方和,离差平方和:SST=SSB+SSE,自由度:n-1=k-1+n-k,方差:MST MSB MSE,检验量=
16、系统误差/随机误差即:F=MSB/MSE,检验规则,因为:F=3.15(0.05)所以接受原假设,认为不同的家庭背景对学员成绩没有显著影响。,四、不考虑交互作用的两因素方差分析,H0(A):因素A的k个水平的均值相等 H1(A):不全相等,总离差平方和=组间离差平方和+组内离差平方和,离差平方和:SST=SS(A)+SS(B)+SSE,自由度:kh-1=k-1+h-1+(k-1)(h-1),方差:MST MS(A)MS(B)MSE,检验量=系统误差/随机误差即:F(A)=MS(A)/MSE F(B)=MS(B)/MSE,H0(B):因素B的h个水平的均值相等 H1(B):不全相等,检验规则,因
17、为:F(A)=0.393(0.05)P(B)(0.99)(0.05)所以接受原假设,认为不同的机器设备和不同的工艺方法对生产量都没有显著影响。,五、考虑交互作用的两因素方差分析,H0(A):因素A的k个水平的均值相等 H1(A):不全相等,总离差平方和=组间离差平方和+组内离差平方和,离差平方和:SST=SS(A)+SS(B)+SS(AB)+SSE,自由度:khm-1=k-1+h-1+(k-1)(h-1)+kh(m-1),方差:MST MS(A)MS(B)MS(AB)MSE,检验量=系统误差/随机误差即:F(A)=MS(A)/MSE F(B)=MS(B)/MSE F(AB)=MS(AB)/MSE,H0(B):因素B的h个水平的均值相等 H1(B):不全相等,H0(AB):AB之间不存在交互影响的作用 H1(AB):有交互影响,检验规则,例:,因为:F(A)=7.893.40 F(B)=0.532.51或 P(A)(0.002)(0.05)P(AB)(0.0002)(0.05)所以认为不同的机器设备对日产量有显著影响。不同的工艺方法对日产量没有显著影响。不同机器设备与工艺搭配的交互作用对日产量有显著的影响。,
链接地址:https://www.31ppt.com/p-5683094.html