欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    统计假设检验的思想.ppt

    • 资源ID:4993564       资源大小:229.50KB        全文页数:15页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计假设检验的思想.ppt

    ,统计假设检验的概念和思想方法,引 言,前一章中我们讨论了如何根据样本去得到总体分布中所含参数的最优(优良)估计。用参数估计方法得到的总体参数的优良估计值,去代替总体分布的未知参数而得到的“总体”,与真的总体作比较,就要考察它们之间是否在统计意义上相拟合,尽管这种比较也只能在样本的基础上进行。那么,怎样在样本的基础上做出一个有较大把握的结论,就是统计假设检验问题。事实上,实际中很多统计问题都可以作为统计假设检验问题予以解决。,一.假设检验的概念,我们来看一个例子。例1:设某厂生产一种灯泡,其寿命服从 的正态分布,从过去较长一段时间的生产情况看,灯泡的平均寿命 小时。现在采取新工艺后,在所生产的灯管中抽取25只测得平均寿命为1650小时。问:采用新工艺后,灯管的寿命是否有显著提高?本例的问题就是要我们判断:新产品的寿命是:1、服从 正态分布呢?还是 2、仍然服从 的正态分布呢?若 新产品的寿命是服从 的正态分布,就说“新产品的寿命 有显著提高”;若新产品的寿命是仍然服从 的正态分布,就说“新产品的寿命 没有显著提高”。,在上面的例子中,我们可以把涉及到的两种情况用统计假设的形式表示出来。第一个统计假设:。称为原假设,用符号:表示。,表示“采用新工艺后,灯管寿命没有显著提高。”即“和老产品一样,服从均值为1500的正态分布”。第二个统计假设:。称为备选假设,用符号:表示。,表示“采用新工艺后,灯管寿命有显著提高。”即“不同于老产品,服从均值大于1500的正态分布”。今后,我们把任意一个有关总体分布不确定的假设 称为统计假设或简称假设。,至于在两个假设中用哪个作为原假设,哪个作为备选假设呢?要看具体的目的和要求而定。(1)一般,假如我们的目的是希望从样本观测值对某一陈述取得强有力的支持,我们就将这一陈述的否定作为原假设,而把陈述本身作为备选假设。对例1我们作的统计假设就是这样的。因为,新工艺是延长灯泡寿命的一种革新,我们当然希望新工艺能使灯泡的寿命确有提高,但它又不象老产品那样有较多的数据。为此,我们以“即寿命没有提高”作为原假设,以“寿命显著提高”作为备选假设。(2)有时,原假设的选定还要考虑数学上的处理方便。在许多问题中,总体分布的类型为已知,仅仅是其分布函数中的一个或几个参数为未知,只要对这一个或几个参数的值作出假设,就可以完全确定总体的分布。如上例只要对 作出假设即可。这种仅涉及到总体分布的未知参数的统计假设 称为:参数假设。在有些实际问题中,我们不知道总体分布的具体类型。比如:某种蔬菜的农药残留量,它可能服从对数正态分布,也可能服从其它分布。因此,对它的统计假设就只能对未知分布的类型或它的某些特征提出某种假设。这种不同于参数假设的统计假设称为:非参数假设。例如:设某种蔬菜的农药残留量X 的分布函数为 F(x),F(x)对数正态分布族;F(x)正态分布族 都是 非参数假设。,从上面我们看到,一个统计假设是对总体分布状态的一种陈述。如果一个统计假设可完全确定总体的分布,则称这种假设为:简单统计假设 或 简单假设。否则,称为:复合统计假设 或 简称 复合假设。例如:完全确定总体的分布,是简单假设;而:是复合假设。统计假设检验问题 的 一般提法是:在给定备选假设下,对原假设作出判断。若拒绝原假设,那就意味着接受备选假设;否则,就接受原假设。简单地说,统计假设检验问题,就是要在原假设 备选假设 中作出拒绝哪一个接受哪一个的判断。这类假设检验问题常称为 对 的检验问题。,小结:,统计假设,参数假设,非参数假设,复合假设,简单假设,原假设,备选假设,拒绝,在 对 的检验问题中,要作出某种判断,必须从样本 出发,制定出一个“法则”,一旦样本观测值确定后,我们就可以用所构造的“法则”作出:拒绝,还是拒绝 的判断。那么我们的检验“法则”是什么呢?它应该是以定义在样本空间 上的一个样本函数为依据所构成的一个“准则”。一旦样本观测值确定后,我们就可以根据这个“准则”作出:“拒绝”,还是“拒绝 的”判断。,二、假设检验的思想方法,我们的检验准则本质上就是:把样本空间划分成两个互不相交的子集 和,(子空间)使得当样本观测值点 时,我们就将拒绝原假设(也即接受备选假设);否则,我们将接受原假设(也即拒绝备选假设)。这样的划分构成一个准则,我们称这样的样本空间的子集 为假设检验的临界域(或 拒绝域)。,拒绝,接受,接受,n维空间,拒绝,划分,反之,一旦我们给出了某个检验“准则”,也就给出了样本空间的一个“划分”。由于样本的随机性,在进行判断时,我们还是有可能犯 两类错误:,拒绝,接受,接受,n维空间,拒绝,真,假,第一类错误 拒真、弃真,第二类错误受假、受伪,划分,第一类(弃真、拒真)错误发生的概率称为犯第一类错误的概率 或 拒真概率。通常记为,即:P(拒绝|为真)=第二类(受假、受伪)错误发生的概率称为犯第二类错误的概率 或 受伪概率。通常记为,即:P(接受|为假)=。也就是:P(拒绝|为真)=,对于给定的一对假设 和,总可以找出许多临界域。当然,我们希望寻得这种临界域-使犯两类错误的概率 和 都很小。但在样本容量固定时,要使 和 都很小是不可能的。否则,将会导致样本容量的无限增大,这又是不现实的。基于这种情况,奈曼与皮尔逊(NeymanPearson)提出了一个原则:在控制犯第一类错误的概率的条件下,尽量使犯第二类错误的概率小。之所以提出这样的原则,是因为人们常常把错误地拒绝 比错误地接受 看得更重要些。尽管基于奈曼与皮尔逊的这一原则可以去讨论寻找最优检验的问题,但是有时最优检验法则很难找到,甚至可能不存在。因而,我们不得不将奈曼与皮尔逊的这一原则放宽:只对犯第一类错误的概率 加以限制,而不考虑犯第二类错误的概率。如此,在寻找临界域时只涉及原假设,而不涉及备选假设。这种只涉及原假设的统计假设检验问题 称为 显著性假设检验问题。,下面我们来讨论,对给定的犯第一类错误的概率(显著性水平)在显著性假设检验问题中,如何来构造一个检验“法则”?如果一个检验法则已经确定,那么临界域 及其补集 就完全确定了。在实践中为了能简化数据,总是去寻找这样一个统计量或样本函数,并记 及于是 P(为真)=P(|为真)=这样就可以做出等价的判断:当 时,就拒绝;否则,就接受。如此,就把对样本空间的划分问题转化为对统计量的值域空间的划分问题。由于样本空间是 n 维的,而统计量的值域空间是 1 维 的,所以通过构造合适的统计量可以使寻找临界域的问题变得简单多了。,拒绝,拒绝,接受,接受,n维空间,拒绝,划分,值得注意的是,如果我们构造的统计量 t 的分布类型已知,只是它的分布参数 不确定,那么在原假设 成立的条件下,对给定的显著水平 a,可以通过等式 P(为真)=a 来定出区域,从而得到临界域 C。,譬如,我们还拿例1来看:如果原假设:成立(为真),那么在新工艺下的灯泡的平均寿命。在重复取样下,的取值偏离1500较大的较少。那么由抽取的样本观测值算出的 比1500大到什么程度,我们才认为这组样本观测值已经不是从 成立所规定的总体中抽出的呢?我们取 检验统计量,易知,在 为真时,。对给定的显著水平 a,由,可定出一个值,使得由样本观测值算出的 时就拒绝,否则就接受。那么,临界域,比如取,查标准正态分布表知,从而得到临界域:=而实际上,在采用新工艺后,对25只灯泡的平均寿命观测值;显然 1566,这组样本落入了临界域(拒绝域)C,因此我们就拒绝原假设,并且说:与1500有显著差异。,那么,为什么能做出拒绝 的决定呢?或者,换句话说,为什么能把 作为临界域C呢?因为,在 下,这意味着“”是一个小概率事件。根据小概率事件在一次试验中实际不可能发生的推断原理,现在在一次试验(观察)中竟然出现了,所以我们甘愿冒犯第一类错误的风险而拒绝原假设。下面,我们来归纳一下解题的思路和步骤:1根据问题的要求建立原假设 和备选假设。2选取一个合适的统计量,一般以简单为好,并且它的分布已知(不含未知参数)从而可算出或查出分位点。3给定显著性水平(一般较小,如0.05,0.01等),并在原假设为真时求出能使 成立的 值,从而求出临界域。4若由样本观测值计算出的统计量值,即样本落入临界域,则拒绝原假设,否则接受。,总 结,1.统计假设:对总体分布类型未知或分布参数未知而作的假设。分为:参数假设、非参数假设,简单假设、复合假设;原假设和备选假设 2.统计假设检验问题:原假设对备选假设的检验问题。要作出拒绝原假 设还是拒绝备选假设的判断问题。3、统计假设检验中的判断性错误有两类:第一类错误:拒真、弃真错误;第二类错误:受假、受伪错误。4、统计假设检验的思想方法:本质是:对样本空间的划分,从而确定临界域。通过选择或构造合适的统计量,来简化对样本空间进行划分的复杂问题。5、显著性假设检验:是只考虑犯第一类错误的概率的最简单的统计假设检验。解题步骤分为四步:建立假设、构造统计量、确定临界域、作出判断。判断的理论依据是“小概率事件的实际不可能性原理”。,

    注意事项

    本文(统计假设检验的思想.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开