统计推断.ppt
《统计推断.ppt》由会员分享,可在线阅读,更多相关《统计推断.ppt(36页珍藏版)》请在三一办公上搜索。
1、1,统计推断,从数据得到对现实世界的结论的过程,2,估计,总体代表我们所关心的那部分世界。而在利用样本中的信息来对总体进行推断之前人们往往对代表总体的变量假定了分布族。(描述数据时不用假定)比如假定人们的身高属于正态分布族;在抽样调查时假定了二项分布族等等(这些假定可能有风险!)。这些模型基本上是根据“经验”来假定的,仅仅是对现实世界的一个近似。,3,估计,在假定了总体分布族之后,进一步对总体的认识就是要在这个分布族中选择一个适合于我们问题的成员由于分布族成员是由参数确定的,如果参数能够估计,对总体的具体分布就知道得差不多了。,4,估计量是用来估计的统计量,我们知道,统计量是样本的不包含未知参
2、数的函数。样本均值、样本标准差都是统计量。由于样本是随机的,统计量也是随机变量。用于估计总体参数的统计量称为估计量;样本均值和标准差都是总体均值和标准差的常用估计量。,5,点估计和区间估计,点估计(point estimation)就是用估计量的实现值来近似相应的总体参数。区间估计(interval estimation)是包括估计量在内(有时是以估计量为中心)的一个区间;被认为很可能包含总体参数。点估计给出一个数字,用起来很方便;而区间估计给出一个区间,说起来留有余地;不象点估计那么绝对。无偏估计(大样本性质),6,区间估计,注意置信区间的论述是由区间和置信度两部分组成。置信区间是对参数给出
3、的一个范围置信度为其可信程度(大样本意义)有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),比如“收视率为53%3%”;不给出置信度,也不给出被调查的人数这是不负责的表现。,7,区间估计,降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。如果给出被调查的人数,则内行可以由此推算出置信度,反之亦然。,8,一个描述性例子,一个有10000个人回答的调查显示,同意某种观点的人的比例为70%(有7000人同意),可以算出总体中同意该观点的比例的95%置信区间为(0.691,0.709);另一个调查声称有70%的比例反对该种观点,还说总体中反对该观点的置信区间也是(0.691,0
4、.709)。,9,一个描述性例子,实际上,第二个调查隐瞒了置信度(等价于隐瞒了样本量)。如果第二个调查仅仅调查了50个人,有35个人反对该观点。根据后面的公式可以算出,第二个调查的置信区间的置信度仅有11%。,10,区间估计的意义,置信度的概念大量重复抽样时的一个渐近概念。类似于“我们目前得到的区间(比如上面的75%3%)以概率0.95覆盖真正的比例p”的说法是错误的。实际上应该说“重复类似的抽样所得到的大量区间中有大约95%的覆 盖真实比例(其值可能永远未知)。,11,区间估计的意义,这里的区间(72%,78%)是固定的,而总体比例p也是固定的值。因此只有两种可能:或者该区间包含总体比例,或
5、者不包含;这当中没有任何概率可言。至于区间(72%,78%)是否覆盖真实比例,除非一个不漏地调查所有的人,否则永远也无法知道。,12,假设检验,在假设检验中,一般要设立一个原假设;而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设和现实的矛盾,从而否定这个假设。,13,假设检验,在多数统计教科书中(除了理论探讨之外),假设检验都是以否定原假设为目标。如否定不了,那就说明证据不足,无法否定原假设。但这不能说明原假设正确。很多教科书在这个问题上不适当地用“接受原假设”的说法,犯了明显的低级逻辑错误。,14,假设检验的过程和逻辑,首先要提出一个原假设,比如某正态总体的均值等于5(
6、m=5)。这种原假设也称为零假设(null hypothesis),记为H0与此同时必须提出对立假设,比如总体均值大于5(m5)。对立假设又称为备选假设或备择假设(alternative hypothesis)记为记为H1或Ha,15,假设检验的过程和逻辑,根据零假设(不是备选假设!),我们可以得到该检验统计量的分布;然后再看这个统计量的数据实现值(realization)属不属于小概率事件。也就是说把数据代入检验统计量,看其值是否落入零假设下的小概率范畴如果的确是小概率事件,那么我们就有可能拒绝零假设,否则我们说没有足够证据拒绝零假设。,16,假设检验的过程和逻辑,注意:零假设和备选假设在我
7、们涉及的假设检验中并不对称。检验统计量的分布是从零假设导出的,因此,如果有矛盾,当然就不利于零假设了。不发生矛盾也不说明备选假有问题。,17,假设检验的过程和逻辑,检验统计量在零假设下,等于这个样本的数据实现值或在备选假设方向上更加极端值的概率称为p-值(p-value)。显然得到很小p-值意味着小概率事件发生了。如果小概率事件发生,是相信零假设,还是相信数据呢?当然是相信数据。于是就拒绝零假设。但事件概率小并不意味着不会发生,仅仅发生的概率很小罢了。拒绝正确零假设的错误常被称为第一类错误(type I error)。,18,假设检验的过程和逻辑,不仅有第一类错误,还有第二类错误;那是备选假设
8、正确时反而说零假设正确的错误,称为第二类错误(type II error)。如要“接受零假设”就必须给出第二类错误的概率.但对于目前面对的问题,无法计算它.,19,假设检验的过程和逻辑,零假设和备选假设哪一个正确,这是确定性的,没有概率可言。而可能犯错误的是人。涉及假设检验的犯错误的概率就是犯第一类错误的概率和犯第二类错误的概率。负责的态度是无论做出什么决策,都应该给出犯错误的概率。,20,假设检验的过程和逻辑,到底p-值是多小才能够拒绝零假设呢?也就是说,需要有什么是小概率的标准。这要看具体应用的需要。但在一般的统计书和软件中,使用最多的标准是在零假设下(或零假设正确时)抽样所得的数据拒绝零
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 推断
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5430580.html