研究生统计学讲义第3讲总体均数估计和假设检验.ppt
《研究生统计学讲义第3讲总体均数估计和假设检验.ppt》由会员分享,可在线阅读,更多相关《研究生统计学讲义第3讲总体均数估计和假设检验.ppt(47页珍藏版)》请在三一办公上搜索。
1、第四章 第一节 总体均数的估计,一.样本均数的分布和 t 分布(P49),在抽样研究中,即使是严格遵守随机抽样原则,从同一总体中每次抽取样本含量相等(都为n)的样本,计算每一个样本的样本均数,由于变异存在,样本均数有大有小,不尽相同,是随机变量,其分布称为样本均数的分布。这里介绍样本均数的两条常用性质:,情形当抽样来自均数为,方差为 的正态分布总体时,样本均数的分布(抽样分布)有下面的性质,1.的分布是正态的,2.设 分布的均数是,则=,3.设 的方差是,则=,是总体标准误.,情形 当抽样来自均数为,方差为 的非正态分布总体时,样本均数的分布(抽样分布)有下面的性质:,1 的分布是近似正态的,
2、随样本容量的增加,靠近正态的程度就越好一般地,的抽样分布靠近正态分布所需要的样本容量取决于最初分布的外形在几乎所有的情形里面,对 的抽样分布,样本容量在30或以上就可以得到很好的正态近似(均数的这个性质就是众所周知的中心极限定理Central Limit Theorem),2.设 分布的均数是,则=,3.设 的方差是,则=,是总体标准误.,由第1条(均数抽样分布的正态或近似正态)将在后面推出强有力的统计推论两种情形中的第3条表明,与个体观测值相比较,样本均数是变化较小的变量,那是因为标准误总是比标准差小的缘故,二、t 分布,在公式,中用,代替,得到:,用 S 替换产生了一个不同的样本分布如果值
3、未知又必须估计它,用估计值替换所得变量的分布称为 t 分布这个分布是19世纪在英国Guinness 啤酒厂工作的发现,在1908年以笔名“Student”发表因此有时称为Students t 分布,这个分布族取决于参数n1,(4-4),是具有=0,=1的标准正态分布,而 是具有=0,取决于样本容量的t 分布随样本容量的增加,t 分布渐近标准正态分布见图,,t 分布的准确外形取决于被称为自由度(degrees of freedom)的数量像正态分布一样,t 分布是对称的钟形曲线,但是有点平坦,例如,它们有大的标准差对任何t 分布,自由度恰好是样本容量减1:df=n1,作为为多个t 分布的部分累积
4、分布函数的比较已经列在附表 5 里,因为t 分布是概率密度函数,任何t 分布曲线下的面积为1在某些情形,我们必须使用固定概率(一个t 分布下的面积),留心并找出区间端点到中心0的这个概率,设这个概率是1,常常很小,规定为0.05或0.01,于是1=0.95或0.99那么为寻找这个t 0,使得,t 分布里,定位在中间的面积1,t 分布有两条重要性质:(1)从正态总体中每次随机抽取例数为n的样本,按(式4-4)计算的统计量服从自由度为df=n-1的t分布(即样本均数与总体均数相差多少个标准误服从自由度为n-1的t分布)。(2)从相互独立,总体均数分别为1,2,而标准差都为的两个正态总体中,随机抽取
5、样本含量分别为n1,n2的两个样本,分别算出样本均数和标准差为X1和S1,X2和S2,按(式4-5)计算的统计量服从自由度为df=n1+n22的t分布。,t=,自由度df=n1+n22(式4-5),S=,(式4-6),2T 分布的规律 如附表3的 t 界值表(表中只列出正的t值),表中横标目为自由度df,纵标目为概率P,表中数字表示自由度为df时t分布的界值(critical value)。t界值有单侧和双侧两种情况:自由度为df时,t分布的双侧界值记为t/2,df,P(|t|t/2,df)=;t分布的单侧界值记为t,df,P(tt,df)=。例如,自由度df9时,由附表3的t界值表查出0.0
6、5的单侧界值t0.05,91.833,双侧界值t0.05/2,92.262,则有:P(t1.833)0.05;P(t 1.833)P(t2.262)0.025;P(t 2.262)P(-2.262 t 2.262)1-20.0250.95。,从 t 分布的界值与标准正态分布的界值可发现,同样的尾部面积,t分布的界值要大于标准正态分布的界值,当自由度df时,t 分布的界值逼近标准正态分布界值。,三.总体均数的估计(P 51),1点估计和区间估计 总体参数的估计有点估计和区间估计。由样本观察值算出总体参数的一个估计值(为统计量)称为该参数的一个点估计(point estimation)。点估计给出
7、未知参数的一个近似值,但没考虑试验误差影响,也未指出这种估计的可靠程度。因为估计量是来自一个随机抽取的样本,每一次取值都有随机性,刚好等于待估计参数的可能性极小,而在参数值左右的情况较多。统计学上更合理的估计是在一定概率(1-)下,由含有未知参数及其点估计值所构成的统计量的分布规律估计出参数可能存在的范围,称为区间估计,(interval estimation),所给出的范围称为该参数的(1-)可信区间或置信区间(confidence interval,简记为CI)。这个范围包含参数值的可靠程度为(1-),称为可信度或置信度(confidence degree)或可信概率。,2可信区间的意义
8、现以总体均数的95%可信区间为例,总体参数95%可信区间的意义是:考虑总体参数的可信区间取决于所抽取的样本,在同样条件下,进行许多重复的抽样,每抽取一个样本可得到待估计参数的一个可信区间,在这些区间中,有的包含待估计的参数,有的不包含,平均说来每100个中有95个正确。,实践中一般不会去抽取许多个样本,通常只抽取一个样本,计算出一个区间,虽然无法确认这个区间是否包含了待估计的参数,但可知这种估计可信的程度为95,会冒5%犯错误的风险。因5%是小概率,在实际应用中就认为待估计的总体参数在算得的区间内。,3可信区间有两要素:一是准确度,反映在可信度(1-)的大小,即区间包含总体参数的可能性(概率)
9、的大小,准确度越接近1越好,例如,可信度99%比95%犯错误的风险小;二是精密度,反映在区间的长度,区间的长度愈小愈精密。在可信度确定的情况下,增大样本含量,相应的界值(如t界值)减少,标准误也减小,可减小区间长度,提高精密度。在样本含量确定的情况下,可信度(1-)愈大,总体参数估计的准确度愈高,但精密度愈差。二者是矛盾的,为兼顾准确度和精密度,常用95%可信区间。,4.单个总体均数的估计 样本均数是总体均数的一个点估计。已知时,按(式4-3)计算的统计量服从标准正态分布,根据标准正态分布的规律 P(-u/2 u u/2)=1-,有,已知时,正态总体均数的双侧(1)可信区间计算公式为(4-7)
10、,未知时,按(式4-4)计算的统计量服从 t 分布,由t分布的规律 P(-t/2tt/2)=1-,而往往未知,有了抽样分布,对任何样本,在预先不知道总体特性的任何知识时,利用抽样分布可以产生总体均数的置信区间,解这个不等式,把关心的参数从中间分离出来,就得到置信度为1的总体均数的置信区间为:,注意t 0和t 0由自由度n1和置信水平确定,和 来自样本自身,所以在没有任何额外知识的情况下就能够确定置信区间,(4-8),t0=t/2,例4.2 从同一批号的逍遥丸中随机抽检5丸,测得其崩解时间(月)为21,18,20,16,15。已知药丸崩解时间服从正态分布,求该批药丸崩解时间总体均数的95%、99
11、%可信区间。,解:5个观测值的样本均数=18,标准差s=2.55,df=5-1=4,查 t 界值表,双侧 t0.05(4)=2.776,t0.01(4)=4.604,则这批药丸崩解时间总体均数的95%可信区间为(14.83,21.17)月,99%的可信区间为(12.75,23.25)月。,置信区间(confidence internal)的意义 在样本被抽出之前计算总体均数的一个置信区间,人们声称在给定的概率下它包含在样本抽出后所计算的置信区间,如同前面所述,它或者包含(P=1)或者不包含(P=0),这就是在公式里使用C(confidence)而不是概率P(probability)的理由换句话
12、说,全部区间的95%实际上包含了见图,具有n=?,科学论文或实验报告中报道一个样本均数时,需要列出平均数加标准误和样本容量,(右上公式)用这种方式报道均数,允许读者作出自己的置信区间来解释统计量与参数的关系,置信区间的两要素 置信区间有两个要素,一是准确度,反映置信度(1-)的大小,即区间包含总体均数的可能性(概率)的大小,准确度越接近1越好,例如,置信度99%比95%犯错误的风险小;二是精密度,反映区间的长度,区间的长度愈小愈精密。在样本含量确定的情况下,二者是矛盾的,不能笼统地认为99%置信区间比95%置信区间好,需要兼顾准确度和精密度。在置信度确定的情况下,一般来说,增大样本含量,相应的
13、界值(如t界值)减少,标准误也减小,可减小区间长度,提高精密度。一般情况下,常用95%可信区间。,置信区间和置信限,95%置信区间,CI,CL,第二节 假设检验,一、假设检验的的基本思想,假设检验(hypothesis testing)亦称显著性检验(significance test),它和参数估计是统计推断的两个重要内容。假设检验是先对总体的特征(如总体的参数或分布、位置)提出某种假设(hypothesis),如假设总体均数(或总体率)为一定值、总体均数(或总体率)相等、总体服从某种分布、两总体分布位置相同等等,然后根据随机样本提供的信息,运用“小概率原理”推断假设是否成立。假设检验通过随
14、机样本认识总体的结论有助于作出正确的专业结论。,所谓小概率原理,就是“在一次试验中,概率很小(接近于零)的事件认为是实际上不可能发生的事件”。例如,假设在1000支复方大青叶注射液针剂中只有一支是失效的,现在从中随机抽取一支,则取得“失效的那支”概率为1/1000,这个概率是很小的,因此,可以认为在一次抽取中是不会发生的,若从中任取一支恰好为“失效的那支”,我们就有理由怀疑“失效概率为1/1000”的假设不成立,而认为失效率不是1/1000,从而否定假设。否定假设的依据就是小概率原理。,例4.3 已知正常成年男子脉博平均为72次/分,现随机检查20名慢性胃炎所致脾虚男病人,其脉博均数为75次/
15、分,标准差为6.4次/分,能否认为此类脾虚男病人的脉博快于健康成年男子的脉博?,这里,两个均数的差异有两种可能:,(1)差异完全由抽样误差引起,即总体是相同的,这类脾虚男病人的脉博均数()与健康人(0=72次/分)相同,=0,=75次/分与0=72次/分的差别完全是抽样误差造成的;,(2)差异主要因总体不同所致,即这类脾虚病人的脉博均数()与健康人(0=72次/分)不同,72次/分,对于这两种可能,统计上通过检验前一种可能来作出判断,假设检验的目的是排除差异完全由抽样误差所致的可能性。方法是:先假设差异完全由抽样误差所致,在这个假设下,计算检验统计量(如t值、u值等),按样本统计量的概率分布规
16、律,求出获得现有样本检验统计量值的概率,如果出现了小概率事件,就拒绝这个假设;如果没有出现小概率事件,则没有理由怀疑这个假设,所以不拒绝这个假设。这种推断方法的特点是依据小概率原理,采用类似于数学中逻辑论证的反证法,但又区别于纯数学中逻辑推理的反证法。因为这里并不是形式逻辑中的绝对矛盾,而是基于人们在实践中广泛应用的小概率原理。所以,可以说假设检验的基本思想是某种带有概率性质的反证法。,假设检验有两种类型:(1)参数检验(nparametric):在许多问题中,总体分布的类型为已知,只是一个或几个参数未知,只对未知参数作出假设,然后根据随机样本提供的信息,选取检验统计量,按检验统计量的分布规律
17、,用“小概率原理”推断假设是否成立。,绍的 t 检验、u 检验,第五章介绍的方差分析等。,(2)非参数检验(nonparametric):是一种与总体分布无关的统计检验方法,它不比较参数,而是比较分布的位置。当不知道样本来自的总体分布类型或已知总体分布与检验所要求的条件不符,可用非参数检验。详见第十一章。,二、假设检验的一般步骤,1.建立假设并确定检验水准,(1)建立假设:,假设需根据研究的目的对总体的特征而提出。假设有两种:一种是检验假设(hypothesis to be tested),假设差异完全由抽样误差造成,常称无效假设(hull hypothesis),用H0表示。,另一种是和H0
18、相对立的备择假设(alternative hypothesis),用H1表示,H1通常是希望证实的情况。假设检验是针对H0进行的,希望用样本数据推断H0是假的,从而证实H1是真的。假设检验的结果是在零假设H0和对立假设H1之间作出抉择。当拒绝H0时,接受H1,认为差异有统计意义;当不拒绝H0时,认为差异无统计意义,则不接受H1。,建立假设涉及检验方向:以H0为准,如果根据专业知识或研究目的,H1不能肯定方向,则假设检验的方向是双侧的,称为双侧检验(two sided test)。如果根据专业知识或研究目的,H1肯定方向,则假设检验方向是单侧的,称为有单侧检验(one sided test)。也
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 研究生 统计学 讲义 总体 估计 假设检验
链接地址:https://www.31ppt.com/p-5806378.html