统计学课件-ch03总体均数的估计与假设检验.ppt
《统计学课件-ch03总体均数的估计与假设检验.ppt》由会员分享,可在线阅读,更多相关《统计学课件-ch03总体均数的估计与假设检验.ppt(126页珍藏版)》请在三一办公上搜索。
1、课件,1,第三章 总体均数的估计与假设检验,课件,2,讲述内容:第一节 均数的抽样误差与标准误第二节 t 分布第三节 总体均数的估计第四节 t 检验第五节 假设检验的注意事项第六节 正态性检验和两样本方差比较的 F 检验,课件,3,第一节 均数的抽样误差与标准误,课件,4,统计推断:由样本信息推断总体特征。,正态(分布)总体:推断!说明!为说明抽样误差规律,先用一个实例,后引出理论。,课件,5,图3-1 1999年某市18岁男生身高N(167.7,5.32)的抽样示意图,课件,6,见P3436表3-1,课件,7,将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制直方图。,
2、图3-2 从正态分布总体N(167.7,5.32)随机抽样所得样本均数分布,课件,8,,各样本均数 未必等于总体均数;各样本均数间存在差异;样本均数的分布为中间多,两边少,左右基本对称。样本均数的变异范围较之原变量的变异范围大大缩小。可算得这100个样本均数的均数为167.69cm、标准差为1.69cm。,样本均数的抽样分布具有如下特点:,课件,9,1、抽样误差:,由个体变异产生的、抽样造成的样本统计量与总体参数的差别 均数的抽样误差:由于抽样造成的样本均数与总体均数的差别 原因:1)抽样 2)个体差异,课件,10,本书以n=60为界限,课件,11,表示样本统计量抽样误差大小的统计指标。均数标
3、准误:说明均数抽样误差的大小,总体计算公式(3-1),2、标准误(standard error,SE),实质:样本均数的标准差,课件,12,数理统计证明:,课件,13,若用样本标准差S 来估计,(3-2)降低抽样误差的途径有:通过增加样本含量n;通过设计减少S。,课件,14,第二节 t 分布(t-distribution),课件,15,一、t 分布的概念,课件,16,课件,17,式中 为自由度(degree of freedom,df),3实际工作中,由于 未知,用 代替,则 不再服从标准正态分布,而服从t 分布。,课件,18,二、t 分布的图形与特征,分布只有一个参数,即自由度,课件,19,
4、图3-3 不同自由度下的t 分布图,课件,20,1特征:,课件,21,2 t界值表:详见附表2,可反映t分布曲线下的面积。单侧概率或单尾概率:用 表示;双侧概率或双尾概率:用 表示。,课件,22,课件,23,课件,24,第三节 总体均数的估计,课件,25,一、参数估计 用样本统计量推断总体参数。总体均数估计:用样本均数(和标准差)推断总体均数。,课件,26,课件,27,按预先给定的概率(1)所确定的包含未知总体参数的一个范围。总体均数的区间估计:按预先给定的概率(1)所确定的包含未知总体均数的一个范围。如给定=0.05,该范围称为参数的95%可信区间或置信区间;如给定=0.01,该范围称为参数
5、的99%可信区间或置信区间。,2区间估计(interval estimation):,课件,28,二、总体均数可信区间的计算,课件,29,1.单一总体均数的可信区间,课件,30,课件,31,P25,15号样本,课件,32,课件,33,课件,34,例3-3 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%可信区间。,课件,35,故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47,3.81)mmolL。,课件,36,课件,37,课件,38,课件,39,例3-4 为了解氨甲喋呤(MTX)对外
6、周血IL-2水平的影响,某医生将61名哮喘患者随机分为两组。其中对照组29例(),采用安慰剂;实验组32例(),采用小剂量氨甲喋呤(MTX)进行治疗。测得对照组治疗前IL-2的均数为20.10 IU/ml(),标准差为7.02 IU/ml();试验组治疗前IL-2的均数为16.89 IU/ml(),标准差为8.46 IU/ml()。问两组治疗前基线的IL-2总体均数相差有多大?,课件,40,第一步:,课件,41,能否下两组IL-2的总体均数“不同”或“有差别”的结论?,课件,42,三、可信区间的确切涵义,课件,43,观察p25表3-1:当1=95%时,在算得的100个可信区间中,有95个可信区
7、间包含了总体均数,而另外5个(表3-1中第20号、31号、54号、76号和82号)不包括。,课件,44,如果能够进行重复抽样试验,平均有1(如95%)的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为1。但在实际工作中,只能根据一次试验结果估计可信区间,如例3-3,95%的可信区间为3.47 3.81mmolL,就认为该区间包含了总体均数。,可信区间的确切涵义:,课件,45,一是可信度1,愈接近1愈好,如99%的可信度比95%的可信度要好;二是区间的宽度,区间愈窄愈好。当样本含量为定值时,上述两者互相矛盾。在可信度确定的情况下,增加样本含量可减小区间宽度。,可信区间估计的优劣取决于两
8、个方面:,课件,46,四、总体均数可信区间与参考值范围的区别,课件,47,*也可用对应于双尾概率时),*也可用对应于双尾概率时),表3-2 总体均数的可信区间与参考值范围的区别,课件,48,第四节 t 检验,课件,49,1、样本均数 与已知某总体均数 比较的t检验 目的:推断一个未知总体均数 与已知总体均 数 是否有差别,用单样本设计。2、两个样本均数 与 比较的t检验目的:推断两个未知总体均数 与 是否有差 别,用成组设计。3、配对设计资料均数比较的t检验目的:推断两个未知总体均数 与 是否有差别用配对设计。,t 检验,亦称student t 检验,有下述情况:,课件,50,对于大样本,也可
9、以近似用u检验,课件,51,t 检验的应用条件:,课件,52,假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。,假设检验基本思想及步骤,课件,53,例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?,课件,54,假设检验的目的就是判断差别是由哪种情况造成的,单纯 抽样误差造成的抽样误差和本质差异造成的,课件,55,正常成年男性血红蛋白
10、 140g/L,130.83g/L,男性铅作业工人血红蛋白 140g/L,一种假设H0,另一种假设H1,抽样误差,总体不同,课件,56,课件,57,H1的内容直接反映了检验单双侧。若H1中只是 0 或 0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。,课件,58,(3)检验水准,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取=0.05。可根据不同研究目的给予不同设置。,课件
11、,59,课件,60,课件,61,图3-5 例3-5中P值示意图,课件,62,课件,63,若,是否也能下“无差别”或“相等”的结论?,课件,64,一、单样本 t 检验(one sample/group t-test),即样本均数(代表未知总体均数)与已知总体均数0(一般为理论值、标准值或经过大量观察所得稳定值等)的比较。其检验统计量按下式计算,课件,65,例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?(1)建立检验假设,确定检验水准H0:=0=140g/L
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 课件 ch03 总体 估计 假设检验
链接地址:https://www.31ppt.com/p-6440890.html