参数估计与假设检验SP.ppt
专题二 参数估计与假设检验,南京财经大学 管于华,Analyze-Compare Means分析-比较均值,Mean 均值One Sample T test 单样本T检验Independent Sample T test 独立样本T检验Paired-Samples T test 配对样本T检验One-Way ANOVA 单因素方差分析,基本概念,基本概念,参数估计和假设检验是统计推断的二个重要方面。参数估计是依照一定的概率保证程度,用样本统计量估计总体参数取值范围的方法。假设检验是先对研究总体作出某种假设,然后通过对样本的观察和试验来决定假设成立与否。,概述-参数估计,1.几个基本概念2.单个总体均值的区间估计3.两个总体均值之差的区间估计,总体参数估计是以样本统计量(即样本数字特征)作为未知总体参数(即总体数字特征)的估计量,并通过对样本单位的实际观察取得样本数据,计算样本统计量的取值作为被估计参数的估计值。,定义,参数估计中的几个基本概念,总体参数 样本统计量点估计 点估计的优良性概率保证程度(置信度)置信区间,单个总体均值的区间估计,两个总体均值之差的区间估计,概述-假设检验,特别关注:单边情况,原假设 备择假设统计量 统计量对应的p值 显著性水平 临界值 拒绝域两类错误假设检验的步骤,假设,统计假设就是关于“总体的某个声明”或“某事是真的之叙述”。,班长很少骂人。某航空公司的代表声称该公司民航客机的平均机龄不超过10年。某企业的总经理认为该企业本年度的利润会比去年的增加2亿美元。,单边情况,原始主张受保护;原假设必带等号。,两类错误,显著性水平、临界值与拒绝区,假设检验的步骤,1根据具体问题的要求,提出原假设和备择假设H;2选择一个合适的检验统计量,并计算之;3计算统计量相应的p值;4判断:若p值小于显著性水平,则拒绝原假设;若大于,则不能拒绝原假设。,单个总体均值的假设检验,分层次计算平均数,Analyze Compare Means Mean,例一,用“Employee.sav”资料,(1)计算各工种的平均受教育年数。(2)计算各工种分性别的平均受教育年数。,例一,单样本T检验,单样本T检验是指,样本平均与总体平均数的差异检验。样本平均数()与总体平均数。往往大小不一,这差异是由于抽样误差造成,还是本质性误差样本根本不是来源于该总体。如果差异显著,则认为样本平均数与总体平均数。的差异已不能完全认为是抽样误差了。,单样本T检验,AnalyzeCompare MeansOne Sample T test,例一例二,区间估计,“Employee.sav”资料,计算公司职工的平均受教育年数。假定该地区人口平均受教育年数为13年,问:公司职工文化程度是否有别于该地区的居民文化程度?公司职工文化程度是否显著性高于居民文化程度?,例一,某省大学英语四级考试的平均成绩为65分,现从某校随机抽取20份试卷,其分数为:72 76 68 78 62 59 64 85 70 75 61 74 87 83 54 76 56 66 68 62。问该校英语水平与全区是否基本一致。,例二,对单个总体均值的区间估计,Analyze Compare Means One-Sample T Test,例,Analyze Descriptives Explore,某区进行英语测验,现从某校随机抽取20份试卷,其分数为:72 76 68 78 62 59 64 85 70 75 61 74 87 83 54 76 56 66 68 62 根据现有资料,以95%的置信水平推断该校英语测试的成绩。(假定学生的考试成绩是服从正态部分的。),例一,解二,解一,解一,解二,两独立样本平均数差异T检验,独立样本(Independent Sample)是指两个样本彼此独立,没有任何关联。例如实验组与控制组、男生组与女生组、高收入组与低收入组、大学数学系与物理系等。两个独立样本均值之间差异用t统计量进行检验。,两独立样本平均数差异T检验,AnalyzeCompare MeansIndependent Sample T test,例一例二,区间估计,用“Employee.sav”资料,问:清洁工、保管员和经理的受教育年数是否有显著差异?,例一,由以往资料知道,甲、乙两煤矿煤的含灰率都服从正态分布且方差相等。从甲矿抽10个样本,从乙矿抽12个样本,进行测试并得相关数据。问两矿所采煤的平均含灰率有无显著差异?,例二,医生测得18例慢性支气管炎患者及16例健康人的尿17酮类固醇排出量(mg/dl)分别为X1和X2,试问两组的均数有无不同?数据为data04_13。,例三,对两个总体均值之差的区间估计,Analyze Compare Means Independent Sample T Test,两配对样本平均数差异T检验,配对样本(Paired Sample)或相关样本(Correlated Sample),指两个样本的观测值之间彼此关联,如实验前后的测量,研究者感兴趣的是二次测量之间是否存在差异。显然对应个别样本的顺序不可以变化的。两个配对样本均值之间差异用t统计量进行检验。,两配对样本平均数差异T检验,AnalyzeCompare MeansPaired-Samples T test,例一例二,区间估计,用“Employee.sav”资料,分析美国企业现在工资与过去工资是否有明显差异。,例一,从小学三年级随机抽取10名儿童作为样本,分别在学期初和学期末进行了推理能力的测验,看学生的推理能力是否有所提高。,例二,对两个总体均值之差的区间估计,Analyze Compare Means Paired Sample T Test,某省大学英语四级考试的平均成绩为65分,现从某校随机抽取20份试卷,其分数为:72 76 68 78 62 59 64 85 70 75 61 74 87 83 54 76 56 66 68 62。若显著性水平取0.05,问该校英语水平与全区是否基本一致。(假定考试成绩服从正态分布),假设检验(双边检验-等于),某省大学英语四级考试的平均成绩为65分,现从某校随机抽取20份试卷,其分数为:72 76 68 78 62 59 64 85 70 75 61 74 87 83 54 76 56 66 68 62。若显著性水平取0.05,问该校英语水平是否高于全区水平。(假定考试成绩服从正态分布),假设检验(单边检验-高于-右侧),某省大学英语四级考试的平均成绩为65分,现从某校随机抽取20份试卷,其分数为:72 76 68 78 62 59 64 85 70 75 61 74 87 83 54 76 56 66 68 62。若显著性水平取0.05,问该校英语水平是否低于全区水平。(假定考试成绩服从正态分布),假设检验(单边检验-低于-右侧),某省大学英语四级考试的平均成绩为65分,现从某校随机抽取20份试卷,其分数为:72 76 68 78 62 59 64 85 70 75 61 74 87 83 54 76 56 66 68 62。若显著性水平取0.05,问该校英语水平是否不高于全区水平。(假定考试成绩服从正态分布),假设检验(单边检验-不高于-右侧),某省大学英语四级考试的平均成绩为65分,现从某校随机抽取20份试卷,其分数为:72 76 68 78 62 59 64 85 70 75 61 74 87 83 54 76 56 66 68 62。若显著性水平取0.05,问该校英语水平是否不低于全区水平。(假定考试成绩服从正态分布),假设检验(单边检验-不低于-左侧),检验结果,假设检验(双边检验-等于),假设检验(单边检验-大于等于-左侧),假设检验(单边检验-大于-右侧),检验结果,检验结果,假设检验(双边检验-等于),假设检验(单边检验-高出-右侧),检验结果,检验结果,