假设检验方法均值课件.ppt
统计假设检验方法,统计假设检验是统计推断的重要方法,根据一定原理,利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断.基本思想是假设检验(类似于反正法)在一前提假设下进行推断;基本原则是小概率事件原理(即,小概率事件在一次试验中实际上是不可能发生的);根据研究对象分布情况我们所选的统计量不同,相对应的检验方法有Z检验、t检验、F检验、卡方检验。本章主要介绍: 1、理解统计假设检验的一般原理 2、掌握单双总体均值方差假设检验的方法,1.假设虚无假设(零假设):是关于当前样本所属的总体(指参数)与假设总体(指参数)无区别的假设,一般H0表示。备择假设(研究假设):是关于当前样本所属的总体(指参数)与假设总体(指参数)相反的假设,一般用H1表示。由于直接检验备择假设的真实性困难,假设检验一般都是从虚无假设出发,通过虚无假设的不真实性来证明备假设的真实性。,2. 小概率事 在随机事件中,概率很小的事件被称为小概率事件,习惯上约定在0.05以下,即当P(A) 5%时,则称A为小概率事件。在统计推断中认为,小概率事件在一次试验或观察中是不可能发生的。,3.显著性水平两种水平(1)=0.05,显著性水平为0.05,即统计推断时可能犯错误的概率5%,也就是在95%的可靠程度上进行检验;(2) =0.01,显著性水平为0.01,即统计推断时可能犯错误的概率1%,也就是在99%的可靠程度上进行检验。,统计假设检验的一般原理,理解统计假设检验的思想,掌握统计假设检验的原理是掌握假设检验方法的关键。本节主要介绍: 1、统计假设检验的一般思想(基本想法、小概率事件原理、统计假设检验的逻辑思想); 2、统计假设检验的一般步骤(4步); 3、统计假设检验中的两类错误(弃真、取伪); 4、统计假设检验的两种方式(单侧检验、双侧检验),统计假设检验的一般思想,例 某县抽样检查小学五年级数学学科教学质量,从本校五年级学生中随机抽取36名,这36名学生的平均成绩为 =86分,而全校五年级学生本次考试的平均成绩=82分,标准差 =10分。问抽出的36名学生成绩与全校五年级学生成绩是否一致?或者说,这36名学生的成绩能否代表该校五年级的成绩? 此问题的提出,是发现36名学生的平均成绩高出学校平均成绩4分,怀疑这36名学生的成绩无法代表全校一般水平。高出的4分有两种可能,第一种是抽样误差(即由抽样引起的差异),称为偶然误差;也可能是36名学生的成绩确实无法代表五年级学生的成绩,称为系统误差。这种差异是偶然误差引起还是系统误差,是我们要研究的问题。,统计假设检验的一般思想,小概率事件原理(实际推断原理):1、何为小概率事件?顾名思义,概率很小的事件。2、小概率事件原理:小概率事件在一次试验中实际上(基本上)是不可能发生的。3、举例:从10万张奖票中买一张中头奖的概率是? 飞机失事、火车失事、汽车失事的概率分别为( 、 、 ),均属小概率事件,因为我们知道小概率事件在一次实验中基本上不可能发生,所以选择乘坐飞机、火车、汽车。4、统计检验中,认为发生概率小于0.05、0.01即为小概率事件。,假设检验的逻辑思想: 先假设 成立,在原假设成立条件下依据抽样分布理论进行数学上的计算(对于统计量的计算),依据正确逻辑进行推理,看是否出现矛盾(小概率事件是否发生),决定接受原假设或拒绝接受。,统计假设检验的一般步骤,一、建立假设 需建立一对,原假设和备择假设;二、选择和计算统计量 在原假设前提下,选择合适的抽样分布和统计量,并计算统计量的值,根据抽样分布,有标准正态分布、t分布、F分布、卡方分布,对应统计量值Z值、t值、F值、卡方值;三、确定显著性水平,根据显著性水平查表确 定临界值;四、进行统计决断,判断结果并解释。 即将计算所得统计量值与临界值相比较,判断小概率事件是否发生,从而确定是否接受原假设。,统计假设检验的两种形式,双尾检验:若研究人员对两总体参数间差异方向无法得知或不关心,采用双尾检验;原假设为 ,备择假设为 ;拒绝区域平均分布在两侧; 单侧检验:若依据某些理论或经验已知一总体参数小于另一总体参数;则建立一对假设为: ,备择假设为 ;拒绝区域分布在一侧.,统计假设检验中的两类错误,例 箱中有白、黑球共100个,已知两种颜色的球一种99个,另一种1个,判断哪种颜色的球为99个。 假设检验的思想如下: 首先,假设白颜色的球有99个;进行检验,从箱子中抽取一个球,若抽到的为黑球,我们认为小概率事件发生了(因为在原假设条件下,抽到黑球的概率为0.01,小概率事件),小概率事件发生了,说明假设错误. 但实际上,也存在抽到了黑球,但实际上白球的个数就是99的事实,因此我们的推断存在着错误,为第一类错误. 第一类错误,弃真.原假设符合实际情况,但检验结果却否定了原假设,称为弃真,即把”对”说成”不对”,把真说成假;,统计假设检验的两类错误,第二类错误,取伪.即原假设不符合实际情况,但检验结果却肯定了原假设,称为”取伪” 第一类,弃真.P(否定 / 为真)= 第二类,取伪. P(接受 / 为假)=,单侧假设检验应用举例,例 某高校参加同专业的统一考试,随机抽取64份试卷,由此求得平均成绩为69分,标准差为9.5分,已知该科全体考生成绩服从正态分布,且总体平均分为65分.问该校考生平均成绩是否显著高于全体考生平均水平? 需单侧假设检验,原假设为 备择假设为,单总体假设检验,单总体假设检验是对样本统计量与已知总体参数之间差异的显著性进行检验. 根据总体的分布形态、总体方差是否已知、样本大小不同,平均数显著性检验采用不同的检验方法。 1、总体正态分布,总体标准差已知 2、总体正态分布,总体标准差未知 (大样本和小样本情况) 3、总体非正态分布,1、总体正态分布,总体标准差已知,例1 某小学三年级学生期末语文考试平均成绩为77分,标准差为9分。甲班参加该考试的有25人,平均成绩为80分。该班学生成绩是否与全校成绩一致? 例2 某校二年级学生期中数学考试,平均成绩为72分,标准差为8分。期末考试后,随机抽取36名学生的数学成绩,其平均分为75分,二年级学生的数学成绩是否有显著性进步?,2、总体正态分布,总体标准差未知,1、大样本,检验样本平均数与总体平均数间的差异时,采用Z检验 例3 某市调查表明,一年级儿童的平均身高为116.5厘米.某调查组从该市的一所小学中随机抽取49名儿童,测得他们的身高如下.该校一年级学生的平均身高是否与全市儿童的平均身高一致? 113,109,112,107,109,120,117,100,119,122,108,135,111,125,108,110,170,130,120,131,119,99,122,115,98,106,118,105,119,120,118,129,134,94,123,125,99,114,116,121,110,115,120,99,127,100,124,128,118,3、总体正态分布,总体标准差未知,2、小样本,要检验由总体抽出的小样本平均数与总体平均数的差异是否显著用t检验。 例4 某小学上届四年级学生自学能力测试平均成绩为30分,这一届四年级20个学生的自学能力平均成绩为38分,标准差为6分。假定这一届学生与上届学生学习条件相同,试分析这一届四年级学生的自学能力是否高于上一届学生。 例5 某地区五年级英语统一考试平均成绩为68分,该区某小学五年级22份试卷的分数分别为:72,74,65,80,83,60,78,59,63,76,81,67,54,70,75,55,88,73,69,66,50,68。该校五年级英语平均成绩是否与全区一致?,4、总体非正态分布,通常情况下,若没有足够的理由说明是非正态,认为正态。 当n30时,样本平均数抽样分布服从正态分布,检验样本平均数与总体平均数之间的差异,用Z检验. 例6 某小学三年级一班有学生49人,语文教师在该班进行语文教法实验,通过语文教学培养学生的阅读能力.期末全校三年级学生阅读能力测验的平均成绩为68分,而一年级学生的平均成绩为71分,标准差为12分.该班阅读成绩是否高于该年级的平均成绩?,单总体均值的假设检验-小结,t检验-总体正态,标准差未知,且小样本Z检验-总体正态,标准差已知 总体正态, 标准差未知,但大样本 总体非正态,但大样本,双总体假设检验,引例:我们对某地区6岁儿童的体重调查,所选340名男孩平均体重为31公斤,350名女孩平均体重为30公斤,问此地区6岁儿童体重是否具有性别差异?(提出此问题,因为我们所调查的样本中,男孩女孩的体重均值具有差异,那么,能否由样本信息推断此地区6岁儿童体重具有性别差异?需进行双总体假设检验. 双总体假设检验主要由两样本平均值之间的差异推断各自代表的总体均值差异.主要研究以下几个问题: 1、两个独立样本平均数间差异的检验(3种) 2、两个相关样本平均数间差异的检验(3种),1、独立样本均值差异显著性检验,在两样本独立情况下,由于总体标准差、样本容量的差异,检验公式各异。1、总体标准差已知 检验公式为其中, 为样本平均数; 为两样本来自总体方差. 例10 在参加了全国统一考试后,已知考生成绩服从正态分布。甲省抽取153名考生,平均成绩为57.41分,该省标准差为5.77分;乙省抽取686名考生,平均成绩为55.95分,该省标准差为5.17分,问两省在该次考试中,平均分是否有显著性差异?(0.01),独立样本均值差异显著性检验,2、总体标准差未知,样本容量大于30 检验公式 使用条件: (1)总体正态分布,总体标准差未知但相等(方差是否相等,用方差齐性检验F检验); (2)两样本均为大样本; (3)样本相互独立。,应用举例,例11、某地区对6岁儿童的体重进行调查,得到如下结果:男孩360名,平均体重为31.5公斤,标准差为4.55;女孩354名,平均体重为30.8公斤,标准差为4.87。问此结果能否说明6岁儿童体重有性别差异?(0.05) 例12、甲、乙两所小学联合举行四年级数学考试,参加人数各为96人,数学平均成绩分别为78分和81分,标准差分别为9.4分和7.2分。问两所学校的数学成绩是否有显著性差异?(0.05),独立样本均值差异显著性检验,3、总体正态分布,总体标准差未知,样本容量小于30 独立小样本平均数间的差异服从自由度为 的t分布.检验公式为 使用条件 (1)总体正态分布,标准差未知,但相等; (2)样本为小样本(大样本亦可); (3)样本相互独立.,应用举例,例13、某小学教学班有男生16名,女生14名,他们的语文成绩如表7-7,男、女生之间在语文成绩上是否有显著性差异?(0.05),相关样本独立性假设检验,何为相关样本?一般而言,有两种情况.1、同一组被试在不同条件下形成的两组样本(例对80名学生在学期初进行测试得到一组数据,一学期教改实验后进行测试,得到另一组数据,两组数据即为相关样本)2、成对匹配的两组被试形成样本存在相关(例将80名学生进行匹配分为实验组、对照组进行实验,实验组采用新教材,对照组采用旧教材,学习一学期后两组学生的成绩形成一对相关样本). 由于相关样本的相关程度对实验结果有一定影响,因此对相关样本均数差异显著性检验所用公式与独立样本有所差异.分三种情况: 1、总体正态,总体标准差已知 2、总体正态,总体标准差未知(大样本、小样本),相关样本均值差异假设检验,1、两总体正态分布,总体标准差已知 用Z值检验两个来自相关总体的样本平均数所代表的总体平均数间是否存在显著性差异,公式如下: 其中, 为样本所来自总体标准差;n为成对观测值的个数;r为两样本间相关系数。,相关样本均值差异假设检验,2、总体标准差未知,大样本(n30) Z检验,用样本方差代替总体方差,公式为: 例14、 从某实验小学二年级随机抽取45名学生进行写作能力训练,训练前测验结果的平均成绩为75分 ,标准差为8.1分;训练后,测验平均成绩为78分,标准差为7.2分,两次测验相关系数为0.5。问这两次测验的平均成绩是否有显著性差异?(0.01),应用举例,例15、将80名学生按年龄、性别、智力水平基础一一匹配后,分成两个班进行教材改革实验。甲班学生使用旧教材,乙班学生使用新教材,学习后两班学生测验的结果如表7-8。问两班成绩的差异是否显著?,相关样本均值差异假设检验,3、总体标准差未知,小样本(n30) 使用t检验,自由度为df=n-1,检验公式为: 例16 某区大兴路小学一年级三班有25名学生用听读识字法识字,课时平均识字量为15个汉字,标准差为6;与其条件基本相同的解放路小学一年级二班有25名学生,用传统的识字方法识字,课时平均识字量为11个汉字,标准差为5.3分.两个班通过事先配对,学习成绩的相关系数为0.61.问:新识字法是否显著优于传统识字法?,