《第四讲+均值比较检验课件.ppt》由会员分享,可在线阅读,更多相关《第四讲+均值比较检验课件.ppt(79页珍藏版)》请在三一办公上搜索。
1、,第四讲,均值比较检验,一、基本统计内容,单个总体均值的 t 检验(One-Sample T Test);两个独立总体样本均值的 t 检验(Independent-Sample T Test);两个有联系总体均值均值的 t 检验(Paired-Sample T Test);单因素方差分析(One-Way ANOVA);双因素方差分析(General Linear ModelUnivariate)。,二、假设条件,研究的数据服从正态分布或近似地服从正态分布。在Analyze菜单中,均值比较检验可以从菜单Compare Means,和General Linear Model得出。如图所示。,三、单
2、个总体的 t 检验分析,单个总体的 t 检验(One-Sample T Test)分析,也称为单一样本的 t 检验分析,也就是检验单个变量的均值是否与假定的均数之间存在差异。如将单个变量的样本均值与假定的常数相比较,通过检验得出预先的假设是否正确的结论。,1、过程,例:根据2002年我国不同行业的工资水平,检验国有企业的职工平均年工资收入是否等于10000元,假设数据近似地服从正态分布。建立假设:H0:国有企业工资为10000元;H1:国有企业职工工资不等于10000元检验过程的操作按照下列步骤:,1、单击Analyze Compare Means One-Sample T Test,打开On
3、e-Sample T Test 主对话框;2、从左边框中选中需要检验的变量(国有单位)进入检验框中。3、在Test Value框中键入原假设的均值数10000。,4、单击Options按钮,得到Options对话框(如图),选项分别是置信度(默认项是95)和缺失值的处理方式。选择后默认值后返回主对话框。,5、单击OK,得输出结果。,2、One-Sample Statistics,数据的基本统计描述t检验的检验结果,3、One-Sample Test,练习,四、两个独立样本的t检验,Independent-sample T Test是检验两个没有联系的总体样本均值间是否存在显著的差异。两个没有联
4、系的总体样本也称独立样本。如两个无联系的企业生产的同样产品之间的某项指标的均值的比较,不同地区的儿童身高、体重的比较等,都可以通过抽取样本检验两个总体的均值是否存在显著的差异。,1、过程,例:某医药研究所考察一种药品对男性和女性的治疗效果是否有显著差异,调查了10名男性服用者及7名女性服用者,对他们服药后的各项指标进行综合评分,服用的效果越好,分值就越高,每人所得的总分见下表,试根据表中的数据检验这种药品对男性和女性的治疗效果是否存在显著差异。,由于药品对男性或女性的影响是无联系的,因此这两个样本是相互独立的。可以应用两独立样本的假设检验。建立假设检验H0:该药品对男性和女性的治疗效果没有显著
5、差异;H1:该药品对男性和女性的治疗效果有显著差异。,1、单击Analyze Compare Means Independent-sample T Test,打开Independent-sample T Test 主对话框如图。2、选择要检验的变量“综合得分”进入检验框中,选择分组变量“性别”进入分组框中。,3、然后单击Define Group按纽,打开分组对话框如图所示,确定分组值后返回主对话框,如果没有分组,可以选择Cut point单选项,并在激活的框内输入一个值作为分组界限值。,4、由Option选择按纽确定置信度值和缺失值的处理方式。5、点击OK可得输出结果。,2、Group Sta
6、tistics,分组统计描述表(a),3、独立样本的均值比较检验表(b),检验表基本统计表(a)、检验表(b)第三列和第四列是检验两样本数据的方差是否相等,从检验结果得知两样本的方差没有显著差异。从第五列开始是对两个样本的均值的是否相等进行检验。从假设检验的P值看出,它大于显著性水平0.05,所以说男女之间的机械能力之间并无显著差异,因此接受原假设H0。而第八列之后分别是均值差、均值差标准误、均值差的置信区间。,练习,为了评价两家旅游服务企业的服务质量,分别在两个企业抽取样本,在A企业随机抽取30名顾客,在B企业随机抽取40名顾客,让他们分别对服务质量进行打分,评分标准是0100分。顾客给出的
7、服务质量评分如下表。试问两家旅游服务企业的服务质量有没有差别?,五、配对样本的t检验,Paired-Sample T Test是检验两个有联系正态总体的均值是否存在显著的差异。又称配对样本的 t 检验。经常用于生物、医药、农业、工业等多个行业。如检验某种药品使用的效果是否显著,需要对使用者使用前后进行比较;再如对某种粮食进行品种改良,也需要比较改良前后粮食产量有无显著差异等。,如果分组样本彼此不独立,例如测度的是工人在技术培训前后某项技能的成绩要求比较培训前后均值是否有显著性差异应该使用配对T 检验的功能(Paired Simple T test)。如果分组不止两个,使用One Way ANO
8、VA 一元方差分析过程进行单变量方差分析。如果比较的变量明显不是正态分布,则使用一种非参数检验过程(Nonparametric test)。如果用户想比较的变量是分类变量应该使用Crosstabs 功能。,1、过程,例:某企业对生产线上的工人进行某种专业技术培训,要对培训效果进行检验,从参加培训的工人中抽取30人,将他们培训前后的数据每加工500个零件的不合格品数进行对比,得到数据表,见表3。试根据表中数据检验培训前后工人的平均操作技术水平是否有显著提高,也就是检验培训效果是否显著。,工人培训前后不合格品数据表3,解:,这显然是配对样本均值的假设检验的问题。建立假设:H0:培训前后工人的技术水
9、平没有显著差异;H1:培训前后工人的技术水平有显著差异;其检验过程的具体操作步骤为:,1、单击Analyze Compare Means Paired-Sample T Test,打开Paired-Sample T Test主对话框如图。2、选择要检验的两变量进入检验框中,注意,一定要选择两个变量进入检验框内,否则将无法得到检验结果。,3、由Option选择按纽确定置信度值95和缺失值的处理方式。4、点击OK得输出结果。5、根据输出结果作出结论,2、Paired Samples Statistics,样本统计量分析,3、Paired Samples Test,练习,综合练习题,1、为了评价两家
10、餐饮服务企业的服务质量,分别在两个企业抽取样本,在A企业随机抽取18名顾客,在B企业随机抽取24名顾客,让他们分别对服务质量进行打分,评分标准是0100分。顾客给出的服务质量评分如下表。,1、试比较该两家企业的服务质量有无差异?2、假如此地方餐饮业服务质量评比得分80分及以上为优秀,该两家企业能否评为优秀?,2、某制鞋厂为了比较用来做鞋后跟的两种材料的质量,随机选取了15名男子,让他们每人穿一双新鞋,每双鞋中有一只是用材料A作后跟的,另外一只是用材料B作后跟的,其厚度均为10cm,一个月以后再次测量它们的厚度,数据如下,问A和B材料的耐磨力有无差异?,3、为了检验甲乙丙三种分离机在析出某种有用
11、物质效能上的高低今抽取8 批溶液每批均分成三份分别由甲乙丙机分解处理其析出效果数据如表,所示试问甲乙丙三种机在析出效能上有无差异(=0.05)?,样号 1 2 3 4 5 6 7 8甲(X)4.0 3.5 4.1 5.5 4.6 6.0 5.1 4.3乙(Y)3.0 3.0 3.8 2.1 4.9 5.3 3.1 2.7丙(Z)3.2 3.8 4.3 3.6 4.0 4.9 4.7 2.4,六、单因素方差分析,单因变量的单因素方差分析主要解决多于两个总体样本或变量间均值的比较问题。是一种对多个(大于两个)总体样本的均值是否存在显著差异的检验方法。其目的也是对不同的总体的数据的均值之间的差异是否
12、显著进行检验。单因素方差分析应用范围很广,涉及工业、农业、商业、医学、社会学等多个方面。,1、过程,例:某企业需要一种零件,现有三个不同的地区的企业生产的同种零件可供选择,为了比较这三个零件的强度是否相同,每个地区的企业抽出6件产品进行强度测试,其值如表所示。假设每个企业零件的强度值服从正态分布,试检验这三个地区企业的零件强度是否存在显著差异。,样本零件强度值(单位:百公斤),解:,建立假设H0:三个地区的零件强度无显著差异;H1:三个地区的零件强度有显著差异。然后根据表中数据,建立数据文件,并进行单因素方差分析(One-Way ANOVA)。具体操作过程如下:,1、单击Analyze Com
13、pare Means One-Way ANOVA,打开 One-Way ANOVA对话框。2、从左框中选择因变量”零件强度”进入Dependent list框内,选择因素变量”地区”进入Factor框内。点击OK就可以得到方差分析表。,2、ANOVA 方差分析表,如果需要对各地区间的零件强度进行进一步的比较和分析,可以通过按纽Option选项,contrast对照比较,Post Hoc多重比较去实现。,单击Option按纽,打开Option对话框如图所示:在Option选项中选择输出项。主要有不同水平下样本方差的齐性检验,缺失值的处理方式及均值的图形。,选择Homogeneity of var
14、iance test 进行不同水平间方差齐性的检验以及Descriptive 基本统计描述。在Missing Value栏中选择系统默认项。,Least-significant difference:最小显著差法;Bonferroni:Bonferroni修正差别检验法;Duncans multiple range test:Duncan多范围检验。Student-Newman-Keuls:Student-Newman-Keuls检验,简称N-K检验,亦即q检验;Tukeys honestly significant difference:Tukey显著性检验。只能为0.05;Tukeys b
15、:Tukey另一种显著性检验;Scheffe:Scheffe差别检验法。,完成所有选择后返回主对话框,然后单击OK,就可以得到三个地区零件强度分析表。,3、Descriptives基本统计描述(a),4、Test of Homogeneity of Variances(b),方差齐性检验,从基本统计分析表(a)可以得到均值、标准差等数据相应的统计特征值。从表(b)中的统计检验可以得出,因素变量的各水平间的方差是没有显著差异的。,Multiple Comparisons多重比较,*The mean difference is significant at the.05 level.,从表中可以看
16、出,地区2与地区3之间的差异是非常显著的,它们均值差的检验的尾概率为0.005,明显小于显著性水平0.05。,七、双因素方差(Univariate)分析过程,单因变量的双因素方差分析是对观察的现象(因变量)受两个因素或变量的影响进行分析,检验不同水平组合之间对因变量的影响是否显著。双因素方差分析的应用范围很广,如粮食产量受到气候、温度因素的影响。双因素方差分析过程可以分析出每一个因素的作用;各因素之间的交互作用;检验各总体间方差是否相等;还能够对因素的各水平间均值差异进行比较等。,双因素方差分析应用条件,因变量和协变量必须是数值型变量,且因变量来自或近似来自正态总体。因素变量是分类变量,变量可
17、以是数值型或字符型的。各水平下的总体假设服从正态分布,而且假设各水平下的方差是相等的。,双因素方差分析的应用,例:下表是某商品S在不同地区和不同时期的销售量表。已知数据服从正态分布,则要检验地区因素及时间因素对销售量的影响是否显著。,由于销售量受地区和时间两个因素的影响,这是一个双因素方差分析的问题,根据上表建立数据文件.具体分析的步骤如下:1、单击Analyze General linear Model Univariate,打开Univariate主对话框。如图所示:,2、选择要分析的变量”销售量”进入Dependent Variable 框中,选择因素变量”地区”和”时期”进入Fixed
18、 Factor框中。,3、单击Model按纽选择分析模型,得到Model对话框。如图所示:在Specify框中,指定模型类型。,Full Factorial 选项为系统默认项,建立全模型,全模型中包括因素之间的交互作用。如果不考虑因素间的交互作用时,应当选择自定义模型。Custom选项为自定义模型,本例选择此项并激活下面的各项操作。,先从左边框中选择因素变量进入Model框中;然后选择效应类型。一般不考虑交互作用时,选择主效应Main,考虑交互作用时,选择交互作用Interaction。可以通过单击Build Term下面的小菜单完成,本例中选择主效应;最后在Sum of Square 中选择
19、分解平方和的方法后返回在主对话框。一般选取默认项Type。,单击OK就可以得到相应的双因素方差分析表,Tests of Between-Subjects Effects,从表中数据可以看出,F值对应概率P值都小于显著性水平0.05,这说明地区和时期对销售量的影响都是显著的。,两水平间的均值比较,如果需要进行特定的两水平间的均值比较,可单击Contrast比较按纽,打开Contrast对话框如图。在Factor框中显示所有在主对话框中选择的因素变量,括号中显示的是当前的比较方法,点击选中因素变量,可以改变均值的比较方法。,None 不进行均数比较;Deviation 以观测量均值为标准进行比较;
20、Simple 以第一个或最后一个水平的观察值均值为标准;Difference 各水平上观察值均值与前一个水平的均值进行比较;Hermert 各水平上观察值与最后一个水平的均值比较。,如需要进行图形展示,可单击Plots按纽,打开图形对话框。选择作均值轮廓图(Profile)的参数。(1)在Factor框中选择因素变量进入横坐标Horizontal Axis框内,然后单击add按纽,可以得到该因素不同水平的因变量均值的分布。(2)如果要了解两个因素变量的交互作用,将一个因素变量送入横坐标后,将另一个因素变量送入Separate Lines分线框中,然后单击add按纽。就可以输出反映两个因素变量的
21、交互图。本例中选择因素A为横坐标。,如需要将因素A各水平间均值进行两两比较,单击Post Hoc按纽,打开Post Hoc Multiple多重比较对话框如图所示。,从Factor框中选择因素变量进入Post Hoc Test for框中,然后选择多重比较方法。本例中各组方差相等,选择LSD方法。,单击Save 按纽,打开保存对话框,如图2.16所示。选择需要保存的变量,Predicted Value 预测值栏,选择此栏系统将给出根据模型计算的有关预测值的选择项。Diagnostics 诊断异常值栏,有库克距离和杠杆值(leverage value)。Save to New File 保存新文
22、件栏Residual 残差栏,有非标准化和标准化残差、学生化和剔除残差等。本例中不作选择。,单击Options按纽,打开Univariate:Options对话框,从中选择需要输出的显著性水平,默认值为0.05。本例中不作选择。在进行所有的选择后,单击OK,就可以得到输出结果。,Multiple Comparisons多重比较表,从表中可以看到地区之间的差异比较结果,如A1与A2,A1与A3的差异就比较大,而A1和A5之间的没有显著差异。,从表中可以看到地区之间的差异比较结果,如A1与A2,A1与A3的差异就比较大,而A1和A5之间的没有显著差异。,从表中可以看到地区之间的差异比较结果,A1和
23、A5之间的没有显著差异。,因素A与因素B的交互作用图,由图可以看出,两个因素变量地区和时期的折线之间无交叉,因此两个因素之间基本上没有交互作用。,实验练习题,1、为了比较两种材料的质量,选择15台不同设备对这两种材料进行特别处理,假设未处理前两种材料的指标数据均为10,一星期后经测量得到两种材料的指标数据如下:试根据下面的数据检验两种材料的质量有无显著差异?,2、下面给出的是两个大文学家马克.吐温的8篇小品文及斯诺特格拉斯的10篇小品文中由3个字母组成的词的比例。设两组数据分别来自正态总体,试检验两位作家写的小品文稿中包含由3 个字母组成的词的比例是否有显著的差异?并且检验两组数据的方差是否相
24、等?,3、现有甲、乙、丙3家企业生产同一种型号电池,为评比其质量,从每个生产企业各随机抽取12只进行寿命测试,数据如下表所示:试在显著性水平0.05下,检验三企业生产的电池的平均寿命1、2、3有无显著差异,并求1-2,1-3,2-3的95置信区间。,4、下表中给出了某种化工过程在三种浓度、四种温度水平下的得率,假设在诸水平的搭配下的总体服从正态分布且方差相等,试在水平0.05下检验不同的浓度及不同的温度下的得率的差异是否显著?交互作用的效应是否显著?,复习,1、测得某克山病区11例急性克山病患者与13名健康人的血磷值(x,mg%)如下患者:2.6 3.24 3.73 3.73 4.32 4.7
25、3 5.18 5.58 5.78 6.4 6.53健康人:1.67 1.98 1.98 2.33 2.34 2.5 3.6 3.73 4.14 4.17 4.57 4.82 5.78问该地急性克山病患者与健康人的血磷值是否相同?,2、某医院有10例矽肺患者,经克矽平治疗前后的血红蛋白(g/dl),见下表,问治疗对血红蛋白有无作用?治疗前:11.3 15 15 13.5 12.8 10 11 12 13 12.3治疗后:14 13.8 14 13.5 13.5 12 14.7 11.4 13.8 12,4、用二氧化硅50mg使大鼠染尘后,测量不同时期全肺湿重的变化,见下表,试比较染尘后1月,3月,6月,三个时期的全肺湿重有无差别?(完全随机平衡设计的方差分析),5、下面给出的是两个大文学家马克.吐温的8篇小品文及斯诺特格拉斯的10篇小品文中由3个字母组成的词的比例。,设两组数据分别来自正态总体,试检验两位作家写的小品文稿中包含由3 个字母组成的词的比例是否有显著的差异?并且检验两组数据的方差是否相等?,
链接地址:https://www.31ppt.com/p-3946975.html