均值的比较检验.ppt
均值的比较检验,相关实例,在企业市场结构的研究中,起关键作用的指标有市场分额、企业规模、资本收益率、总收益增长率等。为了研究市场结构的变动,研究人员通常需要将调查所得的数据与历史数据进行比较。通过均值比较检验,就能比较出现在的市场结构与过去是否存在显著性差异。在临床上,医生需要对病人治疗前后的状况进行控制。例如通过对比一组病人使用某种药物后的身体指标,可以判断该药物对病人是否有效,效果是否显著。,均值检验问题的提出,统计分析中常常采用抽样的方法进行研究,即随机地从总体中抽取一定数量的样本进行研究来推断总体特征。计算样本的均值进行均值分析可以按某数值或定位变量分组,求出各组的统计量。但是由于总体中的个体间存在差异,即使严格遵守随机抽样原则,样本统计数与总体参数之间也会存在偏差。,均值检验问题的提出,这是因为在采用抽样方法时,不可避免地会多抽到一些数值较大或较小的样本,而抽样时实验者的技术或仪器精准程度的差别也会导致误差的存在。因此,在用样本均值估计总体均值,或判断两个均值不相等的样本是否来自均值不同的总体时,就有必要进行均值的比较检验。均值的检验一般包括接下来三部分内容:,本章结构,单一样本的均值检验,独立样本的均值检验,配对样本的均值检验,均值的比较检验,单一样本均值的检验,-检验样本所在总体的均值与给定的已知值之间是否存在显著性差异,单一样本均值的检验,基本思想 计算出样本均值后,先根据经验或已有的历史数据,对总体的均值提出一个假设,即原假设 就是已知的总体均值。然后通过计算分析样本均值来自均值为 的总体概率有多大,进而推断样本所在的总体的均值是否为。,单一样本均值的检验,只对单一变量的均值加以检验如检验今年新生的统计学平均成绩是否和往年有显著差异;推断某地区今年的人均收入与往年的人均收入是否有显著差异等等。要求样本数据来自于服从正态分布的单一总体假设的基本形式:当然也可以有单侧检验的假设形式。,基本步骤,提出假设确定检验统计量若总体方差已知,此时可构造标准正态分布Z检验统计量 通常总体方差都是未知的,此时总体方差由样本方差代替,采用t分布构造t检验统计量 其中S为样本标准差,定义为 做出统计推断,注意,在SPSS中,给出的是总体方差未知时的t检验统计量,因为通常总体方差是未知的。,例题分析,以学生的身高为例,已知某年级15个学生的身高数据,如表所示,检验其平均身高是否与整个年级的平均身高165cm相同,答案,提出假设:确定检验统计量:由于总体方差未知,因此采用t检验统计量经计算得:=164.93,S=7.126,df=15-1=14,则该例为双侧检验,显著性水平=0.05,查t分布表可得临界值。,说明t值落在接受区域内,即原假设与样本描述的情况无显著差异,应该接受原假设。因此可以得出结论:15个学生的平均身高与整个年级的平均身高无显著差异。,双侧检验显著水平值取一半,SPSS应用,操作步骤按照顺序:Analyze Compare Means One-Sample T Test,进入单一样本T检验“One-Sample T Test”对话框中,将左侧“身高”变量选入到检验变量“Text Variables”框中。右下角检验值“Test Value”框用于输入已知的总体均值,默认值为0,在本例中为“165”。如图所示,输出结果(1),结果解释:此表给出了单一样本均值检验的描述性统计量,包括均值、标准差和均值标准误差。身高的均值为164.93,接近总体均值165,但还不能就此下结论。其中,标准误差的公式为:,One-Sample Statistics,输出结果(2),One-Sample Test,结果解释此表是单一样本均值检验的结果列表,给出了t统计量、自由度、双尾概率、显著水平及置信区间。双尾概率P=0.9720.05,故不能拒绝原假设,认为15个学生的平均身高与整个年级的平均身高165无显著性差异。,独立样本均值的检验,-比较两个独立没有关联的正态总体的均值是否有显著性差异,独立样本均值的检验,基本思想:首先确定来自两个独立总体的样本方差是否相等,然后根据判断结果来选择检验统计量,用t检验的方法对两个样本的均值进行检验,若两个均值相差过大,则可以拒绝两个总体均值相等的原假设,说明两个总体具有显著性差异。,独立样本均值的检验,独立样本的均值检验,实质是总体均值是否相等的显著性检验如分析两个地区居民的人均收入、人均消费等指标是否存在显著性差异;男生与女生的身高 是否存在显著性差异。要求两个样本来自的总体为正态分布,且相互独立如果两总体相互独立,则分别从两总体得到的样本也相互独立。因为要检验两总体的均值是否相等,需要通过样本进行检验,所以称为独立样本的均值检验。,检验步骤,提出假设确定检验统计量需要分为总体方差是否已知两种情况进行讨论 做出统计推断,检验统计量(1),若总体方差 已知,可构造标准正态分布Z检验统计量,检验统计量(2),若总体方差 未知,可构造t检验统计量当 时,构造的t检验统计量为:式中,、分别为两样本 标准差。,检验统计量(3),当 时,构造的t检验统计量为:检验统计量仍服从t分布,其修正的自由度为:,注意,在统计分析中,如果两个总体的方差相等,则称之为满足方差齐性。确定两个独立样本的方差是否相等,是构造和选择检验统计量的关键,因此在决定要用哪一个t统计量公式前,必须进行方差齐性的检验。SPSS中利用Levene F方差齐性检验方法检验两个独立总体的方差是否存在显著性差异。,方差齐性的检验步骤,提出假设确定检验统计量采用的是F检验统计量做出统计推断拒绝域为:,例题分析,仍以学生的身高为例,比较男生和女生的平均身高是否相等。,第一步,进行方差齐性检验已知:n1=8,n2=7。经计算:于是,检验统计量F的值为:取显著性水平=0.05,查F分布表得临界值为说明F值落在接受区域内,即不能拒绝原假设,认为男生的身高的方差与女生的身高的方差无显著差异。,,,第二步,在方差齐性的假定下,进行均值的比较检验此时,取显著性水平=0.05,进行双侧检验,查t分布表可得临界值。,说明t值落在拒绝区域内,应该拒绝原假设。因此可以得出结论:男生和女生的平均身高有显著差异。,SPSS应用,操作步骤(1)按照顺序:Analyze Compare Means Independent-Samples T Test,进入独立样本T检验“Independent-Samples T Test”对话框中,将左侧“身高”变量选入到检验变量“Text Variables”框中,再将分类变量“性别”选入分组变量“Grouping Variable”框中。,操作步骤(2)单击定义组别“Define Groups”按钮,弹出“Define Groups”对话框,如图所示,分别为组1和组2输入0,1。,注意:在SPSS的数据文件中,事先需要产生“性别”这 一类别变量,并定义好其取值“0”和“1”.,输出结果(1),Group Statistics,结果解释此表给出了独立样本均值检验的描述性统计量,包括两个样本的均值、标准差和均值标准误差。从表中可以看出,男生的平均身高为169.88,女生的平均身高为159.29,两者之间存在一定差距。但还需进一步检验后再做决策。,输出结果(2),Independent Samples Test,结果解释对于方差齐性检验,其p值为0.3750.05,所以不能拒绝原假设,即认为两样本来自的总体的方差相等。对于均值的检验,应在方差齐性假定下进行。其对应的p值为0.0010.05,所以拒绝原假设,认为男生和女生的平均身高有显著性差异。,配对样本均值的检验,-比较两个配对总体的均值是否有显著性差异,什么是配对样本,指不同的均值来自具有配对关系的不同样本,此时样本之间具有相关关系,配对样本的两个样本值之间的配对是一一对应的,并且两个样本具有相同的容量。如,一组病人治疗前和治疗后身体的指标;一个年级学生的期中成绩和期末成绩等等。,配对样本的数据形式,基本思想,配对样本均值的检验就是根据两个配对样本,推断两个总体的均值是否存在显著性差异。其基本思想是:先求出每对配对样本的观测值之差,形成一个新的单样本,再对差值求均值,检验差值的均值是否为0。若两个样本的均值没有显著性差异,则样本之差的均值就接近为0,这类似于单一样本均值的检验。配对样本均值的检验也叫作配对样本的检验(Paired-Samples T Test)。,检验步骤,提出假设确定检验统计量做出统计推断,检验统计量,配对样本均值检验要求两个样本的差值服从正态分布。总体差值D服从正态分布,为总体差值的均值。t检验统计量为:式中,S为样本差值的标准差,定义为:。,一个以减肥为主要目标的健美俱乐部声称,参加其 训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名 参加者,得到他们的体重记录如下表:,例题分析,在=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?,左侧检验,配对样本的 t 检验(例题分析),配对样本的 t 检验(例题分析),差值均值,差值标准差,H0:m1 m2 8.5 H1:m1 m2 8.5a=0.05,df=10-1=9临界值(s):,检验统计量:,决策:,结论:,在=0.05的水平上不拒绝H0,不能认为该俱乐部的宣称不可信,配对样本的 t 检验(例题分析),说明 SPSS统计软件中,检验程序的输出结果中如果未标明是单侧还是双侧检验,其所显示的P值均是双侧检验的结果。若使用者欲进行的是单侧检验,其程序与双侧检验相同,但所得到的P值须自行除以2,再与显著性水平相比较。不过,就假设检验而言,大部分都属于双侧检验的假设,故不需再除以2。,现以T表示所用的检验统计量,t表示根据样本计算得到的检验统计量的值。现分别考虑左侧检验和右侧检验,单侧检验的P值见下表:其中,P值(双侧)是SPSS软件运行假设检验程序的结果,SPSS应用,操作步骤(1)点击按顺序打开“Transform”-“Compute”,打开对话框,并输入相应变量及其公式后,如图所示:,操作步骤(2)按照顺序:Analyze Compare Means Paired-Samples T Test,进入配对样本T检验“Paired-Samples T Test”对话框中,将左侧“x0”和“x2”变量选入到“Paired Variables”框中,如图所示,输出结果(1),Paired Samples Statistics,输出结果(2),Paired Samples Correlations,结果解释此表给出了配对样本间的相关性,相关系数为0.964,说明彼此间高度相关,且其检验的p值为00.05,意味着其相关性是显著性的,输出结果(3),结果解释:此问题为左侧检验:H0:1-28.5,H1:1-20,所以,此例检验的P值应为1-0.084/2=0.9580.05,故不能拒绝原假设,即没有充足的理由认为该俱乐部的宣称是不正确的。,Excel中的统计函数,ZTEST计算Z检验的P值TDIST计算t分布的概率TINV计算t分布的临界值TTEST计算t分布检验的P值FDIST计算F分布的概率FINV计算F分布的逆函数(临界值)FTEST计算F检验(两个总体方差比的检验)单尾概率,