《金融统计03假设检验与方差分析.ppt》由会员分享,可在线阅读,更多相关《金融统计03假设检验与方差分析.ppt(36页珍藏版)》请在三一办公上搜索。
1、第3章假设检验与方差分析,第1节 假设检验第2节 方差分析第3节 方差分析应用:恩格尔系数 的城乡比较,第1节 假设检验,主要内容假设检验的概念假设检验的标准假设检验的步骤,假设检验的概念及形式,假设检验对总体的某个参数或分布形式作出某种假设,然后利用样本信息来判断假设是否成立假设检验的形式假设分为原假设(H0)和备择假设(H1)两种原假设(Null hypothesis):初始假定为真的假设备择假设(Alternative hypothesis):与原假设的内容相反,当原假设被拒绝时,被认为是真的假设应用中,原假设一般是旧的、他人的观点或理论,备择假设一般是新的、自己的观点或理论,而统计分析
2、的目的往往就是以新的数据来拒绝原假设,支持自己的观点所以,习惯上,能拒绝原假设的检验,称为显著的、有统计意义的(Significant),否则为不显著,原假设(H0)和备择假设(H1)例,某汽车使用改进型发动机后声称油耗不超过百公里6升,对此进行检验检验假设的设定:设u为百公里平均油耗,则单边检验(只检验小于或大于检验值中的一种情况)工厂对收到的一批长度为2cm的零件抽检,检验长度是否合格?检验假设的设定:设u为平均长度,则双边检验(同时检验小于、大于检验值的两种情况,常用),假设检验的标准:显著水平,显著水平的定义假设检验中的第一类错误(type I error):拒绝正确的原假设(H0)显
3、著水平指犯第一类错误的最大概率,通常设定为5%或1%显著水平的理解形象的说,显著水平为1%是指,拒绝100次原假设,只有1次是拒绝错了(即只有1次原假设确实正确)因为原假设往往是公认的观点、成熟的理论,甚至已经反复检验证明是正确的,所以为了加强拒绝的说服力,应设定一个严格的拒绝标准,即要将显著水平设的很小显著水平越小,原假设值的允许变动范围就越大,备择假设成立的范围就越小,备择假设成立的概率就越小。如果能成立,则结论就很有说服力,不同显著水平的比较(单边检验),假设国家标准规定冰箱使用年限必须10年或以上对某品牌抽样检验时,如果显著水平设为40%,则样本均值9年或以下即可认定为不合格。显著水平
4、设为5%,则样本均值4年或以下才可认定为不合格,相当于把原假设放宽到H04,更有说服力,原假设H0=10 即假设某品牌合格,4,某品牌冰箱总体的特征,显著水平5%,概率,显著水平40%,9,10,冰箱使用年限,图中4为5%的临界值 9为40%的临界值,显著水平的运用:t 统计量,t 统计量的定义假定总体服从正态分布,则抽取的样本的平均值可用下列公式换算成t 分布的值(简称t值),该值可用来判断样本平均值相对于总体平均值的误差程度t 统计量公式的理解公式中总体均值0在假设检验时,等于原假设H0的值上述t值公式就是将样本均值换算成一个标准化的t值,这与将正态变量换算成标准正态变量一样,所以t分布的
5、中心为0显然,t值的绝对值越大,样本均值离原假设H0的值越远,样本越不支持原假设,显著水平的运用:t 检验,显著水平在t 检验中的运用过程如下:假定原假设成立,比如将样本统计量的值按前述公式换算成t值,其中0 等于原假设的,比如10从t分布表查出某一显著水平(比如5%)的临界值t0.05比较换算的t值与临界值t0.05。如果|t值|t0.05,则拒绝原假设,反之,接受原假设,t检验示意图(双边检验,显著水平设为5%),将样本均值换算成标准化的t值,如果|t值|临界值,表明样本均值离原假设的总体均值很远,样本来自于这个总体的可能性很小,于是原假设(H0)成立的概率也很小,所以拒绝H0,0,t临界
6、值(约为-2),2.5%,t值,拒绝域,单边检验示意图,显著水平,概率,拒绝域,t临界值(约为2),2.5%,95%,假设检验的实用标准:P值,根据样本值计算的显著水平又称为P值比如:5%显著水平下的临界值为4,而实际的样本均值为3,小于临界值,则P值也小于5%(比如4%等)统计软件作检验时,通常会根据样本值计算相应的P值,所以一般直接使用P值作为假设检验的标准,非常方便判断原理如下如果P值1%,则检验值在1%水平显著,拒绝H0如果1%5%,则检验值不显著,接受H0,P值与t 统计量,主要区别P值不依赖于样本变量的分布形式,适用于任何假设检验,而t统计量依赖于样本变量的分布,适用范围有限P值可
7、直接与显著水平比较,判断简单,而t统计量需查表、换算,判断复杂在应用统计的假设检验中,更多使用P值作为检验标准主要联系一般情况下,P值和t值有如下对应关系:P值5%时,|t值|2所以实用中(比如回归分析中),要获得有统计意义的结论(即在5%显著水平拒绝原假设(H0),可作下列任一种判断:看P值时,应5%看|t值|时,应 2,假设检验的步骤,(1)选择要检验的统计量(比如样本均值)(2)确定原假设(H0)和备择假设(H1)(3)确定检验的显著水平(一般为5%)(4)查表确定与显著水平相对应的t分布的临界值(5)将要检验的统计量换算成标准化的t值(6)根据要检验的统计量的|t值|大于还是小于临界值
8、,决定是否拒绝原假设(H0)如果使用统计软件,则只要(1)、(2)、(3)步,然后看输出的P值是否小于显著水平决定是否拒绝原假设,假设检验例,将旅客对机场的评价分为10级,7级以上为高服务质量。随机抽取12名旅客对某机场的评级,分别为7、8、10、8、6、9、6、7、7、8、9、8。检验该机场是否为高服务质量?,假设检验例(续),(1)确定检验样本均值(2)确定原假设和备择假设(3)确定显著水平为5%(4)查表得t分布的临界值(5)将样本均值换算成标准化的t值(6)要检验的统计量的|t值|临界值,所以拒绝原假设(H0):结论是:7.75确实大于7,该机场是高服务质量,第2节 方差分析,主要点内
9、容方差分析的概念组间平方和与组内平方和的概念如何判断方差分析的结果,什么是方差分析?,方差分析(ANOVA)的定义在相同方差假定下,检验多组正态样本的均值是否相等的一种统计分析方法方差分析的基本概念因子:实验中会改变状态的因素因子的水平:因子的状态方差分析的应用例两种抗生素对某种疾病的疗效是否相同?某软件的升级版是否比原版运行速度更快?三个工厂生产的零件是否强度相同?(单因子:工厂;三个工厂该因子有三个水平),单因素方差分析的统计模型,模型的假定:因子A有r个水平,在第i水平下对要检验的指标作m次相互独立的观察,获得关于总体i的一个样本假定总体i服从均值为,方差为 的正态分布模型要检验的问题:
10、模型检验的结论:检验结果为F分布的值及其P值。一般将显著水平设为0.05,则当P0.05时,拒绝H0,即r个水平不全相同;当P0.05时,接受H0,即r个水平全部相同。,单因素方差分析原理(1),假定:因子A有r个水平,在第i水平下对要检验的指标作m次相互独立的观察,获得关于总体i的一个样本。则共有个观察值总离差平方和为,总离差的两个来源:组间平方和与组内平方和组间平方和,即每个水平的均值与总均值的离差的平方和组内平方和,即每个水平内,各观察值之间的离差的平方和,视为随机取样的误差总方差和两个来源的关系,单因素方差分析原理(2),如何判断各个水平下的均值是否相等?对组间平方和SA与组内平方和S
11、e分别作自由度调整将调整后的组间平方和SA与组内平方和Se相除,该比值服从F分布F值1,表示组间的差距组内的随机差距,各组数据可能有质的区别,均值相等的可能性较小根据F分布值的P值大小即可判断均值是否相等:P值0.05,检验结果显著,拒绝H0,即不全相等;P值0.05为接受H0全相等,单因素方差分析原理(3),使用EViews软件作单因素方差分析例(1),某银行规定VIP客户的月均账户余额要达到100万元,并以此作为比较各分行业绩的一项指标。现从三个分行(A1、A2、A3)中,分别随机抽取4个VIP客户账户,用单因素方差分析判断三个分行此项业绩指标是否相同。,例续1:EViews数据表,定义三
12、个分行变量,分别输入4个账户余额,得数据表,例续2:三个分行账户余额的均值,求随机变量的均值等基本统计量:菜单ViewDescriptive StatsCommon Sample,例续3:作方差分析选菜单ViewTest of Equality,例续4:检验结论,显然方差分析的F分布值的P值=0.00010.05,拒绝H0,即三个分行VIP账户余额不全相同。,使用EViews软件作单因素方差分析的详细结果,Source of variation:离差来源Between:组间平方和Within:组内平方和Total:总平方和,df:自由度,方差分析例:工资(1),从美国劳工部的统计中,选出两个职
13、业男、女周工资数据,分别分析两个职业的男女工资差异,方差分析例:工资(2),各变量的基本统计量表两种职业的男平均工资均大于女平均工资财务管理男平均工资高出较大,方差分析例:工资(3),财务管理职业男女工资差别方差分析的检验假设 H0:财务管理职业男女平均工资相等 H1:财务管理职业男女平均工资不相等方差分析的检验结果F值22.84,p值0.001F值22.84,男女组间差距是各自组内差距的20倍以上。p值0.001,远远小于5%的显著水平(即非常显著),故拒绝H0,男女平均工资不相等,或者说男女平均工资差异大于抽样误差,方差分析例:工资(4),计算机程序员职业男女工资差别方差分析的检验假设 H
14、0:计算机程序员职业男女平均工资相等 H1:计算机程序员职业男女平均工资不相等方差分析的检验结果F值0.99,p值0.35F值0.99,男女组间差距比各自组内差距还小。p值0.35,远远大于5%的显著水平(非常不显著),不能拒绝H0,所以男女平均工资相等,差距来自抽样误差,第3节 方差分析应用:恩格尔系数的城乡比较,主要内容恩格尔系数的概念对我国近年城乡恩格尔系数的方差分析,有关居民消费结构的恩格尔系数,恩格尔系数(Engels Coefficient)反映如下规律收入越少,食品支出占总消费支出的比率越高,恩格尔系数越大随着国民经济的增长,恩格尔系数呈下降趋势国际标准根据联合国粮农组织提出的标
15、准,恩格尔系数在59%以上为贫困,50-59%为温饱,40-50%为小康,30-40%为富裕,低于 30%为最富裕。,我国近年恩格尔系数(表),联合国粮农组织的标准,我国城镇居民的系数在30-40%之间,为富裕水平;农村居民的系数在40-50%,为小康水平近年农村居民的恩格尔系数下降较为明显,我国近年恩格尔系数(图),总体趋势是下降,但有波动。主要原因是农产品价格波动农村居民恩格尔系数“悖论”:农产品价格上升收入增加食品消费支出增加恩格尔系数不变,城乡恩格尔系数的方差分析(均值),分析假设:H0:城镇和农村恩格尔系数的均值相等H1:城镇和农村恩格尔系数的均值不相等分析结论:F分布的值在0.05水平显著(P值0.05)拒绝H0的假设城镇和农村恩格尔系数的均值不相等,恩格尔系数的均值:城镇为43.71;农村为51.48,城乡恩格尔系数的方差分析(标准差),分析假设:H0:城镇和农村恩格尔系数的方差相等H1:城镇和农村恩格尔系数的方差不相等分析结论:F分布的值在0.05水平不显著(P值0.05)接受H0的假设城镇和农村恩格尔系数的方差相等,恩格尔系数的标准差:城镇为6.77;农村为6.05,所以表面看农村系数下降较快,实质上,城乡系数变化幅度是相当的,
链接地址:https://www.31ppt.com/p-6354025.html