方差检验和拟合优度检验.ppt
2000年12月,北京大学光华管理学院 王明进 陈奇志,1,第四讲复习,单样本均值的检验:大样本、小样本;单样本比率的检验:大样本;双样本均值的检验:大样本、小样本;双样本比率的检验:大样本;问题:大样本和小样本下对总体的先验认识可以有哪些区别?,2000年12月,北京大学光华管理学院 王明进 陈奇志,2,第四讲复习(续),问题:在构造拒绝域时,为什么统计量的抽样分布是重要的?问题:对第7章中的概念你是否有了更新的认 识呢?,2000年12月,北京大学光华管理学院 王明进 陈奇志,3,第四讲复习(续),置信区间和假设检验的关系;置信系数是1-的置信区间和显著水平是的双边检验的拒绝域有什么关系?匹配样本(双样本)的均值检验问题;检验的P值。,2000年12月,北京大学光华管理学院 王明进 陈奇志,4,第五讲,方差检验和拟合优度检验2000年12月,2000年12月,北京大学光华管理学院 王明进 陈奇志,5,关于方差,方差刻画了什么?一种零件的尺寸的方差;一种股票收益率的方差;.方差的点估计:样本方差 方差的区间估计呢?,2000年12月,北京大学光华管理学院 王明进 陈奇志,6,自动饮料机的例子,某种自动饮料机的饮料灌装量的方差是一个重要的技术指标,方差太大,意味着可能经常出现过度灌装或者灌装不足,这会引起饮料机的拥有者或者顾客的不满。在对某一特定的机器灌装量的测试中,由18杯饮料组成的随机样本得到样本方差是0.40。问题:1)该机器灌装量的方差的点估计是多少?2)该方差的置信水平为90%的置信区间是什么?3)如果一个可以接受的方案是方差不超过0.25,根据测试的结果你是否认为该机器不合格?,2000年12月,北京大学光华管理学院 王明进 陈奇志,7,如何得到方差的置信区间?,为了求置信区间,我们需要什么?为此,我们需要对总体的分布做哪些要求?对于饮料的灌装量,这种要求是否合理?关于样本方差的抽样分布的一个结果,2000年12月,北京大学光华管理学院 王明进 陈奇志,8,再看卡方分布.,2(n-1),21-(n-1),自由度为n-1的卡方分布以及其上下分位数,2000年12月,北京大学光华管理学院 王明进 陈奇志,9,方差的区间估计,2000年12月,北京大学光华管理学院 王明进 陈奇志,10,灌装量方差的90%置信区间,如何得到自由度为17的卡方分布的上下0.05分位数?(查表得到分别为8.67176,27.5871)灌装量方差的置信水平是90%置信区间是(0.246492,0.784155)问题:1)怎么解释以上区间的含义?2)给定显著水平0.10,能否拒绝原假设H0:2=0.30,为什么?拒绝域是什么?,2000年12月,北京大学光华管理学院 王明进 陈奇志,11,该机器是否合格?,检验假设:H0:20.25,H1:20.25;拒绝域的形状:s2c,c=?根据抽样分布确定拒绝域为此时犯第一类错误的概率不会超过,为什么?,2000年12月,北京大学光华管理学院 王明进 陈奇志,12,取显著水平=0.05时,拒绝域为可以认为该机器不合格吗?,2000年12月,北京大学光华管理学院 王明进 陈奇志,13,小结:单样本方差的检验,它们的拒绝域的形状分别是什么?怎样确定拒绝域?此时对总体和样本有什么要求?,2000年12月,北京大学光华管理学院 王明进 陈奇志,14,选择哪个公司的校车服务?,Dullus县学校要更新明年的校车服务合同,需要从Milbank和Gulf Park两家公司中选择一个。选择校车运送或者到达时间的方差作为衡量公司服务质量的指标。学校需要了解这两家公司的服务质量是否相同,如果相同,他们就会选择价格较低的一家。他们调查了M公司的25个到达时间以及G公司的16个到达时间,分别得到样本的方差是48和20。他们是否有充分的理由认为两家公司的服务质量不同?,2000年12月,北京大学光华管理学院 王明进 陈奇志,15,怎样用模型来刻画我们的问题?,我们的总体是什么?对总体假定是服从正态分布的,可以吗?检验假设:拒绝域的形状是什么?,2000年12月,北京大学光华管理学院 王明进 陈奇志,16,下一步,我们需要知道.,在H0成立时,的抽样分布是什么?已有的结果:当样本容量为n1和n2的独立简单随机样本分别取自两个方差相等的正态总体时,即自由度为n1-1和n2-1的F分布。,2000年12月,北京大学光华管理学院 王明进 陈奇志,17,关于F分布.,一个重要的性质:,F1-,F,自由度为n和m的F分布。如何找到分位数?,2000年12月,北京大学光华管理学院 王明进 陈奇志,18,确定我们的拒绝域,拒绝域应为对选择校车问题,使用显著水平0.10,则,(见P.680-681),2000年12月,北京大学光华管理学院 王明进 陈奇志,19,对校车选择的建议,根据上面的分析,你对Dullus学校选择校车有什么建议?你的根据是什么?,2000年12月,北京大学光华管理学院 王明进 陈奇志,20,两个总体的方差的单边检验,根据你对假设检验过程的理解,你能够写出下面两个检验的拒绝域吗?,2000年12月,北京大学光华管理学院 王明进 陈奇志,21,谁的起薪更高一些?,财富杂志1995年6月26日刊载了会计师和财务计划人员的起始年薪。他们分别抽取了12名会计师和14名财务计划人员作为样本,得到他们的起始年薪如教材292页所述。问题:能否说这两种职业的平均起薪有明显差异?,2000年12月,北京大学光华管理学院 王明进 陈奇志,22,2000年12月,北京大学光华管理学院 王明进 陈奇志,23,2000年12月,北京大学光华管理学院 王明进 陈奇志,24,2000年12月,北京大学光华管理学院 王明进 陈奇志,25,小结:双样本方差的检验,双样本方差的检验;F分布;更多的例子后面的内容,让我们记住卡方!,2000年12月,北京大学光华管理学院 王明进 陈奇志,26,Scott Marketing Research Co.,Scott公司进行了一项市场份额的研究。在过去的一年里,公司A的市场份额稳定在30%,公司B在50%,公司C在20%。最近公司C开发了一种“新型”产品并取代了当前市场的产品。Scott受雇于公司C,为它判断新产品是否使市场份额发生了改变。Scott公司通过问卷调查了一组200名的顾客群体,询问他们对公司A、B、C的购买偏好,结果48人选择A,98人选择了B,54人选择了C。根据这些数据,Scott公司需要判断市场份额是否已经发生了变化。你如何解决该类问题?,2000年12月,北京大学光华管理学院 王明进 陈奇志,27,建立我们的模型,总体是什么?用什么分布描述?多项分布(二项分布的推广)检验假设:H0:PA=0.30 PB=0.50 PC=0.20;H1:总体比例已经发生改变。检验的思路:如果H0是对的,那么200人中的观测结果不会与期望的结果相差太大。,2000年12月,北京大学光华管理学院 王明进 陈奇志,28,检验方法,计算观测频数和期望频数以及它们之差;拒绝域的形状是抽样分布是什么?在大样本情形而且所有期望频数不少于5的时候,近似地有,2000年12月,北京大学光华管理学院 王明进 陈奇志,29,计算结果,类别假设比例观测频数期望频数差值差值平方 差值平方与 期望频数之比公司A 0.3 48 60-12 144 2.4公司B 0.5 98 100-2 4 0.04公司C 0.2 54 40 14 196 4.9合计 200 200 7.34给定显著水平为0.05,拒绝域应该是什么?你认为市场份额发生改变了吗?,5.99,拒绝,2000年12月,北京大学光华管理学院 王明进 陈奇志,30,考试分数的总体是服从正态分布吗?,Chemline 每年大约为其分布在美国的四家工厂雇佣400名新雇员。由人事部进行标准化考试,考试分数是录用雇员决策中的主要因素。随着每年进行的大量考试,人事主管提出正态分布是否可以用于考试分数总体的问题。如果可以应用正态分布,它的使用将有助于评价具体考分。(数据见P.339),2000年12月,北京大学光华管理学院 王明进 陈奇志,31,检验的思路:如果H0是对的,那么50人中的观测结果不会与期望的结果相差太大。,2000年12月,北京大学光华管理学院 王明进 陈奇志,32,检验方法,划分取值区间;计算各区间观测频数和期望频数以及它们之差;拒绝域的形状是抽样分布是什么?在大样本情形而且所有期望频数不少于5的时候,近似地有,2000年12月,北京大学光华管理学院 王明进 陈奇志,33,给定显著水平为0.1,拒绝域应该是什么?,0,拒绝,12.017,2000年12月,北京大学光华管理学院 王明进 陈奇志,34,本讲内容总结,单样本方差的检验;双样本方差的检验;卡方分布和F分布;多项总体的拟和优度检验;正态总体的拟合优度检验;,2000年12月,北京大学光华管理学院 王明进 陈奇志,35,作 业,教材321页21题、329页7题、以及345页33题。案例讨论:教材345页案例12-1(数据见网上邻居),