商务统计学Ch08.ppt
Chap 8-1,第8章置信区间估计,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,商务统计学(第5版),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-2,学习目标,在本章中你将学到:构建和理解均值和比例的置信区间估计如何根据所要得到的均值和比例的置信区间确定样本容量,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-3,章节提纲,本章内容总体均值,的置信区间当总体标准差已知当总体标准差未知总体比例,的置信区间确定所需的样本容量,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-4,点估计和区间估计,点估计是单个数值置信区间提供了估计变动的额外信息,点估计,置信区间下界,置信区间上界,置信区间宽度,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-5,能够估计总体参数,点估计,样本统计量(点估计),均值,比例,p,X,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-6,置信区间,有多少不确定性是与总体参数的点估计相关?区间估计比点估计提供了总体特征的更多信息这样的区间估计称为置信区间,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-7,置信区间估计,区间给出了观测值的一个范围:考虑样本统计量随着样本的不同而变化基于一个样本的观测值给出接近未知总体参数的信息以置信度表示例如95%的置信度,99%的置信度不能为100%的置信度,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-8,置信区间例子,麦片包装例子 总体的=368且=15 如果取容量n=25的样本,你知道368 1.96*15/=(362.12,373.88)包括95%的样本均值当不知道时,使用X 来估计 如果X=362.3,区间为362.3 1.96*15/=(356.42,368.18)既然356.42 368.18,基于此样本的区间正确的表述了但,其他可能容量为25的样本的区间如何?,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-9,置信区间例子,(续),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-10,置信区间例子,实践中只选择一个容量为n 的样本实践中不知道,因此也不知道 区间是否真正包含但是知道以这种方式构造的区间95%的包含因此,基于这个样本,可以有95%的把握相信区间包含(这就是置信度是95%的置信区间),(续),注意:95%置信区间是基于我们使用Z=1.96的事实,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-11,估计过程,(均值,未知),总体,随机样本,均值 X=50,样本,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-12,一般公式,所有置信区间的一般公式为:,点估计(临界值)(标准差),其中:点估计是样本统计量估计总体参数临界值是点估计和所要求的置信度的抽样分布产生的值标准差是点估计的标准误差,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-13,置信度,置信度置信区间包含未知总体参数百分数(低于100%),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-14,置信度,(1-),假设置信度=95%也可写成(1-)=0.95,(故=0.05)一般的相关解释:构造的所有置信区间95%包含未知的真实参数特别的,区间可以包含也可以不包含真实参数没有可能包含在一个特殊区间里,(续),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-15,置信区间,总体均值,未知,置信区间,总体比例,已知,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-16,的置信区间(已知),假设总体标准差已知总体是正态分布如果总体非正态,则使用大样本置信区间估计:其中 是点估计 Z/2 是正态分布的临界值以上的比例为/2对应的数值 是标准差,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-17,寻找临界值,Z/2,考虑置信度是95%的置信区间:,Z/2=-1.96,Z/2=1.96,点估计,置信下限临界值,置信上限临界值,Z:,X:,点估计,0,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-18,常用置信度,通常使用的置信度是 90%,95%,和99%,置信度,置信系数,Z/2 值,1.281.6451.962.332.583.083.27,0.800.900.950.980.990.9980.999,80%90%95%98%99%99.8%99.9%,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-19,置信区间和置信度,置信区间,区间从 扩展到,(1-)x100%区间包含;()x100%不包含,均值的样本分布,x,x1,x2,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-20,例子,正态总体中的11个电路样本均值电阻为2.20欧姆。从以往的测试中知道总体标准差是0.35欧姆。确定总体电阻真实均值的置信度是95%的置信区间。,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-21,例子,正态总体中的11个电路样本均值电阻为2.20欧姆。从以往的测试中知道总体标准差是0.35欧姆。解答:,(续),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-22,解释,我们95%的确定真实均值电阻在1.9932和2.4068欧姆之间 尽管真实均值可能在也可能不在这个区间,但是此种方法形成的区间95%的包含真实均值,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-23,置信区间,总体均值,未知,置信区间,总体比例,已知,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-24,你知道实际上的吗?,可能不知道!几乎在所有的实际商业应用中,是未知的 如果有一种情形,是知道的,那么也将是知道的(因为计算需要用到)如果你真实的知道,则不需要收集样本去估计它。,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-25,如果总体标准差 是未知的,我们可以用样本标准差S来替代。这种做法是非常不确定的,因为S随着样本的变化而变化。所以我们用t分布来代替正态分布。,的置信区间(未知),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-26,假设总体标准差是未知的总体服从正态分布如果总体比服从正态,则使用大样本用学生t分布置信区间估计:(其中 t/2 是具有n-1自由度和/2的累积面积的t分布的临界值),的置信区间(未知),(续),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-27,学生t分布,t 是一个分布集t/2 的值依赖于自由度(d.f.)观察值在样本均值计算后是自由变化的 d.f.=n-1,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-28,如果这三个数的均值是8.0,那么X3一定是9(即,X3 不是自由变化的),自由度(df),这里,n=3,所以自由度=n 1=3 1=2(对于一个给定的均值,2个值可以是任意的数字,但是第三个数是不能自由变化的),思想:观察值在样本均值计算后是自由变化的例子:假设3个数字的均值是8.0 令X1=7令X2=8X3是多少?,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-29,学生t分布,t,0,t(df=5),t(df=13),t-分布是钟形的对称的,但其尾部比正态的“胖”,标准正态(t 有df=),注意:t Z 是n增加,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-30,学生t分布表,上部的尾部面积,df,.25,.10,.05,1,1.000,3.078,6.314,2,0.817,1.886,2.920,3,0.765,1.638,2.353,t,0,2.920,表的主体包含t值,但没有概率,令:n=3 df=n-1=2=0.10/2=0.05,/2=0.05,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-31,选择t分布值,与Z值进行比较,置信 t t t Z 度(10 d.f.)(20 d.f.)(30 d.f.)(d.f.)0.80 1.372 1.325 1.310 1.28 0.90 1.812 1.725 1.697 1.645 0.95 2.228 2.086 2.042 1.96 0.99 3.169 2.845 2.750 2.58,注意:t Z 是n增加,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-32,t分布的置信区间例子,46.698 53.302,一个随机样本n=25,有X=50和S=8。形成的置信度是95%的置信区间d.f.=n 1=24,所以置信区间是,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-33,t分布的置信区间例子,解释这个区间需要假定总体接近于一个正态分布(尤其是因为n仅仅是25)。这个条件可以通过生成如下形式来进行核查:正态概率图盒形图,(续),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-34,置信区间,总体均值,未知,置信区间,总体比例,已知,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-35,总体比例置信区间,,总体比例()的区间估计可以通过对样本比例(p)的不确定性增加一个限制来计算。,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-36,总体比例置信区间,,回忆一下样本比例,如果样本容量足够大,其分布将接近正态分布,有标准差我们将通过样本数据估计如下形式:,(续),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-37,置信区间端点,置信区间上下界通过以下公式来计算其中 Z/2 是所要求的置信度的标准正态值p 是样本比例n 是样本容量注意:一定要 np 5 和n(1-p)5,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-38,例子,一个100人的随机样本有25个人是左撇子生成一个左撇子的真实比例,具有置信度是95%的置信区间,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-39,例子,一个100人的随机样本有25个人是左撇子。生成一个左撇子的真实比例,具有置信度是95%的置信区间。,(续),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-40,解释,我们有95%的把握确信在总体中左撇子的比例在16.51%和 33.49%之间 尽管区间0.16510.3349有可能包含也有可能不包含真实的比例,但是对于这100个样本用此种方法生成的区间95%包含真实比例。,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-41,样本容量的确定,均值,样本容量的确定,比例,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-42,抽样误差,样本容量需要达到置信度(1-)要求下的误差界限(e)此误差界限也称为抽样误差总体参数估计时的不精确量点估计生成置信区间时增加减少的量,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-43,样本容量的确定,均值,样本容量的确定,抽样误差(误差界限),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-44,样本容量的确定,均值,样本容量的确定,(续),求解n得到,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-45,样本容量的确定,为了确定均值所需的样本容量,必须知道:目标置信度(1-),其决定了关键值 Z/2可接受的抽样误差 e标准差,(续),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-46,求样本容量的例子,如果=45,在90%的置信度下均值5的估计所需的样本容量要多大?,(取整),所以目标样本容量 n=220,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-47,如果未知,如果是未知的,其可以通过目标样本容量的公式来进行估计使用的值应期望至少与真实的值一样大选择一个试验样本并通过样本标准差S来估计,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-48,样本容量的确定,样本容量的确定,比例,求解n得到,(续),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-49,样本容量的确定,为了确定比例的目标样本容量,必须知道:目标置信度(1-),其决定了关键值 Z/2可接受的抽样误差 e真实的总体比例 可以通过一个试验样本来估计(或者谨慎的使用0.5来估计),(续),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-50,求样本容量的例子,在95%的置信度下,多大的样本可以估计真实比例,且其总体误差在3%以内?(假定一个试验样本p=0.12),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-51,求样本容量的例子,解:对于95%的置信度,Z/2=1.96e=0.03p=0.12,用此估计,故 n=451,(续),Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-52,道德问题,当研究一个点估计时,置信区间估计(反映抽样误差)也将进行研究置信度总是将被提到样本容量将被提到置信区间估计的解释也将被提供,Basic Business Statistics,11e 2009 Prentice-Hall,Inc.,Chap 8-53,小结,介绍置信区间的概念讨论点估计置信区间的估计均值的置信区间估计(已知)均值的置信区间估计(未知)比例的置信区间估计目标均值比例的样本容量的确定置信区间估计与道德问题,