样本置信区间和假设检验gdfsgsfd.ppt
《样本置信区间和假设检验gdfsgsfd.ppt》由会员分享,可在线阅读,更多相关《样本置信区间和假设检验gdfsgsfd.ppt(34页珍藏版)》请在三一办公上搜索。
1、第3部分:,单样本置信区间和假设检验,第3部分:单样本置信区间和假设检验,目的:这一部分的目的是介绍连续数据的置信区间和假设检验。目标:了解假设检验和置信区间的基本原理-确定所观测的差异是真实的,还是偶然因素引起的。计算样本平均值的置信区间,并将这一平均值与期望(或目标)平均值相比较。使用单样本置信区间和假设检验,将平均值与目标值相比较。,举例洗衣机传动装置的总高度将影响制动性能。项目Y是总高度,目标值=5.394,加工这种部件时所使用的固定架共有8个。您想了解什么?,使用第三个固定架生产出的部件的平均高度与目标值是否一致?,分析步骤:1.将数据绘制成图2.使用假设检验和置信区间来确定所观测到
2、的差异是否真实。3.得出结论。,设备3 的10 个部件的高度,用图形来表示数据,设备3中10个部件的高度5.3945.3945.3935.3945.3945.3955.3965.3975.3955.395,总体平均值的最可能的范围是多少?x(5.3947)与目标值(5.394)之间的差异是由于偶然因素造成的吗?,置信区间,设备3所制造的所有部件的平均值最可能的取值范围是什么?让我们来计算一下置信区间,以便找出该值!单个平均值的置信区间,(1-)100%置信度,真正的总体均值包含在置信区间内。,什么是t分布?类似于正态分布(z),正态分布(z):已知总体标准差,,t分布(t):估计的标准差,s,
3、用于提供有关平均值的结论(置信区间和假设检验),我们将需要使用t分布,t=(x-)/(s/n),-,置信区间,其中:x=样本平均值t=t表格中的t统计结果a=a风险df=自由度=n-1s=样本标准差n=样本中的数据点数量,置信区间上限值=x+t(a/2,df),置信区间下限值=x-t(a/2,df),用所给出的有关部件的数据代入以上公式,置信区间,计算利用设备3所生产的传输设备平均高度的置信区间使用=0.05(95%的置信区间)x=5.3947s=0.00116n=10df=n-1=9t(a/2,df)取自t表格。t(0.025,9)=2.262,区间上限=x+t(a/2,df),t表格,自由
4、度为9,=.05/2=.025,范例-续设备3所制造部件的平均值是否在目标范围之内?,设备3生产出的部件总体的平均值最有可能是5.3947,但实际值可能比该值大一点或小一点。,5.393,5.394,5.395,5.396,5.397,设备3,高度(英寸),目标值=5.394英寸,平均值的95%置信区间,置信区间上限值=5.3955英寸,置信区间下限值=5.3939 英寸,设备3所生产的部件的总体平均值最可能的取值范围为5.3939到5.3955。,举例-续,置信区间说明以这种方式构成的区间的95%是正确的(包含真正的总体平均值),以此构成的区间的5%是不正确的。目标值5.394包含在此区间内
5、。统计评价:没有证据证明设备3所制造部件的平均高度不在目标范围之内。实际评价:目标值刚好在置信区间内。计算时只用到10 个数据点,并且=0.05。您可以使用置信区间来进一步调查设备3获得更多样本(如果是实际的)并计算置信区间使用不同的值来计算置信区间,置信区间量化了数据的不定性。,样本大小对置信区间的影响,让我们取20个以上的样本(总数 n=30),看一看对95%的置信区间有何影响。假设平均值和标准差保持不变:x=5.3947 和 s=0.00116。,置信区间上限值=x+t(a/2,df),置信区间下限值=x-t(a/2,df),样本大小对置信区间的影响-续,通过增加样本,可以证明设备3所制
6、造部件的平均高度不在目标范围内。,目标值=5.394英寸,n=10 的95%置信区间为5.3939-5.3955.n=30的95%置信区间为 5.3943-5.3951.唯一改变的是 n。,置信区间随样本容量的增加而减小。,对置信区间的影响,计算设备3所制造传送装置的平均高度的90%置信区间。取 n=10(x=5.3947,s=0.00116),计算设备3所制造传送装置的平均高度的99%置信区间。取 n=10(x=5.3947,s=0.00116),对置信区间有何影响?,对置信区间的影响,唯一改变的是 a。我们能够以90%置信度来说明设备3所制造的部件不在目标范围内我们不能以99%的置信度说来
7、说明设备3所制造的部件不在目标范围内。,置信区间随着值的增大而增大。,另一种确定是否存在差异的方法:假设检验,置信区间给出了总体值(参数)的最可能的取值范围。假设检验用于确定所观测的差异是确实存在,还是偶然产生的。我们可以量化确实存在差异的置信程度。,所有 潜在“X”,关键少数“X”,定义假设:Ho 和 Ha,Ho假设检验的起点是零假设-H0。H0是相同或没有差异假设。举例:总体均值等于检验均值。Ha第二条假设是Ha-备择假设,即差异假设。举例:总体均值不等于检验均值。,您通常想表明差异是确实存在的(Ha)。通过假定相等(Ho)开始。如果数据表明它们不相等,则它们一定存在差异(Ha)。,和风险
8、,风险:当H0为真时,拒绝Ho-有时称为厂商风险风险:当H0为假时,接受Ho-有时称为消费者风险,t 检验,t检验可用来检验:目标值(或检验均值)与计算的样本均值的对比-单样本t检验,或者两个计算的样本均值之间的对比-双样本t检验(将在第4部分进行讨论)让我们使用Minitab来执行单样本t检验。将设备3的平均值与目标值5.394进行比较。假设检验Ho:=5.394Ha:不等于5.394在Minitab中打开文件“lth”L:6sigmaMinitabTrainingMinitabSession 2lth.mtw,点击“图形”,双击“确定”按钮运行,单样本检验 t-检验-利用Minitab,选
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 置信区间 假设检验 gdfsgsfd

链接地址:https://www.31ppt.com/p-6301802.html