第八章假设检验ppt课件.ppt
《第八章假设检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《第八章假设检验ppt课件.ppt(102页珍藏版)》请在三一办公上搜索。
1、第八章 假设检验,假设检验的基本问题 一个总体参数的检验两个总体参数的检验,学习目标,假设检验的基本思想和原理 假设检验的步骤一个总体参数的检验两个总体参数的检验P值的计算与应用用Excel进行检验,正常人的平均体温是37oC吗?,当问起健康的成年人体温是多少时,多数人的回答是37oC,这似乎已经成了一种共识。下面是一个研究人员测量的50个健康成年人的体温数据,正常人的平均体温是37oC吗?,根据样本数据计算的平均值是36.8oC ,标准差为0.36oC 根据参数估计方法得到的健康成年人平均体温的95%的置信区间为(36.7,36.9)。研究人员发现这个区间内并没有包括37oC 因此提出“不应
2、该再把37oC作为正常人体温的一个有任何特定意义的概念”我们应该放弃“正常人的平均体温是37oC”这个共识吗?本章的内容就将提供一套标准统计程序来检验这样的观点,假设检验的基本原理 怎样提出假设? 怎样做出决策? 怎样表述决策结果?,假设检验,怎样提出假设?,假设检验的基本原理,什么是假设?(hypothesis), 在参数检验中,对总体参数的具体数值所作的陈述就一个总体而言,总体参数包括总体均值、成数、方差等分析之前必需陈述,什么是假设检验? (hypothesis test),先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法有参数检验和非参数检验逻辑上运
3、用反证法,统计上依据小概率原理小概率是在一次试验中,一个几乎不可能发生的事件发生的概率在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设,原假设(null hypothesis),又称“0假设”,研究者想收集证据予以反对的假设,用H0表示所表达的含义总是指参数没有变化或变量之间没有关系 最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它 总是有符号 , 或H0 : = 某一数值H0 : 某一数值H0 : 某一数值例如, H0 : 10cm,也称“研究假设”,研究者想收集证据予以支持的假设(期望出现的结论作为备选假设),用H1或Ha表示所表达的含义是总体参数发生了变化或变量之间有
4、某种关系备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设 总是有符号 ,或 H1 : 某一数值H1 : 某一数值H1 : 某一数值,备择假设(alternative hypothesis),假设检验中的两类错误(决策风险),假设检验中的两类错误,1.第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为被称为显著性水平2.第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为(Beta),两类错误的控制,一般来说,对于一个给定的样本,如果犯第类错误的代价比犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合
5、理;反之,如果犯第类错误的代价比犯第类错误的代价相对较低,则将犯第类错误的概率定得高些一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第类错误的发生概率错误与错误的关系: 与的关系就像跷跷板, 小就大, 大就小,同时减小两类错误惟一的办法就是增加样本容量。,假设检验的流程提出假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策, 什么是检验统计量?1.用于假设检验决策的统计量2.选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为,
6、确定适当的检验统计量,规定显著性水平(significant level), 什么是显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为 (alpha)常用的 值有0.01, 0.05, 0.104.由研究者事先确定,作出统计决策,计算检验的统计量根据给定的显著性水平,查表得出相应的临界值z或z/2, t或t/2将检验统计量的值与 水平的临界值进行比较得出拒绝或不拒绝原假设的结论,统计量决策规则,给定显著性水平,查表得出相应的临界值z或z/2, t或t/2将检验统计量的值与 水平的临界值进行比较作出决策双侧检验:I统计量I 临界值,拒绝H0左侧检验:统
7、计量 临界值,拒绝H0,利用P值进行决策,什么是P 值?(P-value),是一个概率值如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积被称为观察到的(或实测的)显著性水平H0 能被拒绝的最小值,双侧检验的P 值,左侧检验的P 值,右侧检验的P 值,利用 P 值进行检验(决策准则),单侧检验若p-值 ,不拒绝 H0若p-值 /2, 不拒绝 H0若p-值 /2, 拒绝 H0,双侧检验和单侧检验,备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(tw
8、o-tailed test) 备择假设具有特定的方向性,并含有符号“”或“”,称为右侧检验,双侧检验与单侧检验,双侧检验与单侧检验 (假设的形式),双侧检验(原假设与备择假设的确定),属于决策中的假设检验不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立建立的原假设与备择假设应为 H0: = 10 H1: 10,双侧检验(显著性水平与拒绝域 ),单侧检验(显著性水平与拒绝域),3)显著性水平和拒绝域(右侧检验 ) H0 : m m0 H1 : m m0
9、,拒绝H0,P 值决策与统计量的比较,拒绝H0的两个统计量的不同显著性,Z,拒绝H0,0,统计量1,P1 值,统计量2,P2 值,拒绝H0,临界值,假设检验步骤的总结,陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策,总体均值的检验,一个总体参数的检验,总体均值的检验 (2 已知或2未知大样本),1.假定条件总体服从正态分布若不服从正态分布, 可用正态分布来近似(n30)使用
10、Z-统计量2 已知:2 未知:,总体均值检验(大样本检验方法的总结),总结,2 已知均值的检验(例题分析),【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),双侧检验,2 已知均值的检验 (例题分析),H0: = 0.081H1: 0.081 = 0.05n = 200临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上拒绝H0,有证据表
11、明新机床加工的零件的椭圆度与以前有显著差异,总体均值的检验( 2 已知)(例题分析大样本),【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?,双侧检验,总体均值的检验( 2 已知)(例题分析大样本),H0 : = 255H1 : 255 = 0.05n = 40临界值(c):,检验统计量:,决策:,结论:,用Excel中的【NORMSDIST】函数得到的双尾检验P=0.312945不拒绝
12、H0,没有证据表明该天生产的饮料不符合标准要求,总体均值的检验( 2 未知) (例题分析大样本),【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.01),左侧检验,总体均值的检验(例题分析大样本),H0 : 1.35H1 : 1.35 = 0.01n = 50临界值(c):,检验统计量:,拒绝H0,新机床加工的零件尺寸的平均误差与旧机床相比有显著
13、降低,决策:,结论:,总体均值的检验 (P 值的图示),计算出的样本统计量=2.6061,P=0.004579,Z,拒绝H0,0,临界值,P 值,总体均值的检验( 2 未知)(例题分析),【例】某一小麦品种的平均产量为5200kg/hm2 。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2 。试检验改良后的新品种产量是否有显著提高? (=0.05),右侧检验,总体均值的检验( 2 未知)(例题分析),H0 : 5200H1 : 5200 = 0.05n = 36临
14、界值(c):,检验统计量:,拒绝H0 (P = 0.000088 = 0.05),改良后的新品种产量有显著提高,决策:,结论:,总体均值的检验(z检验) (P 值的图示),2 未知大样本均值的检验 (例题分析),【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准? (0.05),单侧检验,2 未知大样本均值的检验 (例题分析),H0: 1200H1: 1200 = 0.05n = 100临界
15、值(s):,检验统计量:,在 = 0.05的水平上不拒绝H0,不能认为该厂生产的元件寿命显著地高于1200小时,决策:,结论:,总体均值的检验 (小样本),1.假定条件总体服从正态分布小样本(n 30)检验统计量 2 已知: 2 未知:,总体均值的检验 (小样本检验方法的总结),注:s 已知的拒绝域同大样本,总结,2 已知均值的检验 (小样本例题分析),【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05),单侧检验
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八章 假设检验ppt课件 第八 假设检验 ppt 课件
链接地址:https://www.31ppt.com/p-1372957.html