《概率统计第章假设检验.docx》由会员分享,可在线阅读,更多相关《概率统计第章假设检验.docx(37页珍藏版)》请在三一办公上搜索。
1、概率统计第章 假设检验第八章 假设检验 第六章 假设检验 1假设检验的基本思想 一. 引例 二. 假设检验的一般步骤 三. 两类错误 2 单个正态总体参数的假设检验 一. U检验法 二. t检验法 c2检验 第 22、23 次课 4 学时 第八章 假设检验 一. 教学基本要求 1理解显著性检验的基本思想,了解假设检验可能产生的两类错误。知道两类错误概率,并在较简单的情况能计算两类错误概率,掌握假设检验的基本步骤。 2了解单个及两个正态总体的均值和方差的假设检验。 3了解总体分布假设的拟合优度检验法。 本章重点:正态总体的参数的假设检验。 二. 内容提要 1假设检验的基本概念 假设检验是基于样本
2、判定一个关于总体分布的理论假设是否成立的统计方法。方法的基本思想是当观察到的数据差异达到一定程度时,就会反映与总体理论假设的真实差异,从而拒绝理论假设。 原假设与备选假设是总体分布所处的两种状态的刻画,一般都是根据实际问题的需要以及相关的专业理论知识提出来的。通常,备选假设的设定反映了收集数据的目的。 检验统计量是统计检验的重要工具,其功能在用之于构造观察数据与期望数之间的差异程度。要求在原假设下分布是完全已知的或可以计算的。检验的名称是由使用什么统计量来命名的。 否定论证是假设检验的重要推理方法,其要旨在:先假定原假设成立,如果导致观察数据的表现与此假定矛盾,则否定原假设。通常使用的一个准则
3、是小概率事件的实际推断原理。 2两类错误概率。第一类错误概率即原假设成立,而错误地加以拒绝的概率;第二类错误概率即原假设不成立,而错误地接受它的概率。 3显著水平检验。在收集数据之前假定一个准则,即文献上称之为拒绝域,一旦样本观察值落入拒绝域就拒绝原假设。若在原假设成立条件下,样本落入拒绝域的概率不超过事先设定的,则称该拒绝域所代表的检验为显著水平的检验,而称为显著水平。由定义可知,所谓显著水平检验就是控制第一类错误概率的检验。 4单正态总体参数检验 我们以单正态总体均值检验为例,即假定总体。 已知,检验 (1) 列出问题,即明确原假设和备选假设。先设其中已知。 的估计,提出检验统计量 (2)
4、 基于 满足如下要求: (a) 在下,的分布完全已知,此处 ; 偏大时与(b) 由可诱导出与背离的准则,此处当(3) 对给定水平,构造水平检验的拒绝域 其中为标准正态分布的-分位点。 背离。 (4) 基于数据,算出的观察值,如因此检验使用统计量,称之为-检验。 当未知时,改检验统计量为 则拒绝,否则只能接受. 其中为修正样本标准差。相应的拒绝域为 为自由度的分布的 5 两个正态总体参数的检验 设是取自正态总体的样本,且,-分位点。其他的检验步骤相同。 的样本,相互独立。记 ,。 是取自正态总体。 当已知时,拒绝域为 当未知,但时,拒绝域为 ; 当 已知时,拒绝域为 。 其中 当 其中 。 。
5、未知时,拒绝域为 6 值和值检验法 值是在原假设成立条件下检验统计量出现给定观察值或者比之更极端值的概率,直观上用以描述抽样结果与理论假设的吻合程度,因而也称值为拟合优度。例如在正态总体参数检验计量为,观察值为,则 值检验法的原则是当结果为显著;当 值为 值小到一定程度时拒绝. ,通常约定:当称的情况,检验统,则称结果为高度显著。 学习要点 本章内容涉及概念及方法两大部分,要求理解和掌握假设检验的一些基本概念,如两类错误概率,否定论证原理,显著水平。弄清显著水平检验的确切含义,掌握单正态总体检验的基本方法。 习题解答 1. 在一个假设检验问题中,当检验最终结果是接受时,可能犯什么错误? 在一个
6、假设检验问题中,当检验最终结果是拒绝时,可能犯什么错误? 解 (1) 犯拒真的错误,即第一类错误;(2) 犯采伪的错误,或者说第二类错误。 2. 某厂生产的化纤纤度服从正态分布,测得25根纤维的纤度,其样本均值,试用值法检验总体均值是否为1.40. 解 原假设 值 ,统计量 ,所以值为 ,观察因此不能拒绝,即可以认为3. 某印刷厂旧机器每周开工成本服从正态分布,现安装一台新机器,观测到九周的周开工成本的样本平均元,假定标准差不变,试用值法检验周开工平均成本是否为100的假设。 解 故值为: 故拒绝4. 设试给出显著水平, 统计量 , 观察值 ,是高度显著,即是取自的检验的拒绝域的一个样本观察值
7、,要检验假设: . 解 5. 某纤维的强力服从正态分布,原设计的平均强力为6g,现改进工艺后,某天测得100个强力数据,其样本平均为6.35g,总体标准差假定不变,试问改进工艺后,强力是否有显著提高? 解 设原假设临界值 今计算值为 , 备选假设 , 拒绝域为 , 统计量 ,因而拒绝,即认为改进工艺后强力有显著提高。 6. 监测站对某条河流的溶解氧(DO)浓度记录了30个数据,并由此算得试在显著水平解 统计量 今 ,已知这条河流每日的DO浓度服从下,检验假设 , 拒绝域为 ,. . 计算值为: 因而不能拒绝. 7. 从某厂生产的电子元件中随机地抽取了25个作寿命测试,得数据:使用寿命服从,并由
8、此算得,已知这种电子元件的h以上,试在显著水平,下,检. ,且出厂标准为验该厂生产的电子元件是否符合出厂标准,即检验假设解 首先所以修正样本标准差的观察值 ,统计量的观察值为 临界值 因 ,不落入拒绝域,不能拒绝 8. 随机地从一批外径为1cm的钢珠中抽取10只,测试其屈服强度(单位:kg),得数据别检验: (1) (2) 解 (1) 拒绝域 ,并由此算得 ,其中,;. . . 的观察值为 ,在显著水平下分所以拒绝. , ,(2) 拒绝域 其中 今的观察值为 ,因而不能拒绝. 9. 一卷烟厂向化验室送去两种烟草,化验尼古丁的含量是否相同,从中各随机抽取质量相同的五例进行化验,测得尼古丁的含量为
9、: :24,27,26,21,24 :27,28,23,31,26 假设尼古丁含量服从正态分布,且种的方差为5,种的方差为8,取显著水平,问两种烟草的尼古丁含量是否有差异? 解 设假设的含量为, ,的含量为,且. 拒绝域为: ,检验其中今计算 , ,故 . 因而不能拒绝,即认为两种烟草的尼古丁含量没有差异。 10. 某厂铸造车间为提高缸体的耐磨性而试制了一种镍合金铸件以取代一种铜合金铸件,现从两种铸件中各抽一个样本进行硬度测试,其结果如下: 镍合金铸件:72.0,69.5,74.0,70.5,71.8 铜合金铸件:69.8,70.0,72.0,68.5,73.0,70.0 根据以往经验知硬度,
10、在水平上比较镍合金铸件硬度有无显著提高。 解 假设 ,检验统计量 ,且,试拒绝域为 今, 因此不能拒绝,即不能认为镍合金铸件的硬度有提高。 11. 用两种不同方法冶炼的某种金属材料,分别取样测定某种杂质的含量,所得数据如下: 原方法:26.9,25.7,22.3,26.8,27.2,24.5,22.8,23.0,24.2,26.4,30.5,29.5,25.1 新方法:22.6,22.5,20.6,23.5,24.3,21.9,20.6,23.2,23.4 假设这两种方法冶炼时杂质含量均服从正态分布,且方差相同,问这两种方法冶炼时杂质的平均含量有无显著差异?取显著水平为0.05. 解 设,检验
11、统计量为 ,检验假设为,拒绝域为 今 所以 ,其中,因此拒绝,即认为二种方法有显著差异。 12. 随机地挑选20位失眠者分别服用甲、乙二种安眠药,记录他们的睡眠延长时间,算得 ,问:能否认为甲药的疗效显著地高于乙药?假定甲、乙二种安眠药的延长睡眠时间均服从正态分布,且方差相等,取显著水平 解 设拒绝域为 ,检验假设,其中 今计算 , ,故 因此应拒绝,即认为甲药的疗效显著高于乙药。 13 灰色的兔与棕色的兔交配能产生灰色、黑色、肉桂色和棕色等四种颜色的后代,其数量比例由遗传学理论是9:3:3:1,为了验证这个理论,作了一些观测,得到如下数据: 实 测 数 理 论 数 灰色 149 144 黑色
12、 肉桂色 54 42 48 ) 棕色 11 16. ,. ) 总计 256 问:关于兔子的遗传理论是否可信内每分钟接到电话用户的呼唤次数有如下记录: 呼唤次数 0 1 2 3 4 5 6 7 实际频数 8 16 17 10 6 2 1 0 问:统计资料可否说明:每分钟电话呼唤次数服从泊松分布解 检验假设 ,先求期望数 , , , , 再计算值: ? 未知,其极大似然估计为临界值 服从泊松分布。 1 设总体写出拒绝域在水平下能否拒绝,;对于给定数据? ,因此不能拒绝,即认为每分钟呼唤次数课外练习 已知,对于检验,若在水平,下不能拒绝,问2 设,为来自总体的样本,和均未知,记,试写出对于假设的检验
13、统计量。 3 设有6台计算机,为受到病毒侵袭的台数,是未知参数。为检验假设,从6台中随机选取2台作检查,的拒绝域为概率。 4 设样本设: ,求为2台中有病毒的台数,如检验时的第二类错误时的第一类错误概率以及来自具概率密度的总体,今有关于总体的假检验的拒绝域为 绩,算出,试求该检验的两类错误概率,问在显著水平及. 5 设某次考试考生的成绩服从分布,从中随机抽取36位考生的成下可否认为考生的平均成绩? 6 某化工厂为了提高化工产品的得率,提出甲乙两种方案,为比较它们的好坏,分别用两种方案各进行了10次试验,得到如下数据: 甲方案得率(%) 68.1 62.4 64.3 64.7 68.4 66.0
14、 65.5 66.7 67.3 66.2 乙方案得率(%) 69.1 71.0 69.1 70.0 69.1 69.1 67.3 70.2 72.1 67.3 假设得率服从正态分布,问:方案乙是否比甲有显著提高? 答案和提示 12.1 (1)(2) 不能拒绝 12.2 12.3 12.4 . 12.5 可以认为平均成绩为70分。 12.6 可以认为乙方案比甲方案提高得率。 上次课复习: 总体参数既可以用一个数来估计,又可以用一个区间来估计矩估计和最大似然估计是两个基本的点估计方法点估计是区间估计的基础我们使用枢轴变量法进行区间估计 教材章节题目: 第八章 假设检验 第一节 假设检验的基本概念
15、第二节 正态总体均值的假设检验 第三节 正态总体方差的假设检验 教学要求:理解假设检验的基本思想,掌握假设检验的主要步骤掌握单个正态总体参数的假设检验及两个独立正态总体参数的假设检验,了解成对数据均值差的检验了解置信区间与假设检验的关系 重 点:正态总体参数的假设检验 难 点:假设检验的基本思想,置信区间与假设检验的关系 教学手段及教具:板书,多媒体 讲授内容及时间分配: 假设检验的提法及基本思想 20分钟 假设检验的基本概念 25分钟 假设检验的主要步骤 15分钟 置信区间与假设检验的关系 15分钟 单个正态总体均值的假设检验 30分钟 两个正态总体均值差的假设检验 25分钟 成对数据均值差
16、的检验 10分钟 单个正态总体方差的假设检验 20分钟 两个正态总体方差比的假设检验 20分钟 课后作业 习题八16 概率论与数理统计 盛骤等编著 高等教育出版社 参考资料 概率论与数理统计 陈希孺编著 科学出版社 A First Course in Probability Ross S M著 Pearson Education, Inc. 第八章 假设检验 第一节 假设检验的基本概念 总体参数既可以用一个数来估计,又可以用一个区间来估计然而实际中经常遇到的问题是面对关于参数的两个矛盾的命题,如何抉择?如,某一天要检查一个工厂的产品次品率是否低于5%,某药品的疗效是否在90%以上等等这些问题就
17、需要我们首先给出一个假设,然后根据已知的数据进行推证,从而做出没有充分理由拒绝原来的假设或有充分证据拒绝原来的假设的决定这是另一类重要的统计推断问题假设检验(Test of hypothesis) 一 假设检验的提法及基本思想 引例 根据长期的经验和资料的分析,某砖瓦厂所生产的砖的“抗断强度”服从正态分布,方差s2=1.21今从该厂生产的一批砖中,随机抽取6块,测得抗断强度如下: 32.56 29.66 31.64 30.00 31.87 31.03 问这一批砖的平均抗断强度可否认为是32.50/cm2? 我们关心砖的平均抗断强度是否为32.50/cm2回答有两种可能:不能拒绝砖的平均抗断强度
18、m =32.5, 或拒绝m =32.5为此,我们提出这样的假设H0:可以认为砖的平均抗断强度是32.50/cm2与之对立的假设H1:不能认为砖的平均抗断强度是32.50/cm2我们的任务是利用所获得的样本x1,x6, 去判断命题H0是否成立 上面的例子是要根据实际问题,提出一个假设,然后以观测数据为依据,采取一定的方法,去推证提出的假设是否成立用统计学的语言描述如下: 有一个总体X即所考察的那一大批砖的抗断强度, 并X N(m, 1.21) 根据需要, 提出一个命题H0H0:砖的平均抗断强度可以认为32.50/cm2这个命题的正确与否完全取决于总体的未知参数m的值 从总体中抽取样本即抽出的那6
19、块砖所测得的抗断强度x1,x2,x6 利用样本去判断命题H0是否成立 这就是假设检验问题假设检验指的是依据样本信息判断或检验关于总体的某个假设是否正确 我们的做法是,先假设H0是正确的,在此假设下,构造一个小概率事件经过一次试验后,若此小概率事件发生了,则拒绝(Reject)H0,否则不拒绝或“接受”H0理论依据是小概率事件原理(或实际推断原理) 二 假设检验的基本概念 1 原假设和备择假设 原假设:根据需要而设立的假设原假设是作为检验前提的假设 备择假设:当原假设被拒绝后而接受的假设 在假设检验问题中,不仅要明确原假设是什么,而且要明确备选假设是什么给定H0和H1就等于给定一个检验问题:(H
20、0,H1) 注1原假设通常应该是受到保护的,没有充足的证据是不能被拒绝的备择假设可能是我们真正感兴趣的,作为做检验的人,你的关心被表达在备择假设中 一旦建立了原假设和备择假设,我们将在原假设正确的前提下进行工作,直到有充分的证据拒绝它这正像审判,被告被假定是无罪的,直至充分的证据来证明无罪是完全不可信的统计学家Fisher是这样解释的:有一个命题,称之为“原假设”,其含义是所关心的效应不存在设计试验的唯一目的是寻求否定原假设的证据Fisher强调原假设不能被证明,只能被否定 2 单、双边检验问题 H0:q=q0,H1:qq0双边检验 H0:qq0,H1:qq0右边检验 3 检验、检验的拒绝域与
21、检验统计量 对于给定的检验问题,作出判断的依据只能是样本关键的问题是你不能等到试验结果已经得知后再来制定接受或拒绝的准则,而是应该事先规定好这种准则检验法所谓检验就是对样本空间的一个划分,并规定当观察值落入其中一部分时,就拒绝原假设;当观察值落入另一部分时,就不拒绝原假设两部分分别称为检验的拒绝域与接受域检验法对应拒绝域给出了拒绝域就定出了检验法 构造合理的检验法的通常思路找到适当的、从实际背景或理论上有说服力的统计量,使得在原假设成立时和在备择假设成立时,该统计量的值有差异从而使得我们能够根据这个统计量的值的大小来决定是否拒绝原假设称这个统计量为检验统计量(Test statistic)如引
22、例,由于要检验的假设涉及总体均值m, 而X是m的无偏估计, 可以用X出发来考虑问x-m0题如果H0为真, 那么x与m0的偏差x-m0或sn就不应太大反过来, X-m0x-m0若x与m0的偏差很大, 自然就怀疑H0的正确性而拒绝H0sn就可以作为检验统计量这样, 从定性的角度去分析, 就得到了一个在直观上合理的检验:当 x-m0sn1.96=z0.025不能认为砖的第四步:计算检验统计量的值,并作出判断 四 假设检验与置信区间的关系 检验统计量与枢轴变量一致,置信区间接受域 例如,正态总体N(m, s2),检验问题H0:m=m0, H1:mm0 x-m0我们知道,上述问题的水平a检验的接受域为s
23、x-nza2za2,此不等式可记为 , snza2m0m0 mm0 mm0 X-m0t=t(n-1)Sn tta2(n-1)tta(n-1) t-ta(n-1) 例1 一种元件, 要求其使用寿命不得低于1000 h现从一批这种元件中随机抽取25件, 测得其寿命平均值为950 h已知该种元件寿命服从标准差s=100h的正态分布N(m, s2)试在显著性水平a=0.05下确定这批元件是否合格? 解 提出假设H0:m1000, H1:m1000 Z=检验统计量X-1000N(0,1)sn X-1000-zasn拒绝域为z= 代入观测值得z=-2.52.262=t0.025(9),所以拒绝H0, 认为
24、这批产品的抗拉强度有显著变化 注1 若取a=0.01,查表得t0.005(9)=3.25, 于是t=2.7882.776=t0.025(4),拒绝H0 乙:x=114,s=6.105,t=2.198m2 m1m2 m1m2 m1m2 t-ta(n1+n2-2) 例3 在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率试验是在同一只平炉上进行的每炼一炉钢时除操作方法外, 其它条件都尽可能做到相同先用标准方法炼一炉, 然后用建议的新方法炼一炉, 以后交替进行, 各炼了10炉, 其得率分别为 (1) 标准方法: 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.
25、5 76.5 77.3 (2) 新方法: 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1 222设这两个样本相互独立, 且分别来自正态总体N(m1,s)和N(m2,s), m1,m2,s均未知问建议的新操作方法是否能提高钢的得率? (取a=0.05) 解 提出假设H0:m1m2, H1:m1m2 t=检验统计量X-Y11Sw+n1n2t(n1+n2-2) x-y11+n1n2-ta(n1+n2-2) 拒绝域为 t=sw代入观测值:t=-4.29517 22t=D-17Sn检验统计量t=nt(n-1). ta(n-1) d-17s拒绝域 持其结
26、果 代入观察值得t=1.941.833=t0.05(9)现有数据不足以拒绝H0,可以认为调查结果支第三节 正态总体方差的假设检验 一 单个正态总体方差的检验 对于单个正态总体方差的检验,主要讨论总体均值未知这种情况c检验法 表8.5 正态总体方差的水平a检验 2原假设 备择假设 2s2s0 统计量及其分布 拒绝域 s2=s02 s2s02 2s2s0 c2c12-a2(n-1) c2=(n-1)S22s2s0 2s2s0 c=检验统计量(n-1)s22(n-1)S22s0c2(n-1) 拒绝域为s022ca(n-1) 22代入观察值c=37.5s2 2s12s22122FF1-a2(n1-1,
27、n2-1) S12F=2F(n1-1,n2-1)S2或FFa2(n1-1,n2-1), FFa(n1-1,n2-1) FF1-a(n1-1,n2-1) 例2 农业试验站为了研究一种新化肥对某种农作物的效力, 在若干小区进行试验, 其产量结果为 施肥 未施肥 34 29 35 27 30 32 32 31 33 28 34 32 31 假设该农作物产量服从正态分布试问显著性水平a=0.05条件下,新化肥对该农作物产量是否有显著影响? 解 先检验两总体方差是否有显著差异提出假设: 222H0:s12=s2, H1:s1s2 22F=SS12选用统计量拒绝域为 FF1-a2(n1-1,n2-1) 或FFa2(n1-1,n2-1) 1F0.975(5,6)=0.143F0.025(6,5)现在a=0.05,n1=6,n2=7,查表 代入观测值得F=0.8因为F0.975(5,6)=0.143F=0.82.201代入观察值得t=2.83而t=2=t(1)00.125,拒绝H0, 认为两总体均值存在显著差
链接地址:https://www.31ppt.com/p-3600638.html