浙江大学概率论与数理统计(盛骤 第四版)ppt课件.ppt
《浙江大学概率论与数理统计(盛骤 第四版)ppt课件.ppt》由会员分享,可在线阅读,更多相关《浙江大学概率论与数理统计(盛骤 第四版)ppt课件.ppt(157页珍藏版)》请在三一办公上搜索。
1、1,数 理 统 计,2,第八章 假设检验,关键词:假设检验 正态总体参数的假设检验 分布拟合检验 秩和检验,3,1 假设检验,统计推断的另一类重要问题是假设检验问题。它包括(1)已知总体分布的形式,但不知其参数的情况,提出参数的假设,并根据样本进行检验.(2)在总体的分布函数完全未知的情况下,提出总体服从某个已知分布的假设,并根据样本进行检验.,4,例1 设某种清漆的9个样品,其干燥时间(以小时计)分别 为:6.0 5.7 5.5 6.5 7.0 5.8 5.2 6.1 5.0根据以往经验,干燥时间的总体服从正态分布N(6.0,0.36),现根据样本检验均值是否与以往有显著差异?,例2 一种摄
2、影药品被其制造商声称其贮藏寿命是均值180天、标准差不多于10天的正态分布。某位使用者担心标准差可能超过10天。他随机选取12个样品并测试,得到样本标准差为14天。根据样本有充分证据证明标准差大于10天吗?,例3 孟德尔遗传理论断言,当两个品种的豆杂交时,圆的和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的频数将以比例9:3:3:1发生。在检验这个理论时,孟德尔分别得到频数315、101、108、32、这些数据提供充分证据拒绝该理论吗?,5,参数的假设检验问题处理步骤,1.根据实际问题的要求,提出原假设 和备择假设;2.根据样本X_i,确定检验统计量T(X_i)以及拒绝域(拒 绝原假设的区域
3、)的形式;3.给定显著性水平,按照“在原假设H0成立时,拒绝原假 设的概率不大于显著性水平”这一原则,确定拒绝 域;4根据样本观测值作出决策,接受原假设还是拒绝原假 设。,6,例1 设某种清漆的9个样品,其干燥时间(以小时计)分别为:6.0 5.7 5.5 6.5 7.0 5.8 5.2 6.1 5.0根据以往经验,干燥时间的总体服从正态分布N(6.0,0.36),现根据样本检验均值是否与以往有显著差异?,由于作出决策的依据是一个样本,因此,可能出现“实际上原假设成立,但根据样本作出拒绝原假设”的决策。这种错误称为“第一类错误”,实际中常常将犯第一类错误的概率控制在一定限度内,即事先给定较小的
4、数(01)(称为显著性水平),使得,7,上述检验法则符合实际推断原理。,8,注释1:假设检验中的4种可能结果,通常,犯第一类错误的概率、犯第二类错误的概率、样本容量可以看作为“三方拔河”。,第一类错误:原假设H0成立时,作出拒绝原假设的决策;第二类错误:备择假设H1成立时,作出接受原假设的决策。,9,这是一对矛盾,要同时减少犯第一、第二类错误,只有增大样本容量。,10,注释2:假设检验与区间估计的比较。,即拒绝域可以这样得到:将置信区间不等号反向,将原假设成立时的值代入到参数中即可。,11,2 正态总体均值方差的假设检验,12,13,14,15,例2 某种元件的寿命X(以小时记)服从正态分布
5、均未知。现测得16只元件的寿命如下:280 101 212 224 379 179 264 222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命大于225(小时)?(取显著性水平为0.05),t没有落在拒绝域内,故接受原假设,认为元件的平均寿命不大于225小时。,16,例3 要求某种元件的平均使用寿命不得低于1000小时,生产者从一批这种元件中随机抽取25件,测得其平均寿命为950小时,标准差为100小时。已知这批元件的寿命服从正态分布。试在显著性水平0.05下确定这批元件是否合格?,t落在拒绝域内,故拒绝原假设,认为这批元件的平均寿命小于1000小时,
6、不合格。,17,18,19,20,例4:某厂使用两种不同的原料A,B生产同一类型产品。各在一周的产品中取样分析。取用原料A生产的样品220件,测得平均重量为2.46(公斤),样本标准差s=0.57(公斤)。取用原料B生产的样品205件,测得平均重量为2.55(公斤),样本标准差为0.48(公斤)。设两样本独立,来自两个方差相同的独立正态总体。问在水平0.05下能否认为用原料B的产品平均重量较用原料A的为大。,21,基于成对数据的检验例5:为了试验两种不同谷物种子的优劣,选取了十块土质不同的土地,并将每块土地分为面积相同的两部分,分别种植这两种种子。设在每块土地的两部分人工管理等条件完全一样。下
7、面给出各块土地上的产量。土地 1 2 3 4 5 6 7 8 9 10种子A(xi)23 35 29 42 39 29 37 34 35 28种子B(yi)26 39 35 40 38 24 36 27 41 27di=xi-yi-3-4-6 2 1 5 1 7-6 1问:以这两种种子种植的谷物产量是否有显著的差异(取显著性水平为0.05)?,22,23,24,25,(四)两个正态总体方差的检验,26,例7:两台机床生产同一个型号的滚珠,从甲机床生产的滚珠中 抽取8个,从乙机床生产的滚珠中抽取9个,测得这些滚珠 的直径(毫米)如下:甲机床 15.0 14.8 15.2 15.4 14.9 15
8、.1 15.2 14.8 乙机床 15.2 15.0 14.8 15.1 14.6 14.8 15.1 14.5 15.0,27,28,正态总体均值、方差的置信区间与假设检验,30,定义 若C是参数的某检验问题的一个检验法,称为检验法C的施行特征函数或OC函数,其图形称为OC曲线。,3 样本容量的选取,31,1。Z检验法的OC函数,32,33,34,例8(工业产品质量抽验方案)设有一大批产品,产品质量指标X服从。以小者为佳,厂方要求所确定的验收方案对高质量的产品 能以高概率1为买方所接受。买方则要求低质产品 能以高概率1被拒绝。,有厂方与买方协商给出。并采取一次抽样以确定该批产品是否为买方所接
9、受。问应怎样安排抽样方案。已知 且由工厂长期经验知。经商定=0.05。,35,2。t检验法的OC函数,36,37,38,4.分布拟合检验,前面介绍的各种检验法都是在总体服从正态分布前提下,对参数进行假设检验的。实际中可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设。,例如,要检验在计算机上产生随机数的一个程序。指令该程序产生0到9之间的100个单个数字。观察整数的频数如下表。那么以0.05的显著性水平,有充分的理由相信该批整数不是均匀产生的吗?,39,例如,从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,据统计,这432年间共爆发
10、了299次战争,具体数据如下:,通常假设每年爆发战争的次数服从泊松分布。那么上面的数据是否有充分的理由推翻每年爆发战争的次数服从泊松分布假设?,40,它是在总体X 的分布未知时,根据来自总体的样本,检验关于总体分布的假设的一种检验方法。,(一)拟合检验法,41,42,43,44,例1,从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,据统计,这432年间共爆发了299次战争,具体数据如下:,通常假设每年爆发战争的次数服从泊松分布。那么上面的数据是否有充分的理由推翻每年爆发战争的次数服从泊松分布假设?,45,46,例2 孟德尔遗传理论断言,当两个品种的豆杂交时,圆的和黄
11、的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的频数将以比例9:3:3:1发生。在检验这个理论时,孟德尔分别得到频数315、101、108、32、这些数据提供充分证据拒绝该理论吗?,47,例3 下面列出了84个伊特拉斯坎(Etruscan)人男子的头颅的最大宽度(mm),试检验这些数据是否来自正态总体(取=0.1),48,解 为粗略了解数据的分布情况,先画出直方图。,步骤如下:1.找出数据的最小值、最大值为126、158,取区间124.5,159.5,它能覆盖126,158;,2.将区间124.5,159.5等分为7个小区间,小区间的长度=(159.5-124.5)/7=5,称为组距,小区间的端
12、点称为组限,建立下表:,49,3.自左向右在各小区间上作以fi/n为高的小矩形 如下图,即为直方图。,注:直方图的小区间可以不等长,但小区间的长度不能太大,否则平均化作用突出,淹没了密度的细节部分;也不能太小,否则受随机化影响太大,产生极不规则的形状。,50,从本例的直方图看,有一个峰,中间高,两头低,较对称,样本象来自正态总体。于是检验,51,故在水平0.1下接受H0,认为数据来自正态总体。,52,(二)偏度、峰度检验,偏度、峰度检验法是用于检验正态总体的一种方法。,53,54,55,例4 试用偏度、峰度检验法检验例3中的数据是否来自正态总体(取=0.1),56,5 秩和检验,秩和检验是替换
13、两个独立总体均值差的t检验的一种非参数方法。,两个独立总体均值差的t检验是基于两个总体都服从正态分布,且方差未知但相等的情形。,而实际情况中,往往两个独立总体的分布是未知的,但属于同一类,例如都是连续型总体,密度函数只差一个平移。即,57,例如一 通常认为男女的脉搏率是没有显著差异的。现在随机地抽取16位男子和13位女子,测得他们的脉搏率如下表。这些数据能否检验假设:男女的脉搏率分布是不同的?,例如二 在一项探讨“艺术风格和图画数量对一年级儿童的数学理解力的影响”的研究中,分析认为,那些一开始就看了图画序列的学生比只看单个图画的学生有显著高的故事性相应得分。考察下列两组数据,组1是看了图画序列
14、的组,组2只看了单个图画的组。检验是否组1的分数显著高于组2的分数。,58,定义1 将一总体的容量为n的样本观测值按自小到大的次序编号排列成,威尔柯克斯秩和检验可以检验上述假设。,59,60,61,62,解:设第1,2总体分别为新旧方法的排名(秩),63,64,例2 某商店为了确定向公司A或公司B购买某种商品,将A,B公司以往各次进货的次品率进行比较,数据如下,设两样本独立。问两公司的商品的质量有无显著差异。设两公司的商品的次品率的密度至多只差一个平移。(取=0.05),65,66,67,68,69,复习思考题 8,1.假设检验的基本思想是什么?其中使用了一条什么原理?2.检验的显著性水平的意
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 浙江大学概率论与数理统计盛骤 第四版ppt课件 浙江大学 概率论 数理统计 盛骤 第四 ppt 课件
链接地址:https://www.31ppt.com/p-2125350.html