统计学7总体参数估计.ppt
第六章 总体参数估计,第一节 参数估计的一般问题 第二节 一个总体参数的区间估计 第三节 两个总体参数的区间估计 第四节 样本容量的确定,第六章 总体参数估计,参数估计在统计方法中的地位,第六章 总体参数估计,统计推断的过程,第六章 总体参数估计,第一节 参数估计的一般问题一、估计量与估计值 用来估计总体参数的统计量的名称,称为估计量,用符号 表示。用来估计总体参数时计算出来的估计量的具体数值,称为估计值。(例:样本均值80就是估计值),第六章 总体参数估计,二、点估计与区间估计(一)点估计定义:用样本估计量的值直接作为总体参数的估计值,称作参数的点估计。(例:用样本均值直接作为总体均值的估计),第六章 总体参数估计,(二)区间估计定义:在点估计的基础上,给出总体参数估计的一个范围,称为参数的区间估计。例如,某班级平均分数在7585之间,置信水平是95%,第六章 总体参数估计,置信区间图示,第六章 总体参数估计,置 信 水 平,将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 表示为(1-)为是总体参数未在区间内的比例常用的置信水平值有 99%,95%,90%相应的 为0.01,0.05,0.10,第六章 总体参数估计,置 信 区 间,由样本统计量所构造的总体参数的估计区间称为置信区间统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个,第六章 总体参数估计,置信水平与置信区间,第六章 总体参数估计,影响置信区间宽度的因素 1、总体数据的离散程度(总体标准差)2、样本容量 3、置信水平,影响z的大小,第六章 总体参数估计,定义:由样本统计量构造的总体参数估计区间,称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。定义:如果我们将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率,称为置信水平,或称为置信系数。,第六章 总体参数估计,三、评价估计量的标准(一)无偏性定义:无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为,所选择的估计量为,如果,则称 为 的无偏估计量。,第六章 总体参数估计,(二)有效性定义:对同一个参数的两个无偏估计量 和,若,我们称 是 比更有效的一个估计量。,第六章 总体参数估计,(三)一致性 定义:一致性是指随着样本容量的增大,点估计量的值越来越接近被估计的总体参数。,第六章 总体参数估计,第二节 一个总体参数的区间估计,第六章 总体参数估计,一、总体均值的区间估计(一)正态总体、方差已知,或非正态总体、大样本 当总体服从正态分布且 已知,或总体不是正态分布但大样本时,样本均值的抽样分布均为正态分布,其数学期望为总体均值,方差为。而样本均值经过标准化后的随机变量则服从标准正态分布,即 N(0,1),。,第六章 总体参数估计,根据正态分布的性质可以构造出总体均值在置信水平下的置信区间为:,第六章 总体参数估计,如果总体服从正态分布但 未知,或总体并不服从正态分布,只要在大样本条件下,总体方差用样本方差S2代替,这时总体均值在置信水平下的置信区间可以写为:,第六章 总体参数估计,例题:一家食品生产企业以生产袋装食品为主,每天的产量大约为8000袋左右。按规定每袋的重量应为100g。为对产量质量进行监测,企业质监部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量(单位:g)如表所示。,第六章 总体参数估计,表:25袋食品的重量,已知产品重量服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。,第六章 总体参数估计,例题:一家保险公司收集到由36投保人组成的随机样本,得到每个投保人的年龄数据如表所示。试建立投保人年龄90%的置信区间。样本标准差:表:36个投保人年龄的数据 S=,第六章 总体参数估计,(二)正态总体、方差未知、小样本 需要用样本方差S2代替,这时样本均值经过标准化以后的随机变量则服从自由度为(n-1)的t分布,即 t(n-1)这时需要应用t分布来建立总体均值的置信区间。,第六章 总体参数估计,t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布,第六章 总体参数估计,根据t分布建立的总体均值在置信区间为 是自由度为n-1时,t分布中右侧面积为 时的t值,该 值可以通过t分布表查得。,第六章 总体参数估计,例题:已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(单位:h)如下:1510 1450 1480 1460 1520 1480 1490 1460 1480 1510 1530 1470 1500 1520 1510 1470 建立该批灯泡平均使用寿命95%的置信区间。,第六章 总体参数估计,二、总体比例的区间估计(大样本)总体比例P在 置信水平下的置信区间 当P未知时,用p来代替P,第六章 总体参数估计,例题:某城市要估计下岗职工中女性所占的比例,随机抽取了100名下岗职工,其中65人为女性。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。,第六章 总体参数估计,三、总体方差的区间估计1.估计一个总体的方差或标准差2.假设总体服从正态分布3.总体方差 的点估计量为,且,4.总体方差在1-置信水平下的置信区间为,第六章 总体参数估计,总体方差区间估计(图示),第六章 总体参数估计,【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间,第六章 总体参数估计,例题:已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(单位:h)如下:1510 1450 1480 1460 1520 1480 1490 1460 1480 1510 1530 1470 1500 1520 1510 1470 建立该批灯泡寿命方差95%的置信区间。,第六章 总体参数估计,第三节 两个总体参数的区间估计 一、两个总体均值之差的区间估计 二、两个总体比例之差的区间估计 三、两个总体方差比的区间估计,第六章 总体参数估计,两个总体参数的区间估计,第六章 总体参数估计,一、两个总体均值之差的区间估计(一)两个总体均值之差的估计:独立样本1、大样本的估计 假定条件 两个总体都服从正态分布,、已知 若不是正态分布,可以用正态分布来近似(n130和n230)两个样本是独立的随机样本,第六章 总体参数估计,使用正态分布统计量 z,第六章 总体参数估计,(1)1,2已知时,两个总体均值之差1-2在1-置信水平下的置信区间为(2),(2)1、2未知时,两个总体均值之差1-2在1-置信水平下的置信区间为,第六章 总体参数估计,【例1】某地区教育委员会想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立抽取两个随机样本,有关数据如右表。建立两所中学高考英语平均分数之差95%的置信区间,第六章 总体参数估计,解:两个总体均值之差在1-置信水平下的置信区间为,两所中学高考英语平均分数之差的置信区间为5.03分10.97分,第六章 总体参数估计,2、小样本的估计,假定条件两个总体都服从正态分布两个总体方差未知两个独立的小样本(n130和n230)(1)两个总体方差未知但相等:1=2 总体方差的合并估计量,第六章 总体参数估计,估计量x1-x2的抽样标准差,第六章 总体参数估计,两个样本均值之差的标准化,两个总体均值之差1-2在1-置信水平下的置信区间为,第六章 总体参数估计,【例2】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名工人,每个工人组装一件产品所需的时间(分钟)下如表。假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间,第六章 总体参数估计,解:根据样本数据计算得 合并估计量为:,两种方法组装产品所需平均时间之差的置信区间为0.14分钟7.26分钟,第六章 总体参数估计,(2)两个总体方差未知且不相等:且n1=n2=n 使用统计量 在 置信水平下的置信区间为,第六章 总体参数估计,(3)两个总体方差未知且不相等:且n1n2使用统计量样本均值之差将标准化后不再服从自由度为(n1+n2-2)的t分布,而是近似服从自由度为v的t分布,第六章 总体参数估计,两个总体均值之差1-2在1-置信水平下的置信区间为,自由度,第六章 总体参数估计,【例3】沿用前例。假定第一种方法随机安排12名工人,第二种方法随机安排名工人,即n1=12,n2=8,所得的有关数据如表。假定两种方法组装产品的时间服从正态分布,且方差不相等。以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间,第六章 总体参数估计,解:根据样本数据计算得 自由度为:,两种方法组装产品所需平均时间之差的置信区间为0.192分钟9.058分钟,习题二,1.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表所示:(1)求在 90%置信水平下的置信区间。,第六章 总体参数估计,2.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:求 在95%置信水平下的置信区间。(1)设n1=n2=100。(2)设n1=n2=10,。,第六章 总体参数估计,(3)设n1=n2=10,。(4)设n1=10,n2=20,。,第六章 总体参数估计,(二)两个总体均值之差的估计:匹配样本1、匹配大样本,假定条件两个匹配的大样本(n1 30和n2 30)两个总体各观察值的配对差服从正态分布两个总体均值之差d=1-2在1-置信水平下的置信区间为,第六章 总体参数估计,2、匹配小样本,假定条件两个匹配的小样本(n1 30和n2 30)两个总体各观察值的配对差服从正态分布 两个总体均值之差d=1-2在1-置信水平下的置信区间为,第六章 总体参数估计,【例】由10名学生组成一个随机样本,让他们分别采用A和B两套试卷进行测试,结果如下表。试建立两种试卷分数之差d=1-2 95%的置信区间,第六章 总体参数估计,解:根据样本数据计算得,两种试卷所产生的分数之差的置信区间为6.33分15.67分,习题三,1.下表是由4对观察值组成的随机样本:(1)计算A与B各对观察值之差,再利用得出的差值计算 和。,第六章 总体参数估计,(2)设 设 分别为总体A和B的均值,构造 在95%置信水平下的置信区间。,第六章 总体参数估计,二、两个总体比例之差的区间估计,1、假定条件两个总体服从二项分布可以用正态分布来近似两个样本是独立的2、两个总体比例之差P1-P2在1-置信水平下的置信区间为,第六章 总体参数估计,【例】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以95%的置信水平估计城市与农村收视率差别的置信区间,第六章 总体参数估计,解:已知 n1=500,n2=400,p1=45%,p2=32%,1-=95%,z/2=1.96 P1-P2置信度为95%的置信区间为,城市与农村收视率差值的置信区间为6.68%19.32%,习题四:1.从两个总体中各抽取一个n1=n2=250的独立随机样本,来自总体1的样本比例为p1=40%,来自总体2 的样本比例为p2=30%。(1)构造P1-P2在90%的置信水平下的置信区间。(2)构造P1-P2在95%的置信水平下的置信区间。,第六章 总体参数估计,三、两个总体方差之比的区间估计,1、比较两个总体的方差比2、用两个样本的方差比来判断如果S12/S22接近于1,说明两个总体方差很接近如果S12/S22远离1,说明两个总体方差之间存在差异3、总体方差比在1-置信水平下的置信区间为,第六章 总体参数估计,两个总体方差之比的区间估计(图示),第六章 总体参数估计,【例】为了研究男女学生在生活费支出(元)上的差异,在某大学各随机抽取25名男学生和25名女学生,得到下面的结果:男学生:女学生:试以90%置信水平估计男女学生生活费支出方差比的置信区间,第六章 总体参数估计,解:根据自由度 n1=25-1=24,n2=25-1=24,查得 F/2(24)=1.98,F1-/2(24)=1/1.98=0.505 12/22置信度为90%的置信区间为,男女学生生活费支出方差比的置信区间为0.471.84,习题五.生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对工序进行改进减小方差。下面是两部机器生产的袋茶重量(单位:g)的数据:构造两个总体方差比在90%置信水平下的置信区间。,第六章 总体参数估计,第四节 样本容量的确定一、估计总体均值时样本容量的确定 E代表所希望达到的边际误差,即 本容量的公式,第六章 总体参数估计,公式反映的信息:(1)样本容量与置信水平成正比;(2)样本容量与总体方差成正比;(3)样本容量与边际误差成反比。,第六章 总体参数估计,【例题】拥有工商管理学士学位的大学毕业生的年薪的标准差约为2000元,假定想要以95%的置信水平估计年薪的置信区间,希望边际误差为400元。应抽取多大的样本容量?,第六章 总体参数估计,解:已知=500,E=200,1-=95%,z/2=1.96 12/22置信度为90%的置信区间为,即应抽取97人作为样本,第六章 总体参数估计,二、估计总体比例时的样本容量的确定 E为所希望达到的边际误差,即 估计总体比利时样本容量的确定公式,第六章 总体参数估计,【例题】根据以往的生产统计,某种产品的合格率约为90%,现要求边际误差为5%,在求置信水平为95%的置信区间时,应抽取多少个产品作为样本?,第六章 总体参数估计,解:已知=90%,=0.05,z/2=1.96,E=5%,应抽取的样本容量为,应抽取139个产品作为样本,第六章 总体参数估计,习题六:1.某超市想要估计每位顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每位顾客购物金额的置信区间,并要求边际误差不超过20元,应抽取多少位顾客作为样本?2.从一个标准差为5的总体中以重复抽样的方式抽出一个容量为40的样本,样本均值为25.(1)样本均值的抽样标准差是多少?(2)在95%的置信水平下,边际误差是多少?,第六章 总体参数估计,3.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里以重复抽样的方式选取49名顾客组成了一个简单随机样本。(1)假定总体标准差为15元,求样本均值的抽样标准化差。(2)在95%的置信水平下,求边际误差;(3)如果样本均值为120元,求总体均值在95%置信水平下的置信区间。,第六章 总体参数估计,4.根据以往的生产数据,某种产品的废品率为2%。如果要求在95%置信水平下的置信区间,若要求边际误差不超过4%,应抽取多大的样本?,第六章 总体参数估计,三、估计两个总体均值之差时样本容量的确定,1、设n1和n2为来自两个总体的样本,并假定n1=n22、根据均值之差的区间估计公式可得两个样本的容量n为,其中:,第六章 总体参数估计,【例】一所中学的教务处想要估计试验班和普通班考试成绩平均分数差值的置信区间。要求置信水平为95%,预先估计两个班考试分数的方差分别为:试验班12=90,普通班 22=120。如果要求估计的误差范围(边际误差)不超过5分,在两个班应分别抽取多少名学生进行调查?,English,第六章 总体参数估计,解:已知12=90,22=120,E=5,1-=95%,z/2=1.96,即应抽取33人作为样本,第六章 总体参数估计,四、估计两个总体比例之差时样本容量的确定,1、设n1和n2为来自两个总体的样本,并假定n1=n22、根据比例之差的区间估计公式可得两个样本的容量n为,其中:,第六章 总体参数估计,【例】一家瓶装饮料制造商想要估计顾客对一种新型饮料认知的广告效果。他在广告前和广告后分别从市场营销区各抽选一个消费者随机样本,并询问这些消费者是否听说过这种新型饮料。这位制造商想以10%的误差范围和95%的置信水平估计广告前后知道该新型饮料消费者的比例之差,他抽取的两个样本分别应包括多少人?(假定两个样本容量相等),第六章 总体参数估计,解:E=10%,1-=95%,z/2=1.96,由于没有P的信息,用0.5代替,即应抽取193位消费者作为样本,第六章 总体参数估计,习题七:1.假定n1=n2,边际误差为0.05,相应的置信水平为95%,估计两个总体比例之差P1-P2时所需要的样本容量为多大?,第六章 总体参数估计,2.假定两个总体的标准差分别为 和,若要求误差范围不超过5,相应的置信水平为95%,假定n1=n2,估计两个总体均值之差 时所需的样本容量为多大?,第六章 总体参数估计,第六章课后作业:1.从一个标准差为5的总体中以重复抽样的方式抽出一个容量为40的样本,样本均值为25.(1)样本均值的抽样标准差是多少?(2)在95%的置信水平下,边际误差是多少?,第六章 总体参数估计,2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里以重复抽样的方式选取49名顾客组成了一个简单随机样本。(1)假定总体标准差为15元,求样本均值的抽样标准化差。(2)在95%的置信水平下,求边际误差;(3)如果样本均值为120元,求总体均值在95%置信水平下的置信区间。,第六章 总体参数估计,3.在一项家电调查中,随机抽取了200户居民,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。4.某居民小区共有居民500户,校小区管理者准备采用一项新的供水设施,想了解居民赞成与否。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95%。(2)如果小区管理者预计赞成的比例达到80%,应抽取多少户进行调查?,习题1,1.在一项家电调查中,随机抽取了200户居民,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。2.某居民小区共有居民500户,校小区管理者准备采用一项新的供水设施,想了解居民赞成与否。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。,(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95%。(2)如果小区管理者预计赞成的比例达到80%,应抽取多少户进行调查?,