管理统计学第5参数估计.ppt
《管理统计学第5参数估计.ppt》由会员分享,可在线阅读,更多相关《管理统计学第5参数估计.ppt(148页珍藏版)》请在三一办公上搜索。
1、1,第5章 参数估计,3.1 参数估计概述,参数估计是统计推断的基本方法之一。我们把刻划总体X的某些特征的常数称为参数,最常用的参数是总体X的数学期望和方差。假如总体XN(),则X的分布是由参数和2确定的,其中,=E(X),2=D(X)。,在实际问题中,总体X的参数是未知的,例如纱厂细纱机上的断头次数XP(),如果求每只纱绽在某一时间间隔内断头的次数为K的概率,就需要先确定参数,才能求出所求的概率。又如,灯泡厂生产的灯泡,由经验知其寿命XN(),但是由于生产过程中各种随机因素的影响,生产出来的灯泡的寿命是不一致的,为了保证灯泡的质量,必须进行抽样检查,根据样本所提供的信息,对总体X的分布做出估
2、计,也即对参数,2做出估计。这类问题称为参数估计问题。,参数估计问题,就是要从样本出发构造一些统计量作为总体某些参数的估计量,当取得一个样本值时,就以相应的统计量的值作为总体参数的估计值。例如,常以统计量 作为总体数学期望的估计量。当要估计某批灯泡的平均寿命时,就从该批灯泡中随机地抽取若干个,分别测出其寿命,以这些测量数据的平均值作为该批灯泡的平均寿命的估计值。,设总体X的分布函数的类型已知,但是其中有一个或多个参数未知,设X1,X2,X3,Xn为总体X的容量为n的样本。参数估计就是讨论如何由样本X1,X2,X3,Xn提供的信息对未知参数作出估计,以及讨论如何建立一些准则对所作出的估计进行评价
3、。,一般是建立适当的统计量(X1,X2,X3,Xn),当样本观察值为x1,x2,x3,xn时,如果以(x1,x2,x3,xn)作为总体分布中未知参数的估计值,这样的估计方法叫做点估计,如果总体分布函数中有t个未知参数,则要建立t个估计量作为t个未知参数的估计量。,参数估计的形式分为两类:点估计和区间估计。由估计量的观察值作为未知参数的估计值,这种作法称为点估计或定值估计。而有时并不要求对参数作定值估计,只要求估计出未知参数的一个所在范围,并指出参数被包含在该范围的概率,这种方法称为区间估计,进行参数估计并不一定要预先知道总体的分布类型。有时,虽然未知总体的分布类型,但仍可对总体的某些数字特征作
4、出估计。,3.2 参数的点估计,点估计方法很多,本节介绍最常见的矩估计法和极大似然法。,一、矩估计法,由大数定律可知,样本分布函数依概率收敛于总体分布函数,样本均值依概率收敛于总体均值,我们自然会想到,是否能用有关的样本矩来估计总体分布的相应矩呢?统计实践表明,这个方法是可取的,这种用样本矩来估计总体分布参数的方法称为矩估计法,通常,用样本 均值来估计总体的均值,用样本方差S2来估计总体的方差。,【例3.1】试用矩估计法对总体 XN()的参数,2作出估计。,解:因E(X)=,D(X)=2设X1,X2,Xn为X的一个样本,其 样本均值为,样本方差为S2。令E(X)=,D(X)=S2,即得的估计量
5、为,。,【例5.2】设X1,X2,Xn是取自总 体X的样本,已知X的概率密度为:,试用矩估计法估计总体参数。解:由于 样本均值为,令E(X)=,得:,从而总体 参数的矩估计为,其 中。,【例5.3】X1,X2,Xn为总体XB(N,P)的样本,其中N,P为未知参数,试用矩估计法估计参数N及P。,解:E(X)=NP D(X)=NP(1-P)样本均值与方差分别为,S2。令 E(X)=D(X)=S2,即 解得N、P的矩估计量为,其 中,。,二、极大似然估计法,先考察两个简单的例子。,【例3.4】某同学与一位男猎人一起外出打猎,只见一只野鸡在前方窜过,只听一声枪响,野鸡被他们两人中某一位一枪命中,试推测
6、这一发命中的子弹是谁打的,答案是简单的,既然只发一枪且命中,而男猎人的命中的概率一般大于这位同学命中的概率,因此可以认为这一枪是男猎人射中的。,【例3.5】假定在一个箱子里放着黑、白两种球共4只,且知道这两种球的数目之比为13,但不知道究竟哪一种颜色的球多。,设黑球所占的比例为P,由上述假定推知P仅可能取1/4和3/4这两个值,现在采用有放回抽样的方法,从箱子中随机地抽取三个球,观察到球的颜色为黑、白、黑,你会对箱子中的黑球数作出什么推断呢?即你认为P的值是1/4,还是3/4?,直观上觉得P=3/4(即箱子中黑球数为3)更可信,因为当P=1/4时抽到这样一个具体样本的概率为1/43/41/4=
7、3/64,当P=3/4时,抽到这样一个具体样本的概率为3/41/43/4=9/64,由于9/643/64,因此在观察到上述样本中的三个球的颜色之后,觉得P=3/4更可信,即你倾向于认为箱子中放有三个黑球,这里体现了极大似然法的基本思想。,现在我们来阐明极大似然法的基本原理。,设总体X的概率密度为,它只含一个未知参数(若X是离散型,表示概率),X1,X2,X3,Xn是取自X的样本,x1,x2,x3,xn为样本观察值。X1,X2,X3,,Xn的联合密度等于,显然,对于样本的 一组观察值x1,x2,x3,xn,,它是 的函数,记作 并称为似然函数,当 已知时,似然函数描述了样本取得样本观察值x1,x
8、2,x3,xn的可能性。同样,当一组样本观察值取定时(即抽样完成时),要问它最大可能取自什么样的总体(即总体的参数 应等于什么时的可能性最大),也要从似然函数 的极大化中求出相应的 值来,这个值就是 的一个估计值。于是,我们可以给出极大似然估计的定义。,定义3.1 设总体的概率密度为,其中 是未知参数,x1,x2,xn为X的一组样本观察值。若能求得观察值的某个函数,使得似然函数取极大值,即,则称 为 的一个极大似然估计值,其相应的统计量,称为参数 的极大似然估计量。,由定义3.1可知,求总体参数 的极大似然估计值 的问题,就是求似然函数 L()的极大值问题。在L()可微时,要使L()取极大值
9、必须满足(3.1)从上式可解得 的极大似然估计值。,由于lnL()与L()有相同的极值点,而且,求lnL()的极值点更为容易,所以常用下式(3.2)来代替(3.1)式。方程(3.1)或(3.2)都称为似然方程。,当似然函数包含多个参数时,即:,若L关于各参数的偏导数存在,则 j的极大似然估计 一般可由方程组:或 解得。上面方程组称 为似然方程组。,注意 上面的讨论中,我们没有提到似函数 取极大值的充分条件,对于具体的函数可作验证。,【例3.6】设总体X服从参数为 的泊松分布,求参数 的极大似然估计量。,解 设X1,X2,X3,Xn是来自X的样本,则,令 的极大似然估计量为。其中 为样本均值。,
10、【例3.7】设总体XN,其中 及 是未知参数,如果取得样本观测值为x1,x2,,xn,求参数 及 的极大似然估计值。,解:似然函数为:,对 及 求偏导数,并让它们等于零,得:,解此方程组,即得 及 的极大似然估计值为:,【例3.8】设总体X服从均匀分布,求参数 与 的极大似然估计量,解 设X1,X2,Xn是X的样本,则,从而有,显然由此方程组解不出1与2,现利用定义求1与2的极大似然估计量,因为:,又,即 的极大似然估计量分别为。,三、估计量的优良标准,在对总体参数做出估计时并非所有的估计量都是优良的,从而产生了评价估计量是否优良的标准。对于点估计量来说,一个好的估计量有如下三个标准:,1无偏
11、性 如果样本统计量的期望值等于该统计量所估计的总体参数,则这个估计量叫做无偏估计量。这是一个好的估计量的一个重要条件。用样本平均数作为总体平均数的点估计量,就符合这一要求。无偏性也就是没有系统的偏差,它是从平均意义讲的,即如果这种估计方法重复进行,则从估计量所获得的平均数等于总体参数。,显然,如果说一个估计量是无偏的,并不是保证用于单独一次估计中没有随机性误差,只是没有系统性的偏差而已。若以代表被估计的总体参数,代表的无偏估计量,则用数学式表示为:,我们知道,总体参数中最重要的一个参数是总体平均数,样本平均数 是它的一个无偏估计量,即。另外,样本方差也是总体方差的无偏估计量。,2一致性 当样本
12、容量n增大时,如果估计量越来越 接近总体参数的真值时,就称这个估计量为一致估计量。估计量的一致性是从极限意义上讲的,它适用于大样本的情况。如果一个估计量是一致估计量,那么,采用大样本就更加可靠。当然,在样本容量n增大时,估计量的一致性会增强,但调查所需的人力、物力也相应增加。,3有效性 有效性的概念是指估计量的离散程度。如果两个估计量都是无偏的,其中方差较小的(对给定的样本容量而言)就可认为相对来说是更有效的。严格地说,如果 和 是 的两个无偏估计量,它们的相对有效性按下述比率决定:其中,是较小的方差。,以上这三个标准并不是孤立的,而应该联系起来看。如果一个估计量满足这三个标准,这个估计量就是
13、一个好的估计量。数理统计已证明,用样本平均数来估计总体平均数和用样本比率来估计总体比率时,它们是无偏的,一致的和有效的。,3.3 参数的区间估计,一、区间估计的概念,对未知参数来说,我们除了关心它的点估计外,往往还希望估计出它的一个范围,以及这个范围覆盖参数真值的可靠程度,这种范围通常用区间的形式给出,这种区间就叫参数的置信区间。,定义3.2 设总体分布含有一个未知参数,若由样本确定的两个统计量(X1,X2,X3,Xn)与(X1,X2,X3,Xn),对于给定数值,满足(3.3),则称随机区间 为的一个 双侧置信区间,称为双侧置信下(上)限,1-称为置信水平或置信度。,(3.3)式表示置信区间
14、包含未知参数 真值的概率是1-,若反复抽样多次(每次样本容量相等),每组样本观察值确定一个区间,每个这样的区间或者包含 的真值,或者不包含 的真值,按贝努利定理,在所有这些区间中,包含 真值的约占,不包含真值的仅占 左右。,当 和 时,称为置信区间观察值,也称为置信区间。,在有些问题中,我们关心的是未知参数至少有多大(如设备元件使用的寿命),或不超过多大(如产品的次品率),因此下面给出单侧置信区间的概念。定义3.4 在定义3.3中,如果将(3.3)式改成,则称 或 为单侧置信区间,和 分别称为单侧置信下限与单侧置信上限。,评价一个置信区间的好与坏有两个标准,一是精度,即 越小精度越高,也就越好
15、。另一个是置信度,即 越大越好。我们当然希望 尽可能地小,同时希望 尽可能地大,但是当样本容量n固定时,精度与置信度不可能同时提高。,因为当精度提高时即 变小时,()覆盖真值 的可能性也变小,从而降低了置信度,相反,当置信度增大时,必然也增大,从而降低了精度,在实际问题中,一般是根据实际问题的需要,先选定置信度为1-,然后再通过增加样本容量n提高精度。,二、区间估计的步骤,(1)构造一个随机变量g()(含待估计的未知参数,分布已知);(2)给定置信水平,使;,(3)从不等式 中解出 即 得的 置信区间;(4)将xi代替 中的xi,即得观察区间。,3.4 单正态总值均值与方差的区间估计,假设总体
16、XN(),构造 与 的置信区间有重要的实用意义,而且有关结果是完满的。,一、均值的置信区间,从总体X中取样本(X1,X2,Xn),设样本值为(x1,x2,x3,,xn)由于,随机变量很明显,统计量Z的分布函数不依赖于未知参数。,设已给定对的区间估计置信度为1-令 为Z的双侧 点)解不等式(关于):得,从而所求的100(1-)%置信区间为 将样本平均值 取其观察值,则 100(1-)%的置信区间为,【例3.9】某厂质量管理部门的负责人希望估计移交给接受部门的5500包原材料的平均重量,一个由250包原材料组成的随机样本所给出的平均值=65千克。总体标准差=15千克。试构造总体未知的平均值的置信区
17、间,假定95%的置信区间已能令人满意,并假定总体为正态分布,解:(1)样本平均值=65千克(2)由1-=0.95,/2=0.025,查标准正态分布表得(3)写出置信区间=(63.14,66.86),于是,我们有95%的把握说总体平均值介于63.14和66.86千克之间。,注意 在很多情况下,我们遇到的总体为非正态分布,但中心极限定理告诉我们,当样本容量n足够大,无论总体服从什么分布,的柚样分布将近似地服从正态分布,因此当样本取自总体方差已知的非正态分布时,我们仍可以用 公式来近似求出总体平均值的置信区间。,2 未知时,求的置信区间 稍微留意上述求得的的置信区间,不难发现只有在 已知时方法才可行
18、。如果 未知,则可用样本方差S2代替总体方差,从而根据统计量:,对给定的置信水平1-,令可解得的1-置信区间为,将、S2分别取其观察值则的1-置信区间为,例3.10 为了估计一分钟一次广告的平均费用,抽出了15电视台的随机样本。样本的平均值=2000元,其中标准差S=1000元。假定所有被抽样的这类电视台服从正态分布,试构造总体平均值的95%的置信区间。,解:(1)样本均值与方差分别为=2000元,S=1000元(2)由1-=0.95,得/2=0.025,n-1=14,查t分布表,得,(3)写出置信区间:显然我们有95%的把握说明,总体平均数处在 1447.5元和2552.5元之间。,=(14
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理 统计学 参数估计
链接地址:https://www.31ppt.com/p-5915519.html