第七章比估计与回归估计ppt课件.ppt
《第七章比估计与回归估计ppt课件.ppt》由会员分享,可在线阅读,更多相关《第七章比估计与回归估计ppt课件.ppt(53页珍藏版)》请在三一办公上搜索。
1、第七章 比估计与回归估计,第七章 比估计与回归估计,教学目的 通过本章的教学,使学生了解比率估计、回归估计的意义;掌握简单随机抽样的比率估计、回归估计的方法以及差值估计的方法等。,重点与难点 本章的重点是简单随机抽样的比率估计、回归估计的方法以及差值估计的方法等;难点是简单随机抽样的比率估计、回归估计的方法。,本章结构,前面讨论的简单随机抽样和分层抽样,我们所关心的参数都是单指标的,给出的估计量也是线性形式。这一章我们将要讨论比较复杂的情况,我们关心的参数不再是单指标的而是两个或两个以上的指标。此时,遇到的统计量不再是线性形式,往往呈现出非线性形式,比如两个变量之比,或呈现变量之间的回归关系。
2、,所谓回归关系就是变量之间的关系不是确定的,是带有随机影响的。比如身高和体重的关系,身高增加时,一般来说,体重也会增加,但又不能说一定如此。要确定身高和体重的关系,一般用回归的方法。这类问题首先是由英国统计学家高尔顿研究儿子的身高与父亲身高关系时提出的,他发现儿子的身高有回到家族平均身高的趋势,因而把所得关系式称为回归方程,于是回归的名词就沿用下来了。,7.1 比估计及其性质,设有一个二元变量的总体 :,有 4 个参数是我们所熟悉的:,指标 的平均数,指标 的方差,如果简单随机样本为 ,则 及 的估计为:,(7.3),(7.4),在讨论比估计之前,先考察总体的两个平均数之比,即,由于 分别是
3、的无偏估计, 的估计自然定义为,假如 或 已知,总体平均数 与总体总和 的比估计量定义为:,(7.5),(7.6),通常的比估计是指 (7.5) 式与 (7.6) 式,而 则称为比值 的估计。,由 (7.5) 式与 (7.6) 式可知, 与 的习性主要依赖于估计量 ,因此在不少场合,我们常用 来说明。,尽管 分别是 的无偏估计,由于 的非线性形式,因此 关于 是有偏的,从而 关于 也是有偏的。,一个合理的估计量,应该随着样本容量 n 的增加,估计量的期望与参数之差应该越来越小并渐渐趋于零,即“渐近无偏”,比估计是否渐近无偏呢?,利用Taylor展开式,有,将比估计 表示为:,(7.7),当 n
4、 相当大时, 与 相当接近,而 是常数,又 是 的无偏估计,因此,实质上 ,所以 。,(7.7)式的好处不单单告诉我们 这一事实,而且告诉了我们,当 n 相当大时, ,表明 可以表示成 的平均数,因此 的分布可近似正态分布,因此,可利用 近似标准正态分布获得 的置信区间,(7.10),公式(7.8)、(7.9)、(7.10)为我们提供了 的估计量的形式。具体计算时,只要将 分别换为 即可。我们将由此得到的估计量分别记为:,那么, 的置信水平为 的置信区间分别为:,( , ),( , ),下面说明比估计的优点。主要针对 与 来说明,因为它们仅相差一个常数因子,因此,只需讨论其中一个就可以。,当
5、n 充分大时,,而,欲使 ,仅需,或,(7.12)表明,如果变量X与Y正相关,且相关程度非常密切的话,那么比估计的精度高于简单随机抽样的精度。如果相关程度不那么密切( ),此时已知的X信息并没有较多地提供Y的信息,借助X来推断 也许会“帮倒忙”假如X与Y是负相关,则更不能采用比估计方法,此时应采用所谓乘积估计,即:,(7.13),成立,例7.1 某县小麦种植面积为218756亩,分布在N=576个村,为估计全县产量,随机无放回地抽取n=24个村,所得数据如下:,每个村有两个指标:面积 和产量 ,即:,经计算可得:,所以该县平均亩产小麦估计为:,采用比估计可得 和 分别为:,仅利用 数据估计该县
6、小麦总产量 与估计量方差分别为:,显然, 的方差远远小于 的方差。理由很清楚!小麦亩产量与土地拥有量呈现正相关,且相关程度相当密切,因此,在抽样调查中对每个村了解有关产量和土地亩数,利用已知该县土地的固有已知数,能比较精确地推断总产量。事实上在实际操作中人们正是这样去做的!,现在来求总产量的95的置信区间,7.2 分层抽样中的比估计,1、分别比估计,设总体分为 k 层,第 h 层的样本均值记为 ,在该层中 与 的比估计记为 ,又记 和 为第 h 层中指标 的平均数与总和, 与 分别为该层中 的方差和协方差,若 换为 , 换为 ,则显然表示该层样本的方差和协方差。,我们可以得到有关总体 和 的分
7、别比估计为:,分层抽样中的比估计有两种:一是分层之后,先在各层获得比估计,然后按层权平均得到总体参数估计;二是先对 作分层估计,然后再采用比估计方法。前者称为分别比估计,后者称为联合比估计。,(7.15),(7.16),由上节可知,各层中的 是 的渐近无偏估计量,因此 是 的渐近无偏估计量:,各层的抽样又是独立进行的,由(7.10)式,可以近似得到 的方差或均方误差,当各个 都相当大时:,(7.17),(7.18),(7.17), (7.18)告诉我们,即使每层 相当大,但如果层数 k 比较大,由于误差的积累, 产生的偏倚与误差可能相当大。,2、联合比估计,而 的相应(联合)比估计可以写成:,
8、(7.20),(7.21),为与分别比估计进行比较,我们讨论联合比估计的期望和方差。当 n 相当大时,有,(7.23),其中 为总体的比值。,(7.22),(7.22)表明, 是 的渐近无偏估计,(7.23)与(7.18)非常相似,唯一不同的是在(7.18)中用的是各层的比值 ,而(7.23)中用的是总体的比值 。,3、分别比估计与联合比估计的比较,(7.24),仅就总体总和进行比较。如果各层的 相当大,由(7.18)和(7.23)可得:,当对一切 h 有 时,这两种估计方差相同,也就是说当分层对比值并无多大意义情况下,谈论分别比估计与联合比估计孰优孰劣已经无多大意义。,然而,如果各层有自己的
9、特色, 不可能在每一层均等于 ,此时倘若对每一层来说, 与 之间的关系是比例关系,即 ,此时 ,于是(7.24)式内求和式内每一项中括号内第二部分等于零,这样显然有,即“分别比估计”比“联合比估计”精度高一些。其实,只要比估计非常有效,即对一切 h , 时,这一项值相对地就小,此时中括号中均以第一部分占主导地位,仍有,当然,有些层的 不是相当大,这种场合分别比估计的偏倚可能很大而使总的均方误差增大,于是我们宁可采用联合比估计的方法。,7.3 数值例子,例7.2 某地区有976个自然村,根据该地区的地貌将各村所属耕地划为三种类型,各村按类型上报了耕地面积 (以亩计算)为核实这些上报数据,采用按比
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 估计 回归 ppt 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1354765.html