应用回归分析人大版 前四章课后习题答案详解.doc
《应用回归分析人大版 前四章课后习题答案详解.doc》由会员分享,可在线阅读,更多相关《应用回归分析人大版 前四章课后习题答案详解.doc(70页珍藏版)》请在三一办公上搜索。
1、应用回归分析(1-4章习题详解)(21世纪统计学系列教材,第二(三)版,何晓群,刘文卿 编著 中国人民大学出版社)目录1 回归分析概述71.1 变量间统计关系和函数关系的区别是什么?71.2 回归分析与相关分析的区别与联系是什么?71.3回归模型中随机误差项的意义是什么?71.4线性回归模型的基本假设是什么?81.5 回归模型的设置理论根据是什么?在回归变量设置中应该注意哪些问题?81.6收集,整理数据包括哪些内容?91.7构造回归理论模型的基本根据是什么?91.8为什么要对回归模型进行检验?101.9回归模型有哪几个方面的应用?101.10为什么强调运用回归分析研究经济问题要定性分析和定量分
2、析相结合?102 一元线性回归102.1一元线性回归模型有哪些基本假定?102.2考虑过原点的线性回归模型 误差仍满足基本假定,求的最小二乘估计。112.3证明,.112.4回归方程的参数的最小二乘估计与最大似然估计在什么条件下等价?给出理由?122.5证明是的无偏估计。132.6证明成立。132.7证明平方和分解式SST=SSR+SSE.132.8 验证三种检验的关系,即证:142.9验证式子:152.10用第9题证明:是的无偏估计。162.11验证决定系数与F之间的关系式:172.12 如果把自变量观测值都乘以2,回归参数的最小二乘估计会发生什么变化?如果把自变量观测值都加上2,回归参数的
3、最小二乘估计会发生什么变化?182.13如果回归方程:相应的相关系数r很大,则用它预测时预测误差一定较小,这一结论能成立吗?对你的回答说明理由。202.14为了调查某广告对销售收入的影响,某商店记录了5个月的销售收入y(万元)和广告费用x(万元)20表2.6211)利用SPSS软件,散点图为:212)由图易知:x与y之间大致呈现线性关系。223)最小二乘估计得到的回归方程为:224)求回归标准误差;235)给出的置信度为95%的区间估计;236) x与y的决定系数;247) 由SPSS软件可以得到回归方程作方差分析为:248) 对回归系数显著性的检验249) 做相关系数的显著性检验2410)对
4、回归方程作残差图并作相应的分析;2511)对当广告费用为4.2万元时,销售收入将达到多少,并给出置信度95%的置信区间。252.15一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一次现状,经过10周时间,收集了每周加班工作时间的数据和签发的新保单数目,x为每周签发的新保单数目,Y为每周加班工作时间(小时),261)画散点图;262) x与y之间是否大致呈线性关系?273) 用最小二乘估计求出回归方程;274) 求回归标准误差;275) 给出的置信度为95%的区间估计;286) 计算x与y的决定系数;287) 对回归方程作方差分析;288) 对回归系数显著性的检验;299) 做相关系
5、数的显著性检验;2910) 对回归方程作残差图并作相应的分析;2911) 该公司预计下一周签发新保单张,需要加班的时间是多少?3012) 给出的置信水平为95%精确预测区间和近似预测区间;3013) 给出E()置信水平95%的区间估计。302.16, 表2.8是1985年美国50个州和哥伦比业特区公立学校中教师的人均年工资y(美元)和学生的人均经费收入x(美元)。301) 绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?312) 建立y对x的线性回归;323) 用线性回归的Plots功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假设。323 多元线性回归343.1写出多元线性
6、回归模型的矩阵表示形式,并给出多元线性回归模型的基本假设。343.2讨论样本容量n与自变量个数p的关系,它们对模型的参数估计有何影响?353.3证明是误差项的无偏估计。353.4一个回归方程的复相关系数R=0.99,样本决定系数=0.9801我们能判断这个回归方程就很理想吗?353.5 如何正确理解回归方程显著性检验拒绝,接受?363.6数据中心化和标准化在回归分析中的意义是什么?363.7验证(3.5)式363.8利用(3.60)式证明(3.61)式成立,即373.9证明y与自变量的偏决定系数与(3.42)偏F检验值是等价的。373.10验证决定系数与F值之间的关系式:383.11研究货运总
7、量y(万吨)与工业总产值381)计算出y, x1 ,x2, x3的相关系数矩阵392)求y关于x1, x2, x3的三元线性回归方程403)对所求的的方程作拟合优度检验414)对回归方程做显著性检验415)对每个回归系数做显著性检验426)将x3剔除后,进行回归分析得427)有上述系数表可知,常量的95%置信区间为(-821.547,-97.700)438)求标准化回归 方程439)求当,时的,给定置信水平为95%,用SPSS软件计算精确置信区间,用手工计算近似预测区间;4410)结合回归方程对问题作一些基本分析。444 违背基本假设的情况454.1 试举例说明产生异方差的原因。454.2 异
8、方差带来的后果有哪些?454.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。454.4简述用加权最小二乘法消除多元线性回归中异方差性的思想与方法。464.5(4.5)式一元加权最小二乘回归系数估计公式。474.6验证(4.8)式多元加权最小二乘回归系数估计公式。474.7 有同学认为当数据存在异方差时,加权最小二乘回归方程与普通最小二乘回归方程之间必然有很大的差异,异方差越严重,两者之间的差异就越大。你是否同意这位同学的观点?说明原因。484.8 对例4.3的数据,用公式计算出加权变换残差,绘制加权变换残差图,根据绘制出的图形说明加权最小二乘估计的效果。484.9 表4.12
9、是用电高峰期每小时用电量y与每月总用电量x的数据。491)用普通最小二乘法建立y与x的回归方程,并画出残差散点图;502)诊断该问题是否存在异方差513)如果存在异方差,用幂指数型的权函数建立加权最小二乘回 归方程524)用方差稳定变换=消除异方差534.10 试举一可能产生随机误差项序列相关的经济例子。554.11 序列相关性带来的严重后果是什么?554.12 结DW检验的优缺点。564.13 表4.13为某软件公司月销售额数据,其中,x为总公司的月销售额(万元);y为某分公司的月销售额(万元)。561)用普通最小二乘法建立y关于x的回归方程572)用残差图及DW检验诊断序列的相关性573)
10、用迭代法处理序列相关,并建立回归方程584)用一阶差分法处理数据,建立回归方程605)比较普通最小二乘法所得回归方程和迭代法,一阶差分法所建立回归方程的优良性614.14某乐队经理研究其乐队CD盘的销售额(y),两个有关的影响变量是每周演出场次63)用普通最小二乘法建立y与和的回归方程,用残差图及DW检验诊断序列的自相性642)用迭代法处理序列相关,建立回归方程663)用一阶差分法处理序列相关,建立回归方程664)用最大似然法处理序列相关,建立回归方程675)用科克伦-奥克特迭代法处理序列相关,建立回归方程686)用普莱斯-温斯登迭代法处理序列相关,建立回归方程687)比较以上各方法所见回归方
11、程的优良性。694.15说明引起异常值的原因和消除异常值的方法。705 附注711 回归分析概述1.1 变量间统计关系和函数关系的区别是什么?答:变量间的统计关系指的是:在推断统计中,我们把变量间具有密切关联而又不能由一个或某一些变量唯一确定另外一个变量的关系成为变量间的统计关系。而函数关系指的是一个变量的变化能完全确定另一个变量的变化。1.2 回归分析与相关分析的区别与联系是什么?答:区别:回归分析和相关分析相互结合,相互渗透但又有不同。他们之间的区别见下表:设X,Y为变量,回归分析相关分析Y是因变量(被解释变量),X是自变量(解释变量)X,Y地位平等Y是随机变量,X可以是随机变量也可以是普
12、通变量X,Y都是随机变量回归分析不仅可以揭示变量X对变量Y的影响大小,还可以由回归方程进行预测与控制。相关分析的研究主要是为刻画两类变量间线性相关的密切程度联系:回归分析和相关分析都是相关关系(统计关系),即:两个变量间虽然有密切的联系但他们的密切程度并没有到由一个可以完全确定另一个的程度。回归分析和相关分析都是研究变量间关系的统计学课题。1.3回归模型中随机误差项的意义是什么?答:回归模型的一般形式为:其中随机变量y称为被解释变量(因变量);成为解释变量(自变量)。为一般变量的确定性关系,为随机误差。回归模型中随机误差项的意义是:正是因为随机误差项的引入,才将变量之间的关系描述为一个随机方程
13、,使得我们可以借助随机数学方法研究y与的关系。1.4线性回归模型的基本假设是什么?答:线性回归模型的基本假设为:1)解释变量是确定性变量,不是随机变量,样本容量的个数应大于解释变量的个数。2)随机误差项具有0均值和等方差,即 这个假定常称为高斯-马尔科夫条件。,即假设观测值没有系统误差,随机误差的平均值为零。随机误差项的协方差为零表明随机误差项在不同的样本点之间是不相关的(在正态假定下即为独立的),不存在序列相关,并且有相同的精度。3),正态分布的假定条件为: , 4) 通常为了便于数学上的处理,还要求np,即样本容量的个数要多于解释变量的个数。1.5 回归模型的设置理论根据是什么?在回归变量
14、设置中应该注意哪些问题?答:回归模型的设置理论依据是:要根据所研究问题的目的设置因变量y,然后再选取与y有统计关系的一些变量作为自变量。变量设置中应注意的问题:1)变量的正确选择关键在于能否正确把握所研究的经济活动的经济学内涵。即药酒研究者对所研究的经济问题及背景要有足够的了解。2)对于一些从经济关系角度考虑非常重要的需要引进,但在实际中并没有这样的统计数据的变量,应该考虑用相近的变量代替,或者由其他几个指标复合成一个新指标。3)在选择变量时要注意与一些专门领域的专家合作。4)一个回归模型中并不是所涉及的解释变量越多越好。1.6收集,整理数据包括哪些内容?答:1)回归模型的建立是基于回归变量的
15、样本统计数据。当确定好回归模型的变量之后,就要对这些变量收集,整理统计数据。2)数据的收集是建立经济问题回归模型的重要一环,是一项基础性工作,样本数据的质量如何,对回归模型的水平有至关重要的影响。3)常用的样本数据分为时间序列数据和横截面数据。时间序列数据是按时间顺序排列的统计数据。研究宏观经济问题,这方面的时间序列数据来自国家统计局或一些专业部委的统计年鉴。如果研究微观经济现象,如研究某企业的产值与能耗,那么数据就要在这个企业的计划统计科获取。对于收集到的时间序列资料要特别注意数据的可比性与数据的统计口径问题。对于没有可比性和统计口径计算不一致的统计数据要作认真调整,这个调整过程就是一个数据
16、整理过程。由于许多经济变量的前后期之间总是有关联的,因此时间序列数据容易产生模型中随机误差项的序列相关。对于具有随机误差项序列相关的情况,就要通过对数据的某种计算整理来消除序列相关性,最常用的处理方法是差分法。横截面数据是在同一时间截面上的统计数据。由于一个回归模型往往涉及众多解释变量,如果其中某一因素或一些因素随着解释变量观测值的变化而对被解释变量产生不同影响,就产生异方差。因此当用截面数据作样本时,容易产生异方差。对于具有异方差性的建模问题,数据整理就是注意消除异方差性,这常与模型参数估计方法结合起来考虑。不论是时间序列数据还是横截面数据的手机,样本容量的多少一般要与设置的解释变量数目相配
17、套。4)统计数据的整理中不仅要把一些变量数据进行折算,差分,甚至把数据对数化,标准化等,有时还须注意剔除个别特别大或特别小的“野值”,有时需要利用差值的方法把空缺的数据补齐。1.7构造回归理论模型的基本根据是什么?答:1)经济回归模型的建立,通常要依据经济理论和一些数理经济学结果。例如研究的模型有某些具体的函数形式。2)对于根据所获信息无法确定模型的形式时,此时采用不同的形式进行计算机模拟,对于不同的模拟结果,选择较好的一个作为理论模型。1.8为什么要对回归模型进行检验?答:当模型的未知参数估计出来后,便 初步建立了一个回归模型,建立回归模型的目的是为了应用它来研究经济问题,但不能马上就用这个
18、模型去作预测,控制和分析,因为这个模型是否真正解释了被解释变量与解释变量之间的关系,必须通过对模型的检验才能决定。1.9回归模型有哪几个方面的应用?答:归分析的应用非常广泛,例如在经济领域有广泛应用。1)矩阵理论和计算机技术的发展为回归分析模型在经济研究中的应用提供了极大的方便。2)模型技术在经济问题研究中的应用也在盛行起来。3)近年来,新的研究方法不断出现,如非参数统计,自助法,刀切法,经验贝叶斯估计等方法都对法回归分析起着渗透和促进作用。由此回归模型技术随着它本身的不断完善和发展以及应用领域的不断扩大,将在统计学中占有更重要的位置,也必将为人类社会的发展起着它独到的作用。1.10为什么强调
19、运用回归分析研究经济问题要定性分析和定量分析相结合?答:因为数理统计方法只是从事物外在的数量表面上去研究问题,不涉及事物质的规定性。单纯的表面上的数量关系是否反映事物的本质?这本质研究如何?必须依靠专门学科的研究才能下定论。所以,在经济问题的研究中,我们不能仅凭样本数据估计的结果就不加分析的说长道短,必须把参数估计的结果和具体经济问题以及现实情况紧密结合,这样才能保证回归模型在经济问题研究中的正确运用。2 一元线性回归2.1一元线性回归模型有哪些基本假定?答:1)解释变量是确定性变量,不是随机变量。2)随机误差项具有0均值和等方差,即 这个假定常称为高斯-马尔科夫条件。,即假设观测值没有系统误
20、差,随机误差的平均值为零。随机误差项的协方差为零表明随机误差项在不同的样本点之间是不相关的(在正态假定下即为独立的),不存在序列相关,并且有相同的精度。3),正态分布的假定条件为: , 2.2考虑过原点的线性回归模型 误差仍满足基本假定,求的最小二乘估计。答:由题知离差平方和为:,则的最小二乘估计即是使得: 有: 解得:2.3证明,.证明:由正规方程:以及残差:由以上等式解得:,.2.4回归方程的参数的最小二乘估计与最大似然估计在什么条件下等价?给出理由?答:回归方程的参数的最小二乘估计与最大似然估计在的条件下等价。证明:设获得的n组样本观测值为:则有:则求的最小二乘估计就是满足使达到最小时的
21、。即对求极小值。对于极大似然估计,当时,的分布密度为:似然函数为:对数似然函数为:要求的极大似然估计,即求的极大值,等价于对求极大值。由以上可知,在假设时,的最小二乘估计与最大似然估计等价。2.5证明是的无偏估计。证明:的最小二乘估计分别为:因为为非随机变量,解得:则:得证。2.6证明成立。证明:因为为非随机变量,则,。2.7证明平方和分解式SST=SSR+SSE.证明:2.8 验证三种检验的关系,即证:证明:(1)(2)2.9验证式子:2.10用第9题证明:是的无偏估计。2.11验证决定系数与F之间的关系式:以上表达式说明与F之间是等价的,那么我们为什么要分别引入这两个统计量,而不是只使用其
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用回归分析人大版 前四章课后习题答案详解 应用 回归 分析 人大 前四章 课后 习题 答案 详解

链接地址:https://www.31ppt.com/p-4079654.html