回归分析的基本思想及其初步应用》课件.ppt
《回归分析的基本思想及其初步应用》课件.ppt》由会员分享,可在线阅读,更多相关《回归分析的基本思想及其初步应用》课件.ppt(36页珍藏版)》请在三一办公上搜索。
1、1.1回归分析的基本思想及其初步应用,问题1:正方形的面积y与正方形的边长x之间 的函数关系是,问题2:,在 7 块并排、形状大小相同的试验田上 进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:,复习:两个变量之间关系,两个变量的关系,不相关,相关关系,函数关系,线性相关,非线性相关,现实生活中两个变量间的关系有哪些呢?,相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。,相关关系与函数关系有怎样的不同?,函数关系中的两个变量间是一种确定性关系相关关系是一种非确定性关系,函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般的情况
2、,回归直线必过样本点的中心,回归分析的基本步骤:,画散点图,求回归方程,预报、决策,这种方法称为回归分析.,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.,对于线性相关的两个变量用什么方法来刻划之间的关系呢?,最小二乘估计,最小二乘估计下的线性回归方程:,例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。,求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。,求回归方程:,由于所有的样本点不共线,而只是散布在某一直线的附近,所以身高和体重的关系可以用线性回归模型来表示:,其中a和b为模型的未知参数,e称为随机误差.,函
3、数模型与“回归模型”的关系,函数模型:因变量y完全由自变量x确定回归模型: 预报变量y完全由解释变量x和随机误差e确定,e 产生的主要原因: (1)所用确定性函数不恰当; (2)忽略了某些因素的影响; (3)观测误差。,思考:产生随机误差项e的原因是什么?,问题二:在线性回归模型中,e是用bx+a预报真实值y的随机误差,它是一个不可观测的量,那么应如何研究随机误差呢?,结合例1除了身高影响体重外的其他因素是不可测量的,不能希望有某种方法获取随机误差的值以提高预报变量的估计精度,但却可以估计预报变量观测值中所包含的随机误差,这对我们查找样本数据中的错误和模型的评价极为有用,因此在此我们引入残差概
4、念。,e=y-(bx+a),随机误差,e的估计量,样本点:,相应的随机误差为:,随机误差的估计值为:,称为相应于点 的残差.,称为残差平方和.,问题三:如何发现数据中的错误?如何衡量随机模型的拟合效果?,(1)我们可以通过分析发现原始数据中的可疑数据,判断建立模型的拟合效果。,残差图的制作和作用:制作:坐标纵轴为残差变量,横轴可以有不同的选择. 横轴为编号:可以考察残差与编号次序之间的关系, 常用于调查数据错误. 横轴为解释变量:可以考察残差与解释变量的关系,常用于研究模型是否有改进的余地.作用:判断模型的适用性若模型选择的正确,残差图中的点应该分布在以横轴为中心的带形区域.,下面表格列出了女
5、大学生身高和体重的原始数据以及相应的残差数据。,残差图的制作及作用。坐标纵轴为残差变量,横轴可以有不同的选择;若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域;对于远离横轴的点,要特别注意。,身高与体重残差图,几点说明: 第一个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因。 另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。,误差与残差,这两个概念在某程度上
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 基本 思想 及其 初步 应用 课件

链接地址:https://www.31ppt.com/p-1486278.html