多元回归分析的原理与应用ppt课件.ppt
《多元回归分析的原理与应用ppt课件.ppt》由会员分享,可在线阅读,更多相关《多元回归分析的原理与应用ppt课件.ppt(42页珍藏版)》请在三一办公上搜索。
1、1,多元回归分析的原理与应用,2,提 纲,多元回归分析的统计原理多元回归分析在心理学研究中的应用,3,1 多元回归分析(regression)的统计原理,回归分析的含义回归分析的分类一元线性回归多元线性回归在SPSS中如何做多元回归分析,4,1.1 回归分析的含义,客观世界中事物之间的关系是各种各样的。从定量的角度看,主要有两种:一是确定性关系,如重力加速度,即自由落体的距离与时间:S=0.5gt2;另一类是不确定性关系,即相关关系。由于事物的变化常常受多种因素的影响,导致了事物变化的不确定性。人们常用相关系数来描述事物之间的这种不确定性程度。但对于如何通过一个事物的值去估计和预测另一个事物的
2、发展变化,相关系数却无能为力。但是,通过大量的实际调查,可以总结出它们之间的关系,回归分析即是对这种关系的描述。,5,1.1 回归分析的含义,“回归”一词最早由英国统计学家高尔顿(Francis Galton)在19世纪末期研究孩子的身高和他们父母身高关系时提出。研究发现,孩子的身高总是趋于他们父母身高的平均值。孩子的身高,比身材矮的父母要高,比身材高的父母要矮,这种趋于中间值的趋势称作“回归效应”,而他提出的这种研究两个数值变量关系的方法称作回归分析。,6,1.1 回归分析的含义,含义:是借助数学模型对客观世界所存在的事物间的不确定关系的一种数量化描写,即通过一个或几个变量的变化去解释另一变
3、量的变化。目的:在于对相关随机变量进行估计、预测和控制,确定变这些量之间数量关系的可能形式,并用一个数学模型来表示。,7,X,Y,自变量(independent variable):解释变量,给定的或可以控制的、用来解释、预测因变量的变量。 因变量(dependent variable):响应变量,由自变量来解释其变化的变量。,在回归分析中:,8,1.1 回归分析的含义,数学模型: y=f(x1,x2,x3,xi)+模型的基本含义: 因变量y受到两部分自变量的影响,即:已知的K个自变量x1,x2,x3,xi的影响;一些未知因素或随机因素的影响。对于K个已知自变量的影响,设想可以通过函数f(x1
4、,x2,x3,xi)来表示,而剩下的将由那些未知因素或随机因素的影响确定,将这些影响的结果记为,称为随机误差。对于每一组实际观察获得的值yi,x1,x2,x3,xi就可以表示成: yi= f(x1,x2,x3,xi)+,9,1.1 回归分析的含义,对于自变量x1,x2,x3,xi的每一组确定的值,f(x1,x2,x3,xi)的值也是确定的;但由于是不确定的,所以,y也是不确定的,但在每一组确定的自变量之下,所有的服从均数为零的正态分布,因此,对于自变量的每一组确定的值,因变量也服从正态分布,其平均数就是f(x1,x2,x3,xi),该公式即为回归方程,记为:,10,回归分析,按自变量个数分类,
5、一元回归简单回归,多元回归复回归,按方程式特征分类,线性回归,非线性回归,1.2 回归分析的分类,11,1.3 一元线性回归,只有一个自变量的线性回归叫一元线性回归,也叫简单回归。与方差分析不同,在回归分析中,“元”是指自变量,而不是指因变量。,12,总体的一元线性回归模型:,残差,假定:E()=0,总体的一元线性回归方程:,13,一元线性回归方程的几何意义,一元线性回归线的可能形态,14,样本的一元线性回归方程:(估计的回归方程),总体未知参数,以样本统计量估计总体参数,回归系数,15,16,最小二乘法,因为一组数据可以有多条回归直线,但是哪条最理想呢?想得到比较精确的回归方程,必须使用最小
6、二乘法。最小二乘法就是使误差的平方和最小。误差e就是残差, e=y-y,其平方和为: (yy)2=(y-a-bx)2 要使误差最小,只要分别对a、b求偏导数,使其0即可。,17,判定系数(Coefficient of determination):估计的回归方程拟合优度的度量,表明Y 的变异性能被估计的回归方程解释的部分所占比例的大小。是判定回归方程有效性高低的指标,r2,当残差平方和为 0时,判定系数为 1 ,为完全的拟合。,当残差平方和最大时,判定系数为 0,为最差的拟合。,判定系数,18,判定系数与相关系数,19,判定系数与相关系数,从二者的计算公式可知,积差相关系数r的平方等于判定系数
7、r2,即Y 的变异性能被估计的回归方程解释的部分所占比例的大小。如果r2=0.64,表明变量Y的变异中有64是由变量X的变异引起的。所以,r2叫判定系数。,20,1.4 多元线性回归(Multiple Regression),多元线性回归,就是有多个自变量的线性回归,也叫复回归。其数学模型为:,截距:常数项(constant),偏回归系数:,误差:残差,21,1.4 多元线性回归,多元回归分析的基本假设多元回归方程及其显著性检验筛选自变量的方法多元回归方程有效性的判定,22,1.4.1 多元回归分析的基本假设,相关存在性:就自变量X1,X2,X3,XK的特殊组合而言,Y变量(单变量)是一个随机
8、变量,具有某种概率分配,有一定的平均数及变异数,各个变量之间都存在显著相关关系。独立性:每一个观察值Y彼此间是统计独立的,观察值间没有关联,即非共线性。直线性:Y 变量的平均数是变量X1,X2,X3,XK间的线性函数,此线性函数关系即回归方程。方差齐性:就X1,X2,X3,XK任何一个组合而言,因变量Y的变异数均相同。正态性:就任何X1,X2,X3,XK的线性组合而言,因变量Y的分配是正态的。,23,1.4.2 多元回归方程及其显著性检验,多元回归的样本与总体的回归方程:,24,1.4.2 多元回归方程及其显著性检验,回归方程的显著性检验,就是检验样本回归方程的变量的线性关系是否显著,即能否根
9、据样本来推断总体回归方程中的多个回归系数中至少有一个不等于0,主要是为了说明样本回归方程的r2的显著性。检验的方法:用方差分析,又叫回归的方差分析。这时因变量Y的总变异被分解为回归平方和与误差平方和。F值等于回归均方除以误差均方。,25,1.4.2 多元回归方程及其显著性检验,多元回归方程的求法依然与一元线性回归一样,只是在求多元线性回归方程时,需要对自变量进行检验和筛选,剔除那些对因变量没有影响或影响甚小,经检验未达到显著水平,不足以入选的自变量,以达到简化变量间关系结构、简化所求回归方程的目的。,26,1.4.3 筛选自变量的方法,在建立回归方程之前,任何自变量都可以作为进入方程的目标。但
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 回归 分析 原理 应用 ppt 课件
链接地址:https://www.31ppt.com/p-1327153.html