回归与相关分析课件.ppt
《回归与相关分析课件.ppt》由会员分享,可在线阅读,更多相关《回归与相关分析课件.ppt(94页珍藏版)》请在三一办公上搜索。
1、第六章 回归与相关分析,Chapter 6 Regression and Correlation Analysis,第六章 回归与相关分析Chapter 6 Regres,本章重点和难点,理解并掌握回归与相关的区别与联系;一元线性回归的基本原理、方法,线性回归的显著性检验、区间估计和预测;相关系数的定义、性质和显著性检验;常用曲线方程的线性化方法及回归方程拟合情况的比较。,本章重点和难点理解并掌握回归与相关的区别与联系;,本章内容,回归与相关的概念 一元线性回归分析 线性相关分析 一元非线形回归(可直线化的曲线回归),本章内容 回归与相关的概念,第一节 回归与相关的概念,【本节内容】回归与相关
2、的概念两者的主要差别,第一节 回归与相关的概念【本节内容】,一、回归与相关的概念,1、回归分析(Regression Analysis)概念:是研究一个随机变量y与另一些变量(主要为固定变量)关系的一种统计方法。即:将一个变量y表述为另一些变量的函数,并通过建立变量间的函数关系,达到根据一个或一些变量的取值去估计或预测另一个变量的目的。,一、回归与相关的概念1、回归分析(Regression An,自变量与因变量在某些问题中,y随x的变化而变化x带有“原因”的性质,称为“自变量”y带有“结果”的性质,称为“因变量”有时x和y之间并无明显的因果关系仍然沿用上述名称,自变量与因变量,一元线性回归(
3、Linear Regression)如果自变量与因变量都是一个,且y和x大体上有线性关系,这种研究两个变量线性关系的回归称为一元线性回归。多元回归如果自变量x是多个,如x1,x2, ,xk,而因变量是一个y,这种研究因变量y与多个自变量x之间的定量关系的问题称为多元回归。,一元线性回归(Linear Regression),回归分析的研究目的变量之间存在怎样的函数关系能否通过这种关系,由x的变化定量地解释或预测y的变化回归分析的变量类型因变量y 随机变量自变量x 固定变量(为主)或随机变量回归分析中x和y的关系地位不平等关心的是y依x的变化规律,回归分析的研究目的,2、相关分析(Correla
4、tion Analysis)概念:是研究随机变量之间“相关关系”的一种统计方法。用于研究两个或数个变量共同变化的程度,主要通过计算相关系数来判断这种相关关系的强弱。,2、相关分析(Correlation Analysis),相关关系:是一种非确定性的关系,即一种随机关系。按其形成的原因,可分为直接相关(real correlation)间接相关(nonsense correlation)二元相关分析(简单相关分析)研究两个变量间相关关系的方法。只介绍简单相关。,相关关系:是一种非确定性的关系,即一种随机关系。按其形成的原,相关分析的研究目的变量之间是否存在某种随机的共变关系各变量一起变化的程度
5、相关分析不具备预测性相关分析的变量类型与关系所有变量都必须是随机变量没有自变量和因变量之分,x和y的地位一样分析侧重于随机变量之间的相关特征,相关分析的研究目的,二、二者的主要差别,回归分析与相关分析在计算上有很多相似之处,如果在应用时不注意所研究变量的类型以及两种方法的内在差别,很容易出现错误。,二、二者的主要差别回归分析与相关分析在计算上有很多相似之处,,回归分析与相关分析的主要差别,回归分析与相关分析的主要差别 统计方法相关分析回归分析研究对,第二节 一元线性回归分析,【本节内容】一元线性回归的数学模型一元线性回归方程的建立线性回归的显著性检验线性回归的区间估计和预测,第二节 一元线性回
6、归分析【本节内容】,一、一元线性回归的数学模型,一元线性回归的常用数学模型为:: 回归截距(Intercept)(又称回归常数): 回归系数(Coefficient of regression),一、一元线性回归的数学模型一元线性回归的常用数学模型为:,二、一元线性回归方程的建立,(一)原理最小二乘法线性回归方程的一般形式为: 残差:最小二乘法:使残差平方和(剩余平方和)最小的一种确定a 和b 的方法。,二、一元线性回归方程的建立 (一)原理最小二乘法,使:,根据微积分学中的极值原理,必须使Q 对a 和b的一阶偏导数为0:,使:根据微积分学中的极值原理,必须使Q 对a 和b的一阶偏导,整理得到
7、,一元线性回归的正规方程组:,整理得到一元线性回归的正规方程组:,(二)一元线性回归的计算 (三)回归直线的图示资料的散点图回归直线图,(二)一元线性回归的计算,(四)一元线性回归方程建立的基本步骤(4步),根据资料计算8个一级数据 x , x2, , y , y2 , , xy , n 计算3个二级数据:SSx , SSy , SP 计算参数的估计值a和b,并写出回归方程 作出资料的散点图和回归直线图,(四)一元线性回归方程建立的基本步骤(4步) 根据资料计算8,为了研究特定条件下鱼类对水中某农药的富集能力,搜集了10组有关数据如下(g/L和g/kg),试建立二者间的一元线性回归方程。,【例
8、6.1】,为了研究特定条件下鱼类对水中某农药的富集能力,搜集了10组有,解:经计算,所以,b = SP / SSx = 1.5508,a = 10.987 x与y的回归方程为:,解:经计算所以,b = SP / SSx = 1.5508,,散点图和回归直线图,散点图和回归直线图,三、线性回归的显著性检验,(一)线性回归的变异来源 变异来源 随机变量y的观测值y1, y2, , yn之间的变异是由两个方面的原因引起的:自变量 x 取值的不同;其它因素(试验误差)的影响。,三、线性回归的显著性检验 (一)线性回归的变异来源,平方和的分解(SSySSESSR) y 的离均差平方和SSy(总平方和SS
9、T): (dfTn1)离回归平方和SSE(剩余平方和,残差平方和): (dfEn2),平方和的分解(SSySSESSR),回归平方和SSR: (dfR1) SSR的意义:根据等式SSySSESSR可知,如果SSR的值较大,SSE的数值便比较小,说明回归的效果好;反之,如果SSR的值较小,SSE的数值便比较大,说明回归的效果差。,回归平方和SSR:,(二)F 检验当零假设H0:0成立时,SSR与SSE相互独立,且统计量当F F时,H0 :0不成立,称回归方程显著,(二)F 检验,具体检验可在方差分析表上进行:SSESSySSR SSRbSPb2SSxSP 2SSx,具体检验可在方差分析表上进行:
10、变异来源自由度平方和均方Fx1,【例6.2】,根据例6.1给出的鱼类对水中农药的富集资料,试检验其线性回归方程的显著性。,【例6.2】 根据例6.1给出的鱼类对水中农药的富集资料,试,(三)t 检验采用t检验可以检验回归系数b的显著性,进而对回归方程的显著性作出判断。1、统计假设 H0:0,HA:02、b的标准误3、检验统计量4、判断:若t t(n2),则否定H0,接受HA。,(三)t 检验,前述资料回归关系的t检验,所以,否定H0,接受HA,即b极显著。,前述资料回归关系的t检验所以,否定H0,接受HA,即b极显著,四、线性回归的区间估计和预测,(一)和的区间估计 有时和在专业上有特殊意义时
11、,要确定其置信区间。,四、线性回归的区间估计和预测 (一)和的区间估计,1、的置信区间a 的标准误为:而 所以 的置信区间为:,1、的置信区间,2、的置信区间b 的标准误为:而 所以 的置信区间为:,2、的置信区间,(二)对x的区间估计对x的区间估计,即是对总体均值(期望值)的区间估计。当xxi 时,估计标准误为:,(二)对x的区间估计,x的点估计为:所以,x 的置信度为(1)的置信区间为:,x的点估计为:,以鱼体对水中农药富集的数据为例:在x5.5处,y 的期望值的置信区间(95的置信度)为:,以鱼体对水中农药富集的数据为例:,(三)对yx的预测当xxi 时,对yx的预测,即对子总体的某一观
12、察值 yixii进行预测,相当于预测个体值的问题。,(三)对yx的预测,预测标准误为:当xxi 时,yi 的预测值的置信区间(置信度为1)为:,预测标准误为:,以鱼体对水中农药富集的数据为例求x5.5 时鱼体内农药含量y 的预测区间。在x5.5 处,鱼体内农药含量y 的置信度为95的预测区间为:,以鱼体对水中农药富集的数据为例,从计算可知,当x5.5 时,y 的区间估计的区间范围(18.92,20.12)小于y 的预测区间范围(18.23,20.81)。因此,回归分析的预测精度低于估计精度。,从计算可知,当x5.5 时,y 的区间估计的区间范围(1,回归方程的区间估计和预测区间,回归方程的区间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 相关 分析 课件
链接地址:https://www.31ppt.com/p-1641679.html