第7章系统预测3回归分析ppt课件.ppt
《第7章系统预测3回归分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《第7章系统预测3回归分析ppt课件.ppt(110页珍藏版)》请在三一办公上搜索。
1、7.4 回归分析预测法,2,回归,3,回归的由来,由英国著名统计学家Francis Galton在19世纪末期研究孩子及其父母的身高时提出来的。Galton发现身材高的父母,他们的孩子身材也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高Galton把这种孩子的身高向平均值靠近的趋势称为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析,4,多元回归在卫生检验中的应用,5,什么是回归分析?(regression),1、从一组样本数据出发,确定变量之间的数学关系式。2、对这些关系式的可信程度进行各种
2、统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著。3、利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。,6,变量间的关系函数关系相关关系相关关系的描述与度量散点图相关系数相关系数的显著性检验,7.4.1 变量间关系的描述与度量,7,变量间的关系,8,函数关系,1、是一一对应的确定关系2、设有两个变量x和y,变量y 随变量x一起变化,并完全依赖于x,当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量3、各观测点落在一条线上,9,函数关系的例子,某
3、种商品的销售额y与销售量x之间的关系可表示为 y=px(p 为单价)圆的面积S与半径R之间的关系可表示为S=R2企业的原材料消耗额y与产量x1、单位产量消耗x2、原材料价格x3之间的关系可表示为 y=x1x2x3,10,相关关系(correlation),1、变量间关系不能用函数关系精确表达2、一个变量的取值不能由另一个变量唯一确定3、当变量 x 取某个值时,变量 y 的取值可能有几个4、各观测点分布在直线周围,11,相关关系的描述与度量,相关分析变量之间是否存在关系?如果存在关系,它们之间是什么样的关系?变量之间的关系强度如何?样本所反映的变量之间的关系能否代表总体变量之间的关系?,12,散
4、点图(scatter diagram),13,散点图(例题分析),【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的增长,这给银行业务的发展带来较大压力。为弄清不良贷款形成的原因,管理者希望利用银行业务的有关数据进行定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据,14,散点图(例题分析),15,散点图(不良贷款对其他变量的散点图),16,散点图(5个变量的散点图矩阵),不良贷款,贷款余额,累计应收贷款,贷款项目个数,固定资产投资
5、,17,相关系数,相关(correlation)系数:描述两个数值变量线性相关的方向和强度。,18,提问,相关系数与x、y的顺序相关,即x、y之间有主从关系没有?,19,正的r值显示变量之间有正相关,负的r值显示出负相关相关系数r的值永远在-1和+1之间|r|=1:完全线性相关0r1:正线性相关-1r0:负线性相关r=0:不存在线性相关关系,或不相关(没有关系),相关系数的性质,20,r=0.4,r=0.8,r=-0.4,r=-0.8,相关系数的性质,r=0,21,相关系数的性质,r,22,相关系数只是两变量直线相关强度的度量;不能描述两变量间的曲线相关,不管这种相关关系有多强。,r=0!,相
6、关系数的性质,23,相关系数(例题分析),累计应收贷款,贷款项目个数,累计应收贷款,贷款项目个数,24,|r|0.8时,可视为两个变量之间高度相关0.5|r|0.8时,可视为中度相关0.3|r|0.5时,视为低度相关|r|0.3时,说明两个变量之间的相关程度极弱,可视为不相关注意:上述解释必须建立在对相关系数的显著性进行检验的基础之上,相关系数的经验解释,25,相关系数的显著性检验:若r在显著性水平下超过依赖于自由度n-2的临界值r(n-2,),则认为其在显著性水平下与0显著不同,检验通过,并称相关系数是显著的。,相关系数的显著性检验,相关系数表,备注:n为样本量,26,7.4 回归分析预测法
7、,不确定的相关关系,回归分析,确定的函数关系,回归分析是因果关系分析中的一种,是研究相关关系的一种数学手段。,27,7.4 回归分析预测法,回归分析主要内容:从数据出发,确定因变量和自变量之间的关系;对关系式中的参数进行估计,并进行统计检验;筛选自变量,即从大量自变量中找出影响显著的,剔除不显著的;用求得的回归模型进行预测;对预测结果进行分析、评价。,28,回归模型(regression model),1、回答“变量之间是什么样的关系?”2、方程中运用1 个数值型因变量(响应变量)被预测的变量1 个或多个数值型变量(解释变量)用于预测的变量3、主要用于预测和估计,29,1、定义 一元线性回归预
8、测是处理因变量y与自变量x 之间线性关系的回归预测法,其数学模型为:,其中a、b称为回归系数,首先根据x、y的现有统计数据,在直角坐标系中作散点图,观察y随x而变是否为近似的线性关系。若是,则求出式(7.4.1)中的a、b值,就可确定其数学模型,然后由x的未来变化去求相应的y 值。,7.4.2 一元线性回归分析预测,30,2、a、b的确定方法,(1)解联立方程组,将式(7.4.1)两边分别求和将式(7.4.1)两边分别乘 再求和,求解后得到,7.4.2 一元线性回归分析预测,31,7.4.2 一元线性回归分析预测,32,(2)直接用最小二乘法,使拟合的数值与实际值的总方差为最小,即拟合程度最好
9、,则得两者之差ei,根据极值原理,式(7.4.6)对a、b分别求偏导,并令其=0,得,7.4.2 一元线性回归分析预测,33,7.4.2 一元线性回归分析预测,34,7.4.2 一元线性回归分析预测,35,Sxx称之为xi的方差和(离差平方和)Sxy称之为xi与yi的协方差和(离差积之和),7.4.2 一元线性回归分析预测,36,3、回归效果检验,y=a+bx一定程度上反映了y与x之间的统计线性相关关系,该关系是否密切,决定了所采用线性预测模型多大程度上可信。这可以通过y与x的相关系数rxy的大小来确定。,7.4.2 一元线性回归分析预测,37,3、回归效果检验,rxy的取值(P136图7-7
10、):|rxy|=1,样本点完全落在回归线上,y与x有完全的线性关系;0rxy1,y与x有一定的正线性相关关系,即y随着x的增加而成比例倍数增加;-1rxy0,y与x有一定的负线性相关关系,即y随着x的增加而成比例倍数减少;rxy=0,y与x之间不存在线性相关关系。,7.4.2 一元线性回归分析预测,查相关系数表(教材P.384附表二),若|rxy|表中相应数字r临界值,表示x、y间存在线性相关,预测模型可用。,38,r临界值是对不同的样本容量n,在两种置信度95%、99%下的相关系数的临界值,即r临界值与样本容量n、以及所要求的置信度1-(给定的显著水平)有关。,7.4.2 一元线性回归分析预
11、测,39,4、简化算法,对具有类似等差时间序列关系的统计数据进行预测时,可以采用此法。,由计算a、b的式(7.4.2)、(7.4.3),发现,若能使其中的xi=0,则计算a、b就会大大简化为,7.4.2 一元线性回归分析预测,40,如何使xi=0?,当xi为等差自然数列时,可引入“集中时间序列”即使等差序列呈对称形态。,在给xi编号时可以这样处理:,(1)若n为奇数,取xi的时间间隔为1,将x=0置于资料期的中央;(2)若n为偶数,取xi的时间间隔为2,将x=-1(+1)置于资料期中央的上(下)期。,例7.4.1 某服装厂最近5年的服装产量如下表所示,请预测该厂今明两年的产量。,年份 倒5年
12、倒4年 倒3年 前年 去年 今年 明年,产量(万元)300 350 380 430 500?,7.4.2 一元线性回归分析预测,41,解:以年份为自变量xi,产量为因变量yi,在直角坐标系中画散点图后发现y、x之间基本上呈线性关系,故可用一元线性回归方法进行预测。此处n=5为奇数,因此可列下表整理资料,并使xi=0,年份倒5年倒4年大前年前年去年 平均值,xi-2-10 1200,yi3003503804305001960392,xiyi-600-35004301000480,Xi24101410,Yi290000122500144400184900250000791800,7.4.2 一元线
13、性回归分析预测,42,查相关系数表,此处n=5,若取=0.01,置信度(1-)=99%查得,7.4.2 一元线性回归分析预测,43,由于rxyr临界值,所以x,y之间确实存在着线性相关,故预测模型 可以用于预测。,7.4.2 一元线性回归分析预测,44,7.4.2 一元线性回归分析预测,45,不良贷款对贷款余额的散点图,7.4.2 一元线性回归分析预测,相关系数:r=0.8436,显著性水平=0.01时,r(23,0.01)=0.505,46,7.4.2 一元线性回归分析预测,【例】求不良贷款对贷款余额的回归方程,回归方程为:y=-0.8295+0.037895 x回归系数=0.037895
14、表示,贷款余额每增加1亿元,不良贷款平均增加0.037895亿元,47,不良贷款对贷款余额的回归方程的图示,7.4.2 一元线性回归分析预测,48,1、基本概念 社会经济S中,影响事物发展的往往是多个因素,一元回归只是一种抽象,是抓主要矛盾的结果。有时分不清主次,只有通过多因素的多元回归才能反映事物的本质。例如一个城市的公共交通营运总额y与该市的人口总数x1、国民生产总值x2、商品流通量(或人口流动数)x3等多因素有关,经过分析抓住主要矛盾后,可建立如下二元线性回归预测模型:,7.4.3 多元线性回归分析预测法,49,一般而言,设系统变量y与k个自变量x1,x2,,xk之间存在统计线性相关关系
15、,且给定n组样本数据点如下:(y1,x11,x21,xk1),(y2,x12,x22,xk2),(yn,x1n,x2n,xkn)则其满足:于是多元线性回归预测模型可以表示为:,多元线性回归与矩阵方法相结合,是社会经济系统预测与规划的一个重要手段。,7.4.3 多元线性回归分析预测法,50,2、多元线性回归模型的参数估计 设式(7.4.10)中,则其k+1个参数aj可利用最小二乘法进行估计,记,7.4.3 多元线性回归分析预测法,51,于是,式(7.4.10)可以表示为:,7.4.3 多元线性回归分析预测法,52,令误差平方和:由极小值条件 可得(见推导):,记 系数矩阵(对称)适于计算机实现,
16、最小二乘法估计 是A的无偏估计。,7.4.3 多元线性回归分析预测法,53,手算时,极小值条件可以表示为:,7.4.3 多元线性回归分析预测法,54,整理可得:,解上面的方程组即可得到a0,a1,ak的估计值。,7.4.3 多元线性回归分析预测法,55,3、相关系数 记 RSS回归平方和 ESS剩余平方和 TSS总平方和,7.4.3 多元线性回归分析预测法,56,误差平方和的分解(三个平方和的意义),1、回归平方和(RSSsum of squares of regression)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化
17、,也称为可解释的平方和2、剩余(残差)平方和(ESSsum of squares of error)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和3、总平方和(TSStotal sum of squares)反映因变量的 n 个观察值与其均值的总误差,57,误差的分解(图示),x,58,误差平方和的分解(三个平方和的关系),TSS=RSS+ESS,59,3、相关系数(1)复相关系数 r:表示y与所有自变量x1,xk的整体线性 相关程度。,7.4.3 多元线性回归分析预测法,60,3、相关系数 对一元线性回归而言,相关系数含义如下(P136图7-7):r=1:y
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 系统 预测 回归 分析 ppt 课件

链接地址:https://www.31ppt.com/p-4787883.html