数学建模讲座回归分析ppt课件.pptx
《数学建模讲座回归分析ppt课件.pptx》由会员分享,可在线阅读,更多相关《数学建模讲座回归分析ppt课件.pptx(89页珍藏版)》请在三一办公上搜索。
1、数学建模培训回归分析与建模,主讲人:黄旭东安徽师范大学数学计算机科学学院统计系系主任,2,课程背景: 由于客观事物内部规律的复杂及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型。通过对数据的统计分析,找出与数据拟合最好的模型,回归模型是用统计分析方法建立的最常用的一类模型。,3,What Shall We Talk?内容安排,一、多元回归分析二、虚拟变量模型三、多元Logistic 回归分析,一、多元回归分析,5,5,实例1对中国国内旅游消费支出的定量研究,国内旅游消费支出度量及增长的状况怎样? (消费支出度量、增长速度)分析影响国内旅游消费支出的因素有哪些?
2、(如收入、闲暇时间、交通设施、人口、社会环境等)国内旅游消费支出与各种影响因素关系的性质是什么? (如增加、减少)各种因素对国内旅游消费支出影响的程度和具体数量规律是什么? (各种因素变动具体会引起旅游消费支出变动多少)所作数量分析结果的可靠性如何?对旅游消费增长的政策效应分析、对国内旅游消费支出发展趋势的预测等,5,6,6,实例2:中国家庭用汽车市场的研究家用汽车市场状况如何?(用销售量观测)影响汽车销量的主要因素是什么?(如收入、价格、费用、道路状况、政策、消费行为特征等)各种因素对汽车销量影响的性 质怎样?(正、负)各种因素影响汽车销量的具体 数量关系是什么?所得的分析结论是否可靠?今后
3、汽车市场的发展前景怎样? 应如何制定汽车的产业政策?,6,7,7,实例3:中国股票价格波动的研究股票价格变动的情况怎样? (用股价指数观测)影响股票价格变动的主要 因素是什么? (基本面、资金、政策、利率、公司业绩、投资者信心等)股价与各种影响因素的关系是什么? (利空、利多)各种因素影响的具体数量规律是什么?所得的数量分析结果可不可靠?今后股票价格的发展趋势可能会怎样?,8,这类实例需要研究的共性问题: 提出所研究的经济问题及度量方式(如消费、股票价格、汽车) 确定作为研究对象的经济现象的变量 分析主要影响因素(根据经济理论、实际经验) 选择若干作为影响因素的变量 分析各种影响因素与所研究经
4、济现象的相互关系 决定相互联系的数学关系式 确定所研究的经济问题与各种影响因素间的数量规律 需要有科学的数量分析方法 分析和检验所得数量结论的可靠性 需要运用统计检验方法 运用数量研究的结果作经济分析和经济预测 对数量分析的实际应用结论:以上问题的研究具有普遍性,需要运用回归分析方法去研究,8,案例 在一项对某社区家庭对某种消费品的消费需要调查中,得到下表所示的资料。,请用手工与软件两种方式对该社区家庭对该商品的消费需求支出作二元线性回归分析,其中手工方式要求以矩阵表达式进行运算。 (1)估计回归方程的参数及随机干扰项的方差 ,计算 及 。 (2)对方程进行 检验,对参数进行 检验,并构造参数
5、95%的置信区间。 (3)如果商品单价变为35元,则某一月收入为20000元的家庭的消费支出估计是多少?构造该估计值的95%的置信区间。,步骤一:建立工作表,并输入数据(1)打开Eviews软件,进入主界面,界面如下:,(2)点击File New workfile 得到如下界面:,(3)由于数据为截面数据,则依次点击: workfile frequency Undated or irregular;由于数据的个数为10,则按如下列步骤依次填入: Start date1 End date 10 OK结果如下图:,(4)建立序列对象: 定义解释变量X1 在workfile窗口中,依次点击: Obj
6、ects New Object series; 在Name for object中输入X1,界面如下所示:,定义解释变量X2在workfile窗口中,依次点击: Objects New Object series; 在Name for object中输入X2,界面如下所示:,定义被解释变量Y: 同理,在workfile窗口中,依次点击: Objects New Object series; 在Name for object中输入Y,界面如下所示:,(5)录入数据: 同时选中X、Y右击: Open as Group Edit+/- 相应的界面如下所示:,输入数据,数据输入后得到如下界面:,步骤二
7、:,第一问: (1)估计回归方程的参数及随机干扰项的方差 ,计算 及 。,(1)普通最小二乘估计: 在主界面:QuickEstimate Equation 出现如下界面:,依次输入 y c x1 x2(注意:要有空格)点击ok ,得到Equation窗口,如下图所示:,从该估计中,可得到随即干扰项的残差平方和 为2116.847根据 得到随即干扰项的方差 为,可决系数为调整的可决系数为,第二问: (2)对方程进行 检验,对参数进行 检验,并构造参数95%的置信区间。,(1) F检验,方程显著性的 检验是要检验模型中参数 是否显著不为零。原假设:备择假设:根据样本得到 =32.29408给定显著
8、性水平a=0.05,查F分布表得到临界值通过 来拒绝原假设,即线性关系显著成立,(2)t检验,提出假设,在软件中得到两个变量 的 值,分别为 =3.061617, =4.902030在显著性水平a=0.05,查 分布表得到 可见,两个变量的t值都大于该临界值,所以拒绝原假设,则在95%的水平下两个解释变量都通过了变量的显著性检验。,参数的置信区间,已知从回归计算中得到根据得到 的置信区间为(-17.35,-2.23) 的置信区间为(0.0148,0.0424),第三问: (3)如果商品单价变为35元,则某一月收入为20000元的家庭的消费支出估计是多少?构造该估计值的95%的置信区间。,进行以
9、下操作: 拓展工作空间:打开workfile窗口,点击 Procs Change workfile Range 将End date的数据1011 OK 确定预测值的起止日期:打开workfile窗口,点击 Procs Sample,将1011 OK 界面分别如下:,在x1的最下方填入35,在x2的最下方填入20000,按回车键。在出现的Equation界面,点击Forecast 出现相应界面如下:,在Forecast name中输入YF在S.E(optional)中输入W在workfile中双击yf可得到下面界面,得到X1=35,X2=20000时家庭的消费支出为Y=856.202507115
10、,双击w,得到,从上表可得根据得个值的95%的预测区间(759.41,952.99),在95%的置信度下均值的置信区间为即为(768.6,943.8),二、 虚拟变量模型,(一)虚拟变量的基本含义 (二)虚拟变量的引入 (三)虚拟变量的设置原则,在对在校学生的消费行为进行的调查中,发现在校生的消费行为呈现多元化的结构。人际交往消费、手机类消费、衣着类消费、化妆品类消费、电脑类消费、旅游类消费占有较大的比例;而食品类消费、学习用品类消费不突显。显然,男女生在消费上存在差异。为了了解男、女生的消费支出结构差异,应当如何建立模型?面临的问题:如何把男女生这样的非数量变量引入方程?,引例:男女大学生消
11、费真有差异吗?,(一)虚拟变量的基本含义,许多经济变量是可以定量度量。一些影响经济变量的因素是无法定量度量。为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”。这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量,记为D。虚拟变量只作为解释变量。,1、虚拟变量(dummy variables),一般地,在虚拟变量的设置中: 基础类型、肯定类型取值为1; 比较类型,否定类型取值为0。例如,反映文程度的虚拟变量可取为:D=1,本科学历D=0,非本科学历虚拟变量能否取1、0以外的数值?,同时含有一般解释变量与
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 讲座 回归 分析 ppt 课件

链接地址:https://www.31ppt.com/p-1917904.html