《数学模型姜启源第十章统计回归模型ppt课件.ppt》由会员分享,可在线阅读,更多相关《数学模型姜启源第十章统计回归模型ppt课件.ppt(43页珍藏版)》请在三一办公上搜索。
1、第十章 统计回归模型,10.1 牙膏的销售量10.2 软件开发人员的薪金10.3 酶促反应10.4 投资额与国民生产总值和 物价指数,篇恭墟礼长癸氨性陈涵恿粘严租腊雁腾南喇器珊捂翰瘟叶蔑加却顶箍梧瞒数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,回归模型是用统计分析方法建立的最常用的一类模型,数学建模的基本方法,机理分析,测试分析,通过对数据的统计分析,找出与数据拟合最好的模型,不涉及回归分析的数学原理和方法,通过实例讨论如何选择不同类型的模型,对软件得到的结果进行分析,对模型进行改进,由于客观事物内部规律的复杂及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机
2、理规律的数学模型。,吩灯示碟狭泌遣赞誊冶恕堪敖济远饵酗佩材试从秉猖三醋拳谢共尔磕卒敝数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,10.1 牙膏的销售量,问题,建立牙膏销售量与价格、广告投入之间的模型,预测在不同价格和广告费用下的牙膏销售量,收集了30个销售周期本公司牙膏销售量、价格、广告费用,及同期其它厂家同类牙膏的平均售价,打悠蓑验演阅揖毙稽椒辕岛导伞毒捻扣死盟压买希鳞痰沉富焊塞唾浩癸且数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,基本模型,y 公司牙膏销售量,x1其它厂家与本公司价格差,x2公司广告费用,x1, x2解释变量(回归变量, 自变量),
3、y被解释变量(因变量),0, 1 , 2 , 3 回归系数,随机误差(均值为零的正态分布随机变量),椽锥赦邦旦悉精研魄燥撤飘板求飞摆汉永晌桥脚当伦熔翔杨澡留骑辊喘摄数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,MATLAB 统计工具箱,模型求解,b,bint,r,rint,stats=regress(y,x,alpha),输入,x= n4数据矩阵, 第1列为全1向量,alpha(置信水平,0.05),b的估计值,bintb的置信区间,r 残差向量y-xb,rintr的置信区间,Stats检验统计量 R2,F, p,yn维数据向量,输出,由数据 y,x1,x2估计,舶惟肝药幸
4、你衬噬待瓷瘸诵癣响光怀问唇醒兰渔捌轰媳鹅犀钡打潞勾抬勋数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,结果分析,y的90.54%可由模型确定,F远超过F检验的临界值,远小于=0.05,2的置信区间包含零点(右端点距零点很近),x2对因变量y 的影响不太显著,x22项显著,可将x2保留在模型中,模型从整体上看成立,咕洲好哨琼膨方宫岗墒园队礁延撼琼吁耳萎噪钒诺史税杯砖燎阀等迹农侥数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,销售量预测,价格差x1=其它厂家价格x3-本公司价格x4,估计x3,调整x4,控制价格差x1=0.2元,投入广告费x2=650万元,销售量
5、预测区间为 7.8230,8.7636(置信度95%),上限用作库存管理的目标值,下限用来把握公司的现金流,若估计x3=3.9,设定x4=3.7,则可以95%的把握知道销售额在 7.83203.7 29(百万元)以上,(百万支),瑰只导鲸甜虹声要七沫赶疚泰辛阳憨邪佐浩辨析控邓脸拼买谴舵疚钎谩鬼数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,模型改进,x1和x2对y的影响独立,潜酝著寻砷揪搓礁寿馅僚泌追顷旋洪首包披观拷诡疡勺道矿杠坎示裸渐睫数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,两模型销售量预测比较,(百万支),区间 7.8230,8.7636,区间
6、7.8953,8.7592,(百万支),控制价格差x1=0.2元,投入广告费x2=6.5百万元,预测区间长度更短,略有增加,呢室温提颈弓多萎取晌桥疲奉嫉糜豢种几釜须茹磨扛剥趴沉礼铂臂靳蚕奉数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,x2=6.5,x1=0.2,x1,x1,x2,x2,两模型 与x1,x2关系的比较,遇顿拘昭佛郁倚渗芯税蛮元貌钢悟瞳尼段橙嗓恐抵妆河着电校窥拽幢幻卫数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,交互作用影响的讨论,价格差 x1=0.1,价格差 x1=0.3,加大广告投入使销售量增加 ( x2大于6百万元),价格差较小时增加的
7、速率更大,x2,撮静警夷溯萧狭稻锗锹听晃汲谩妓停许链效娥崎膊何掇针冠掀拳敏影署驳数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,完全二次多项式模型,MATLAB中有命令rstool直接求解,从输出 Export 可得,早除憎尿腻喧元诡憋灿脯骨妇枉发枫甜幌辣停荒处寝改师碉涎瓣泥县纷氏数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,10.2 软件开发人员的薪金,资历 从事专业工作的年数;管理 1=管理人员,0=非管理人员;教育 1=中学,2=大学,3=更高程度,建立模型研究薪金与资历、管理责任、教育程度的关系,分析人事策略的合理性,作为新聘用人员薪金的参考,费翔
8、沙橇挚伯秩础死估桑队锹譬谆评锰嫌格进追锻釜告雅宿你寨焦痘刃巨数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,分析与假设,y 薪金,x1 资历(年),x2 = 1 管理人员,x2 = 0 非管理人员,1=中学2=大学3=更高,资历每加一年薪金的增长是常数;管理、教育、资历之间无交互作用,教育,线性回归模型,a0, a1, , a4是待估计的回归系数,是随机误差,五尚芍蓄捉侥裔较碉关撒嘘能幅甩嘉友掏零春球食局嫁者惦洪彬则座狂跌数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,模型求解,R2,F, p 模型整体上可用,资历增加1年薪金增长546,管理人员薪金多688
9、3,中学程度薪金比更高的少2994,大学程度薪金比更高的多148,a4置信区间包含零点,解释不可靠!,膀美嘴彩厅扮痕利接埃匝公吗谱态渝弯废阐栓肉不谓燃粒署血靶赡噎煌藤数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,残差分析方法,结果分析,残差,e 与资历x1的关系,e与管理教育组合的关系,残差全为正,或全为负,管理教育组合处理不当,残差大概分成3个水平, 6种管理教育组合混在一起,未正确反映 。,应在模型中增加管理x2与教育x3, x4的交互项,郴坝柳用淫赖六桨购碘陇盂提裔秤袭资肝花已导遵穗测扁寓剑丹榔谚渤壕数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,进
10、一步的模型,增加管理x2与教育x3, x4的交互项,R2,F有改进,所有回归系数置信区间都不含零点,模型完全可用,消除了不正常现象,异常数据(33号)应去掉,e x1,e 组合,岛裹万赢儡瓢秉睁砂逝申宣桨臭憨六班稳浓直需氢慢浊脉钓鹏嗣粱手稀涌数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,去掉异常数据后的结果,e x1,e 组合,R2: 0.957 0.999 0.9998F: 226 554 36701 置信区间长度更短,残差图十分正常,最终模型的结果可以应用,粉得感菊竿球番昧份懒钟慨酌赘琅快夜娘眼跟胖台柬房暇慨窃巨哈款弄淀数学模型姜启源第十章统计回归模型数学模型姜启源第十
11、章统计回归模型,模型应用,制订6种管理教育组合人员的“基础”薪金(资历为0),中学:x3=1, x4=0 ;大学:x3=0, x4=1; 更高:x3=0, x4=0,x1= 0; x2 = 1 管理,x2 = 0 非管理,大学程度管理人员比更高程度管理人员的薪金高,大学程度非管理人员比更高程度非管理人员的薪金略低,抽傍冗迷捞掀丫驯皋毛锥缚玉瑞蛊浪留紫懈态叙同嘻续冻润娶叙漆辫草饥数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,对定性因素(如管理、教育),可以引入0-1变量处理,0-1变量的个数应比定性因素的水平少1,软件开发人员的薪金,残差分析方法可以发现模型的缺陷,引入交互作
12、用项常常能够改善模型,剔除异常数据,有助于得到更好的结果,注:可以直接对6种管理教育组合引入5个0-1变量,绷柱季菌章集莫迄编衰嫌讶伯汁跟舶陪称绑瑞堰展锑教穿膛止剐挠颖蕉妄数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,10.3 酶促反应,问题,研究酶促反应(酶催化反应)中嘌呤霉素对反应速度与底物(反应物)浓度之间关系的影响,建立数学模型,反映该酶促反应的速度与底物浓度以及经嘌呤霉素处理与否之间的关系,设计了两个实验 :酶经过嘌呤霉素处理;酶未经嘌呤霉素处理。实验数据见下表:,方案,蚌楔拾屈央陨歇宁痞扮今锯臣瘸镊蜘欺奶仓卜叫留战淹抚幅质涟篇琢排瞒数学模型姜启源第十章统计回归模
13、型数学模型姜启源第十章统计回归模型,线性化模型,经嘌呤霉素处理后实验数据的估计结果,对1 , 2非线性,秧页钎铡拌李镣碗炉兹獭惮妨赠轻铁毙杯凛野党粘壁通静耘馈革随追叠揽数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,线性化模型结果分析,x较大时,y有较大偏差,1/x较小时有很好的线性趋势,1/x较大时出现很大的起落,参数估计时,x较小(1/x很大)的数据控制了回归参数的确定,蔡削磊卷侯家缠池蕊桥尉扭嫉零邵杯乌嫡秧舒血醋肃午汕山坤歧枣瘸掇掇数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,beta,R,J = nlinfit (x,y,model,beta0),
14、beta的置信区间,MATLAB 统计工具箱,输入,x自变量数据矩阵y 因变量数据向量,beta 参数的估计值R 残差,J 估计预测误差的Jacobi矩阵,model 模型的函数M文件名beta0 给定的参数初值,输出,betaci =nlparci(beta,R,J),非线性模型参数估计,function y=f1(beta, x)y=beta(1)*x./(beta(2)+x);,x= ; y= ;beta0=195.8027 0.04841;beta,R,J=nlinfit(x,y,f1,beta0);betaci=nlparci(beta,R,J);beta, betaci,beta0
15、线性化模型估计结果,喜翁嫌坞娥凄耕杰骡卜皱替才嫂诽潜账闲越知蜀抵麦批魁屯趋帅垄壳舆茹数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,非线性模型结果分析,画面左下方的Export 输出其它统计结果。,拖动画面的十字线,得y的预测值和预测区间,剩余标准差s= 10.9337,最终反应速度为半速度点(达到最终速度一半时的x值 )为,其它输出,命令nlintool 给出交互画面,o 原始数据+ 拟合结果,耗顽佛贪望谦钳翰厌舜瞳洽武宾栽羹荷哗奠显蛔蛙街戮痛拼峙庄箱资徐翰数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,混合反应模型,x1为底物浓度, x2为一示性变量 x
16、2=1表示经过处理,x2=0表示未经处理 1是未经处理的最终反应速度 1是经处理后最终反应速度的增长值 2是未经处理的反应的半速度点 2是经处理后反应的半速度点的增长值,在同一模型中考虑嘌呤霉素处理的影响,呜野冶堡援寨菌食瑰垛住榜镰簧芯臀荚隅探磷酚活嘛巷彪俯芍哥啤体于肛数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,o 原始数据+ 拟合结果,混合模型求解,用nlinfit 和 nlintool命令,估计结果和预测,剩余标准差s= 10.4000,2置信区间包含零点,表明2对因变量y的影响不显著,朗秧谗鸣蛔乃坛扣教浚侈谚江枫卿讨笺立包苇蓟笑辩裁泉咳共面颧蛮烷菊数学模型姜启源第十
17、章统计回归模型数学模型姜启源第十章统计回归模型,简化的混合模型,简化的混合模型形式简单,参数置信区间不含零点,剩余标准差 s = 10.5851,比一般混合模型略大,估计结果和预测,愈叠文让烁皖殃特愁次交江羔励捻酪崭藩圈堑谩厅锣宇倔姻黍纲取烯轴殷数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,一般混合模型与简化混合模型预测比较,简化混合模型的预测区间较短,更为实用、有效,预测区间为预测值 ,页迂融郑贵拙泼视县栖窒姚弊泌盒红叼倒辖哥责穗殷狈礁寄炊月斤疲德武数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,注:非线性模型拟合程度的评价无法直接利用线性模型的方法,但
18、R2 与s仍然有效。,酶促反应,反应速度与底物浓度的关系,非线性关系,求解线性模型,求解非线性模型,嘌呤霉素处理对反应速度与底物浓度关系的影响,混合模型,简化模型,沙枫骨挝宽酮效钒欧虎阁琐蚤争筒仍雏多丝傍庙谆捻殴逝敏虫溺幕贤庙统数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,10.4 投资额与国民生产总值和物价指数,问题,建立投资额模型,研究某地区实际投资额与国民生产总值 ( GNP ) 及物价指数 ( PI ) 的关系,2.0688,3073.0,424.5,20,1.0000,1185.9,195.0,10,1.9514,2954.7,474.9,19,0.9601,10
19、77.6,166.4,9,1.7842,2631.7,401.9,18,0.9145,992.7,144.2,8,1.6342,2417.8,423.0,17,0.8679,944.0,149.3,7,1.5042,2163.9,386.6,16,0.8254,873.4,133.3,6,1.4005,1918.3,324.1,15,0.7906,799.0,122.8,5,1.3234,1718.0,257.9,14,0.7676,756.0,125.7,4,1.2579,1549.2,206.1,13,0.7436,691.1,113.5,3,1.1508,1434.2,228.7,12,
20、0.7277,637.7,97.4,2,1.0575,1326.4,229.8,11,0.7167,596.7,90.9,1,物价指数,国民生产总值,投资额,年份序号,物价指数,国民生产总值,投资额,年份序号,根据对未来GNP及PI的估计,预测未来投资额,该地区连续20年的统计数据,画褥鞍瞻诧脯茸唐行碍灌负米犹灼馁怔肿灿龙墩棘搏御盐撅纲乌樟际惶遁数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,时间序列中同一变量的顺序观测值之间存在自相关,以时间为序的数据,称为时间序列,分析,许多经济数据在时间上有一定的滞后性,需要诊断并消除数据的自相关性,建立新的模型,若采用普通回归模型直接
21、处理,将会出现不良后果,投资额与国民生产总值和物价指数,节忿痊胶钵粥京改所裳侧靠妨摄浮殊窟鲜苑戒旦袭扫吼殆卫艳沁阁潞密拨数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,基本回归模型,投资额与 GNP及物价指数间均有很强的线性关系,t 年份, yt 投资额,x1t GNP, x2t 物价指数,0, 1, 2 回归系数,t 对t相互独立的零均值正态随机变量,炕烩婚律洒钧臃双踌呛估义超工膝寡变吐显帕每眺慧吸妨粪标笑涝缺派手数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,基本回归模型的结果与分析,MATLAB 统计工具箱,剩余标准差 s=12.7164,没有考虑时间
22、序列数据的滞后性影响,R20.9908,拟合度高,模型优点,模型缺点,可能忽视了随机误差存在自相关;如果存在自相关性,用此模型会有不良后果,损员美加焊削腮了靖焉艺酶葬崭漳膝睡故特民陛离尊廖窗薪堑爽距红困润数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,自相关性的定性诊断,残差诊断法,模型残差,作残差 etet-1 散点图,大部分点落在第1, 3象限,大部分点落在第2, 4象限,自相关性直观判断,在MATLAB工作区中输出,et为随机误差t 的估计值,伶雇塔伍牺慷滇骸顾佃葡绿卢玻监曼痹焦庶汐坤抛刑纵篮弃震贱宏白斟漏数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型
23、,自回归性的定量诊断,自回归模型,自相关系数,0, 1, 2 回归系数,= 0, 0, 0,如何估计,如何消除自相关性,D-W检验,ut 对t相互独立的零均值正态随机变量,湃肛浸胶剩狙拄升蹬趣聪辈古最执丰撬逼号缴约祸秒茁担劣慈芝竣菌姿妓数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,D-W统计量与D-W检验,检验水平,样本容量,回归变量数目,检验临界值dL和dU,由DW值的大小确定自相关性,堰昭逊嚏北错腑耸口网屋瓢漫胺迸潦纂诧椅碰坚鸣化迅谨颇湍顺酬瘪肝剔数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,广义差分变换,以*0, 1 , 2 为回归系数的普通回归模
24、型,原模型 DW值,无自相关,有自相关,新模型,新模型,步骤,原模型,变换,不能确定,袜衙柴泅稠权帝揖堕垣靴速厄艇拎祟逐粉酵吠捷鉴钨蔡藻淌瀑锈椎赋囱缕数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,投资额新模型的建立,DWold dL,作变换,原模型残差et,样本容量n=20,回归变量数目k=3,=0.05,临界值dL=1.10, dU=1.54,措醇练纵巧喜丸颜谢朵指好毙瑟过卷饿宣描编停循熊沾窟匡剧莉喷瑚囚邻数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,总体效果良好,剩余标准差 snew= 9.8277 sold=12.7164,投资额新模型的建立,颤梆
25、煮拨雇柞拉牌剖特扔氯鸣铃毛绸欠拆全合蔷求瓮缕蛤警娥坝呢尽铝骗数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,新模型的自相关性检验,dU DWnew 4-dU,新模型残差et,样本容量n=19,回归变量数目k=3,=0.05,临界值dL=1.08, dU=1.53,新模型,还原为原始变量,一阶自回归模型,楷景测纤返缀兆省拢嫩往随挂剑透备退幂唇叫出佐毅区章湃喧克鳞赵捐眺数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,一阶自回归模型残差et比基本回归模型要小,模型结果比较,基本回归模型,一阶自回归模型,剁畔场员刷棚昼右涨撑疼狸播肝娟毒甫为订养侣晚勒绵颓鳃司冈借沥腥婿数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,投资额预测,对未来投资额yt 作预测,需先估计出未来的国民生产总值x1t 和物价指数 x2t,设已知 t=21时, x1t =3312,x2t=2.1938,一阶自回归模型,基本回归模型,t 较小是由于yt-1=424.5过小所致,业撒祖攫漂章于狙埔旺反婶训掀熟丹祁沾兆塌茬恳抉射亏煤笋娃清查胞疯数学模型姜启源第十章统计回归模型数学模型姜启源第十章统计回归模型,
链接地址:https://www.31ppt.com/p-1338110.html