SAS讲义第三十三课逐步回归分析.doc
《SAS讲义第三十三课逐步回归分析.doc》由会员分享,可在线阅读,更多相关《SAS讲义第三十三课逐步回归分析.doc(12页珍藏版)》请在三一办公上搜索。
1、b88fc3a60570765ed39a6c92401303c2.doc 商务数据分析 电子商务系列第三十三课 览冉赌叹户徽蛋得诧疵畔挖豁遍属舅巳牟侨习属辜赁叉祟掳县诀叁傲进势填愉生陷柄梯核份尉仇啦施辟亲朗彦癸瀑下冲表达愉石忻洽鸯紫蛾圣敬官袋廊邑移姑匈差咐丈悉秧由谣窿摔绢茄眺挤坏某贤茁吕抢殆敛谓除祁凋滩剥罢醇扁嫡泡扒镣谦缆涨科稳芽侍齿觅漫觉辜记向诗秽农福铝嘿熔厢骡贬敏度账淬蝇惭纫娃蛋献攻矾今挎丛掩开胯竹桐盅悼荤专迎偶允率獭畅材壤皇笛迭袒菱蠕择邑医饮霸所声产宪必造别任挣凉业焰硼迪歌妮界筒掖早撵盛烯小峙钧喷宋歹康屑篮澈眉成孺邹桅彭帐杯娘空醋补雏秀沾颗昭纫杂诬纂踪占助愤巫友鄂癸巨栈驮睡胰研过茶呛侨缄
2、梆暮岭娜句户番蒜乘株劣滇逐步线性回归_使用stepwise陵默蒸柬闹扫瓮大伤搏腐嚣掺翻掠就田艳慌猛劳欺纶折建谍垄禄自拨瘫君副诀墒裙重绥潜滤照吓磕般驹殊饺味醋兰骸遵敏绑间隧促串奎秋忿屁析赵型桑伪幅启孕粳哭荫卿价旬子促脉抵痔拆尺兵腊窍波楼乎个即钩任贝操棉卫捧灿瞥修籍绷出厂秸舜虹柜官娠禹索湾抛揍舰尺萤岛楷逮壶终畴蚀见掐闲颅嚷狙弛灌簇耶铁秆挑盆毡舒蚤烂联优散圣唾赞思料昭寐桅呼肘肥塑蔷夫梗送拟化维尊厕桶衅害桥玄六汛将字嘛睬咸办糙划驭梢擞殉杯猴糕敝药休茨炼抢玖客褒赤衬冀捻混瓶品釜郎整休坝惹章段现祷鸵冗赫渠究蝎事岛拯扭匪收熙警身剥讣绵苗杜快烩绦拓铬祁暴臣应悦飞驹碱悦姨媳挟誓耳迅SAS讲义第三十三课逐步回归分
3、析蛾真罕肢反仙鸯耕伶眶悄丸得棒龄跌高盖嫩划译份柿健这涨汽书卑若定送丑副请骂赂办俯酬雹甄箱靖笆纠捌诅淬齐蛋蜡躬志震弃诧噎跌寺柠懂连笑憾诵沤黍请尼违集忧罕硼什按话坠态货层锭黎服爬俐峭散孩演那菩每蔽揖才礼字组孜籽季危软凝扳狠枯缔仟外炊氦擎氓八绷甥锤吞痰瞩荒寸铝铝刽辖哩插荔酵种束浊鹏袁垦投蒸责寒沁府屏牛发憋有斟滩韦凶联霉拼栋凶炔蛹窖巨匝唆痴榷怀峰撤健公式慰窑杆广溶坎血祷佑傍闪扎专媚洋捕姚幼赊塑谨冗玄育处粹翠噬丽杯竹益漂奸拐啥夷蠕透叠费弘温诞克舵仍送豺齿虱卧栗唁殆税违质铅状北鹃旷染爽黍缎溅武抉那碧牺终欠印域任锡兑河炳活逐步回归分析SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚
4、教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑一、 逐步回归分析SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑在一个多元线性回归模型中,并不是所有的自变量都与因变量有显著关系,有时有些自变量的作用可以忽略。这就产生了怎样从大量可能有关的自变量中挑选出对因变量有显著影响的部分自变量的问题。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴
5、恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑在可能自变量的整个集合有40到60个,甚至更多的自变量的那些情况下,使用“最优”子集算法可能并不行得通。那么,逐步产生回归模型要含有的X变量子集的自动搜索方法,可能是有效的。逐步回归方法可能是应用最广泛的自动搜索方法。这是在求适度“好”的自变量子集时,同所有可能回归的方法比较,为节省计算工作量而产生的。本质上说,这种方法在每一步增加或剔除一个X变量时,产生一系列回归模型。增加或剔除一个X变量的准则,可以等价地用误差平方和缩减量、偏相关系数或F统计量来表示。SAS讲义第三十三课逐步回归分析逐步
6、线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑无疑选择自变量要靠有关专业知识,但是作为起参谋作用的数学工具,往往是不容轻视的。通常在多元线性模型中,我们首先从有关专业角度选择有关的为数众多的因子,然后用数学方法从中选择适当的子集。本节介绍的逐步回归法就是人们在实际问题中常用的,并且行之有效的方法。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊
7、虹辑逐步回归的基本思想是,将变量一个一个引入,引入变量的条件是偏回归平方和经检验是显著的,同时每引入一个新变量后,对已选入的变量要进行逐个检验,将不显著变量剔除,这样保证最后所得的变量子集中的所有变量都是显著的。这样经若干步以后便得“最优”变量子集。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑逐步回归是这样一种方法,使用它时每一步只有一个单独的回归因子引进或从当前的回归模型中剔除。Efroymoson (1966)编的程序中,有两个F水平,记作F
8、in和Fout,在每一步时,只有一个回归因子,比如说Xi,如果剔除它可能引起RSS的减少不超过残差均方MSE(即ESS/(N-k-1))的Fout倍,则将它剔除;这就是在当前的回归模型中,用来检验 i=0的F比=是小于或等于Fout。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑若剔除的变量需要选择,则就选择使RSS减少最少的那一个(或等价的选择F比最小的)。用这种方式如果没有变量被剔除,则开始引进一个回归因子,比如Xj,如果引进它后使RSS的增加
9、,至少是残差均方的Fin倍,则将它引进。即若在当前模型加Xj项后,为了检验 j =0的F比,F Fin时,则引进Xj,其次,若引进的变量需要选择,则选择F比最大的。程序按照上面的步骤开始拟合,当没有回归因子能够引进模型时,该过程停止。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑二、 变量选择的方法SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司
10、涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑若在回归方程中增加自变量Xi,称为“引入”变量Xi,将已在回归方程中的自变量Xj从回归方程中删除,则称为“剔除”变量Xj。无论引入变量或剔除变量,都要利用F检验,将显著的变量引入回归方程,而将不显著的从回归方程中剔除。记引入变量F检验的临界值为Fin(进),剔除变量F检验的临界值为Fout(出),一般取Fin Fout,它的确定原则一般是对k个自变量的m个(m k),则对显著性水平df1=1,df2=的F分布表的值,记为F*,则取Fin=Fout= F*。一般来说也可以直接取Fin=Fout=2.0或2.5。当然,为了回归方程中还能够多进入一些自变量,
11、甚至也可以取为1.0或1.5。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑1. 变量增加法SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑首先对全部k个自变量,分别对因变量Y建立一元回归方程,并分别计算这k个一元回归方程的k个回归系数F检验值,记为,选其最大的记为 = max,若有 Fin,则首先将X1
12、引入回归方程,不失一般性,设Xi就是X1。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑接着考虑X1分别与X2,X3,.,Xk与因变量Y二元回归方程,对于这k1个回归方程中X2,.,Xk的回归系数进行F检验,计算得的F值,并选其最大的F值,若Fin,则接着就将Xj引入回归方程,不失一般性,设Xj就是X2。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸
13、酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑对已经引入回归方程的变量X1和X2,如同前面的方法做下去,直至所有末被引入方程的变量的F值均小于Fin时为止。这时的回归方程就是最终选定的回归方程。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑显然,这种增加法有一定的缺点,主要是,它不能反映后来变化的情况。因为对于某个自变量,它可能开始是显著的,即将其引入到回归方程,但是,随着以后其他自变量的引入,它也可能又变为不显著的了,但是,也并没有将其及时从回
14、归方程中剔除掉。也就是增加变量法,只考虑引入而不考虑剔除。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑2. 变量减少法SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑与变量增加法相反,变量减少法是首先建立全部自变量X1,X2,.,Xk对因变变量Y的回归方程,然后对k个回归系数进行F检验,记求得的F值为,
15、选其最小的记为=min,若有Fout,则可以考虑将自变量Xi从回归方程中剔除掉,不妨设Xi就取为X1。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑再对X2,X3,.,Xk对因变量Y建立的回归方程中重复上述过程,取最小的F值为,若有Fout,则将Xj也从回归方程中剔除掉。不妨设Xj就是X2。重复前面的做法,直至在回归方程中的自变量F检验值均大于Fout,即没有变量可剔除为止。这时的回归方程就是最终的回归方程。SAS讲义第三十三课逐步回归分析逐步线性
16、回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑这种减少法也有一个明显的缺点,就是一开始把全部变量都引入回归方程,这样计算量比较大。若对一些不重要的变量,一开始就不引入,这样就可以减少一些计算。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑3. 变量增减法SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴
17、恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑前面的二种方法各有其特点,若自变量X1,X2,.,Xk 完全是独立的,则可结合这二种方法,但是,在实际的数据中,自变量X1,X2,.,Xk之间往往并不是独立的,而是有一定的相关性存在的,这就会使得随着回归方程中变量的增加和减少,某些自变量对回归方程的贡献也会发生变化。因此一种很自然的想法是将前二种方法综合起来,也就是对每一个自变量,随着其对回归方程贡献的变化,它随时可能被引入回归方程或被剔除出去,最终的回归模型是在回归方程中的自变量均为显著的,不在回归方程中的自变量均不显著。SAS讲义第三十
18、三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑三、 引入变量和剔除变量的依据SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑如果在某一步时,已有个变量被引入到回归方程中,不妨设为,即已得回归方程SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击
19、今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑(33.1)并且有平方和分解式SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑(33.2)显然,回归平方和及残差平方和均与引入的变量相关。为了使其意义更清楚起见,将其分别设为RSS()及ESS()。下面我们来考虑,又有一个变量(lik)被引入回归方程中,这时对于新的回归方程所对应的平方和分解式为SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼
20、腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑TSS = RSS(,)+ ESS(, )(33.3)当变量Xi引入后,回归平方和从RSS()增加到RSS(,),而相应的残差平方和却从ESS()降到ESS(, ),并有SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑 RSS( , )-RSS() = ESS()-ESS( , )(33.4)记,它反映了由于引入后,对回归平方和的贡献,也等价于引入后
21、残差平方和所减少的量,称其为对因变量的方差贡献,故考虑检验统计量SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑 (33.5)其中为样本量,是已引入回归方程的变量个数,这时若有,则可以考虑将自变量引入回归方程,否则不能引入。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑实际上大于Fin的变量开始时可能同时
22、有几个,那么是否将它们都全部引入呢?实际编程序时并不是一起全部引入,而是选其最大的一个引入回归方程。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑关于剔除变量,如果已有个变量被引入回归方程,不失一般性,设其为,所对应的平方和分解公式为:SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑(33.6)其中为了研
23、究每个变量在回归方程中的作用,我们来考虑分别删掉Xi (i=1,2,.,l后相应的平方和分解公式为:SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑(33.7)这时,回归平方和从降为,同时残差也发生相应的变化。残差平方和从增加到,对回归平方和的贡献,也等价于删除后残差平方和所增加的量,同理可表示为:SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧
24、谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑(33.8)与前同理,我们来构造检验统计量SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳务坠然蕴恼腮屯险骇仟扛擞哆埋捐古勺衔赋屎箔边击今术踊式靶妒贷啸寸酱划司涧谰惫福焊劫匪寅土腔介斥立凹建炔堵骑伊虹辑(33.9)显然,这时Fi越小,则说明在回归方程中起的作用(对回归方程的贡献)越小,也就是若有,则可以考虑将自变量从回归方程中剔除掉,我们在编程序时,每次只剔除一个,因此,我们每次选择最小的来与进行比较。若有则可以不考虑剔除,而开始考虑引入。SAS讲义第三十三课逐步回归分析逐步线性回归_使用stepwise劈日刽姚教炉椒壳
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 讲义 第三 十三 逐步回归 分析
链接地址:https://www.31ppt.com/p-4725922.html