第十四部分复相关与复回归分析.ppt
1,第十四章 複相關與複迴歸分析,陳順宇 教授成功大學統計系,2,第十二章兩因子變異數分析是討論 兩因一果 基本上兩個因是分類的離散型變數,上一章簡單線性迴歸是探討 一因一果(都是計量的連續型變數),很自然地,也會想到連續型的多因單果問題。,3,變異數分析與迴歸分析,都是討論因果關係,相同的是”果”都是連續型的計量資料 不同的是變異數分析”因”是離散型資料,但迴歸所談的”因”是連續型資料,4,因果關係列表,5,14.1複相關係數,簡單相關係數是討論一個準則變數與 一個預測變數之間的關聯,,6,複相關,但如果預測變數有好幾個變數時,如何量測準則變數與這組預測變數之間的關聯性有多高呢?當預測變數有多個時,量測準則變數y與預測變數x1,.,xp之間的相關稱為複相關,7,例14.1、想了解大學入學考試的數學成績(x1)與英文成績(x2)對大一微積分成績(y)的影響有多高,8,第一種想法:先計算相關再求平均,x1,y的相關係數r1=0.7611 x2,y的相關係數r2=0.5661 再算此兩相關係數的平均值為0.6636,9,第二種想法是:先求平均再計算相關,10,入學考試英數與大一微積分成績,11,大學入學考試英數平均成績與 大一微積分成績的相關係數為 r=0.7801,12,一般的加權平均,13,15.2複迴歸分析簡介,複迴歸分析是探討變數之間的關係式,我們將變數分成兩類,一類是自變數 一類是應變數複迴歸是探討自變數有兩個或以上時,自變數如何影響應變數的問題,14,15,複迴歸模式,16,最小平方法,17,正規方程式,18,迴歸式公式,19,14.3各種方法計算複迴歸的係數,介紹四種方法求迴歸係數bi的估計值。,20,表14.3 15名學生成績八行合計,21,1.解正規方程式,22,迴歸式,23,以公式求bi估計,24,25,3.以電腦軟體,26,表14.4 大一微積分成績對聯考數學、英文成績複迴歸擬合值與殘差值,27,檢定,28,29,在ANOVA表中P值=0.0022,表示入學考試數學英文成績對微積分 有顯著影響,這是說這兩科成績中 至少有一科對微積分有影響,但並不表示這兩科都對微積分有影響,30,檢定,31,32,參數估計表中P值=0.0068 0.05也就是既使已有英文成績,數學成績仍對微積分有影響,33,檢定,34,35,P 值=0.1822,檢定是不顯著的,它的意思是如果模式中 已有入學考試數學成績,就不需要再用到英文成績了但並不表示英文成績與微積分成績無關,事實上他們之間的相關係數是0.5661,36,判定係數,37,入學考試成績(數學、英文)與微積分的複相關係數,38,例14.2、房子坪數受收入,人口數與家長教育程度的影響,39,40,(a)檢定全部三個自變數是否對y 有預測能力?即檢定,41,表示這三個自變數組合對y預測有貢獻,但並不表示每一個自變數都有預測能力,42,擬合值與殘差值,43,44,45,y對x1,x2的迴歸式,46,14.4 複迴歸預測,47,例14.3、(14.2續),試求收入103萬、人口數3人、大學畢業的家庭之房子坪數y95%信賴區間與預測區間?,48,信賴區間與預測區間,49,14.5多項式迴歸,50,例14.4、速度x與耗油量y的關係,51,圖14.1 汽車耗油量y對車速x的散佈圖,52,線性迴歸,53,54,由 P值=0.1826或 由=0.0870 都顯示線性迴歸不佳,55,圖14.2 汽車耗油量y對車速x的線性迴歸殘差圖,56,二次迴歸,57,圖14.3 汽車耗油量y 對車速x的二次迴歸式殘差圖,58,第十四章 摘要,59,1.,了解複相關係數的意義是 求兩組變數之間的(線性)相關性,其中一組只有一個變數,而另一組有多個變數,60,2.,學習以最小平方法 求複迴歸係數的參數估計,61,3.介紹求解迴歸式的各種方法,包括,62,4.,63,5.,64,6.,知道如何由複迴歸式做預測,65,7.,學習多項式迴歸的使用,並了解多項式次數愈高,則擬合程度愈好(愈大),但付出的代價是模式愈複雜,且解釋愈困難,