Part-4-高等统计与理论课件.ppt
《Part-4-高等统计与理论课件.ppt》由会员分享,可在线阅读,更多相关《Part-4-高等统计与理论课件.ppt(101页珍藏版)》请在三一办公上搜索。
1、Part 4 高等統計與理論,1,Part 4 高等統計與理論1,閱讀範圍,邱皓政著 量化研究與統計分析Chapter 13 線性關係的分析迴歸Chapter 14 項目分析與信度估計 Chapter 15 因素分析陳景堂著 統計分析SPSS for Windows入門與應用 簡單線性迴歸分析模型(Chapter 18)迴歸分析應用(Chapter 19)問卷實例解說與信度分析(Chapter 11)因素分析 (Chapter 24),2,閱讀範圍邱皓政著 量化研究與統計分析2,1. 線性關係的分析:,迴歸 Regression,3,1. 線性關係的分析:迴歸 Regression3,線性關係
2、的分析原理,基本條件: 連續變項之間的關係線性關係 linear relationship ,指兩個變項的關係可以被一條最具代表性的直線來表達之時,所存在的關連情形。 該直線之方程式為Y=bx+a,b為斜率(即y/x,每單位的X變動時,在Y軸上所變動的量) 線性關係可以散佈圖的方式來表現,4,線性關係的分析原理基本條件: 連續變項之間的關係4,線性關係與相關,線性關係的描述與運用相關分析的目的在描述兩個連續變數的線性關係的強度與方向(僅能說明兩變項之間具有一定程度之關聯,但無法知道兩變項之間的因果與先後關係)迴歸基於兩變項之間的線性關係,進一步分析兩變項之間的預測關係的探討與運用(即取用某獨立
3、變數去預測另一個依變數)。 迴歸與相關均以線性關係為基礎,即以兩個連續變項的共變數為基礎,其數學原理相似。相關係數計算之時,同時考慮兩個變項的變異情形,屬於對稱性設計,以X Y表示。但迴歸則由於目的在取用某一變項去預測另一變項的變化情形,X、Y兩個變項各有其角色,在迴歸係數的計算中,X、Y變項為不對稱設計,以X Y或Y X表示。,5,線性關係與相關線性關係的描述與運用5,相關與迴歸分析的圖示,6,相關與迴歸分析的圖示6,簡單線性迴歸模型,簡單線性迴歸模型是假設依變數 Y 之期望值為自變數 X 之線性函數,即所有 Yi 之期望值均落在一直線上,此稱之為迴歸線性假設(The linearity o
4、f regresssion)或迴歸共線假設。,簡單線性迴歸模型,7,簡單線性迴歸模型簡單線性迴歸模型是假設依變數 Y 之期望,迴歸係數,8,迴歸係數將所收集到的資料代入(1)式中,求出截距 a 和斜率,迴歸係數,迴歸方程式Y=b X+a,代入一個X值以預測Y值。b係數:為一未標準化的迴歸係數,其意義為每單位X值的變動時,Y所變動的原始量b係數大小隨著X與Y兩變項的單位使用,而沒有一定的範圍b係數適用於實務工作的預測數值的計算係數:如果將b值乘以X變項的標準差再除以Y變項的標準差,即可去除單位的影響,並控制兩個變項的分散情形,得到新的數值(Beta),為不具備特定單位的標準化迴歸係數,9,迴歸係
5、數迴歸方程式Y=b X+a,代入一個X值以預測Y值。9,迴歸係數,係數:係數也是將X與Y變項所有數值轉換成Z分數(標準常態分配)後,所計算得到的迴歸方程式的斜率,該方程式通過ZX,ZY的零點,因此截距為0,係數具有與相關係數相似的性質,也就是介於-1至+1之間,其絕對值越大者,表示預測能力越強,正負向則代表X與Y變項的關係方向。係數適用於變項解釋力的比較,偏向學術用途,10,迴歸係數係數:係數具有與相關係數相似的性質,也就是介於-,迴歸係數之檢定 (理論的截距和斜率),11,迴歸係數之檢定 (理論的截距和斜率)斜率的檢定1截距的推論檢,變異數拆解與F考驗,令最佳迴歸預測線為,在給定一個 值可以
6、獲得一個預測值,12,變異數拆解與F考驗 令最佳迴歸預測線為在給定一個 值,變異數拆解與F考驗,利用迴歸方程式,依變項Y變異量當中可以被解釋的部分稱為迴歸變異量(SSreg)無法被解釋的部分稱為誤差變異量(SSe),變項Y總變異量(SSt)=迴歸預測值變異量(SSreg)+誤差變異量(SSe),迴歸值離均差(迴歸方程式可以解釋的部份),原始離均差=迴歸值離均差+誤差,誤差(迴歸方程式無法解釋的部份),13,變異數拆解與F考驗 利用迴歸方程式,依變項Y變異量當中可以被,迴歸可解釋變異量比,迴歸可解釋變異量比,又稱為R2(R square),表示使用X去預測Y時的預測解釋力,即Y變項被自變項所解釋
7、的比率。反應了由自變項與依變項所形成的線性迴歸模式的契合度(goodness of fit) 又稱為迴歸模型的決定係數(coefficient of determination),R2開方後可得multiple R,為自變項與依變項的多元相關。R2為0時,表示自變數與依變數之間無線性關係,14,迴歸可解釋變異量比 迴歸可解釋變異量比,又稱為R2(R sq,adjusted R square,以樣本統計量推導出來的R2來評估整體模式的解釋力,並進而推論到母群體時,會有高估的傾向 樣本數越小,越容易高估,解釋力膨脹效果越明顯,樣本數越大,膨脹情形越輕微 校正後R2(adjusted R2),可以減
8、輕因為樣本估計帶來的R2膨脹效果。當樣本數越小,應採用校正後R2。,15,adjusted R square以樣本統計量推導出來的R2,判定簡單線性迴歸模型的適合性,模型適合性的檢定虛無假設:迴歸模型不適合(解釋能力極低或斜率為零 or R2 =0)對立假設:迴歸模型適合(解釋能力高或斜率不為零),1,16,判定簡單線性迴歸模型的適合性判定係數2模型適合性的檢定116,迴歸分析之變異數分析摘要表,17,變異來源平方和自由度均方F-值迴歸效果SSregkMSreg,迴歸分析的基本假設,(一)固定自變項假設(fixed variable)特定自變數的特定數值應可以被重複獲得,然後得以此一特定的Xi
9、代入方程式而得到預測值。(二)線性關係假設(linear relationship)當X與Y的關係被納入研究之後,迴歸分析必須建立在變項之間具有線性關係的假設成立上。(三)常態性假設(normality)迴歸分析中的所有觀察值Y是一個常態分配,即Y來自於一個呈常態分配的母群體。因此經由迴歸方程式所分離的誤差項e,即由特定Xi所預測得到的與實際Yi之間的差距,也應呈常態分配。誤差項e的平均數為0。,18,迴歸分析的基本假設(一)固定自變項假設(fixed vari,迴歸分析的基本假設,(四)誤差獨立性假設(independence)誤差項除了應呈隨機化的常態分配,不同的X所產生的誤差之間應相互獨
10、立,無相關存在,也就是無自我相關(non-autocorrelation)。(五)誤差等分散性假設(homoscedasticity)特定X水準的誤差項,除了應呈隨機化的常態分配,且誤差項之變異量應相等,稱為誤差等分散性 (六)多元共線性假設 自變項間相關程度過高,不但變項之間的概念區隔模糊,難以解釋之外,在數學上會因為自變項間共變過高,造成自變項與依變項共變分析上的扭曲現象,稱為多元共線性(multicollinearnality),19,迴歸分析的基本假設(四)誤差獨立性假設(independen,等分散性假設圖示,誤差等分散性,誤差變異歧異性,變異不變,20,等分散性假設圖示誤差等分散性
11、誤差變異歧異性變異不變變異隨X的,簡單迴歸分析操作程序,輸入資料選取分析迴歸方法線性選擇欲分析的兩個變項(為自變數X,另一個為依變數Y),移至清單中。選擇強迫進入變數法作為變項分析方法進入統計量勾選各種統計量再按繼續進入統計圖勾選各種統計圖再按繼續進入選項勾選各種選項再按繼續按確定執行,21,簡單迴歸分析操作程序輸入資料21,簡單迴歸分析範例,某研究所10名學生修習某門課程之期中考與期末考分數如下表,試問該教授是否可以以期中考成績來預測期末考成績?,簡單迴歸分析範例,22,簡單迴歸分析範例某研究所10名學生修習某門課程之期中考與期末,簡單迴歸分析範例輸出結果(1),敘述統計各變項的敘述統計量各
12、變項之平均數標準差與個數,相關矩陣各變項之間的相關矩陣,期中考與期末考的Pearson相關係數達0.822,達顯著水準又p-value=0.0020.05,Reject H0:B1=0,代表期中考與期末考成績存在線性關係,23,簡單迴歸分析範例輸出結果(1)敘述統計相關矩陣23,簡單迴歸分析範例輸出結果(2),模式摘要自變數(期中考成績)對依變數(期末考成績)的整體解釋力由R平方解釋期中考成績可以解釋依變項(期末考成績) 67.6%的變異。調整後的R平方為63.5%,24,簡單迴歸分析範例輸出結果(2)模式摘要24,簡單迴歸分析範例輸出結果(3),B1, B0與Beta值均達顯著水準,故期中考
13、成績與期末考成績的線性關係存在,25,簡單迴歸分析範例輸出結果(3)B1, B0與Beta值均達顯,簡單迴歸分析範例輸出結果,【結果說明】以(期中考成績)預測(期末考成績),為一簡單迴歸分析。基於相同數學原理,簡單迴歸與相關分析之結果相同。Pearson相關係數,Multiple R與Beta皆為0.822 ,這些係數之檢定值均相同,達顯著水準。R2的數據則提供迴歸變異數的比重,顯示以期中考成績預測期末考成績具有63.5%的解釋力,F-value = 16.66 ,p=0.004,顯示該解釋力具有統計的意義。結果指出:期中考成績能夠有效預測期末考成績,Beta係數達0.822,(t=4.082
14、,p=0.004),表示期中考成績越高,則期末考成績越好。,26,簡單迴歸分析範例輸出結果【結果說明】26,多元迴歸分析操作程序,輸入資料選取分析迴歸方法線性選擇欲分析的兩個變項(為自變數X,另一個為依變數Y),移至清單中。選擇強迫進入變數法或可選用其他選入模式,如逐步迴歸法作為變項分析方法進入統計量勾選各種統計量再按繼續進入統計圖勾選各種統計圖再按繼續進入選項勾選條件與遺漏值處理模式按繼續按確定執行,27,多元迴歸分析操作程序輸入資料27,多元迴歸分析範例,同前一個期中考預測期末考之應用。今老師若以缺席、期中考與期末考分數、作業成績,進行學生學期總分評分工作,試說明這些變項對於學期總分的影響
15、?,多元迴歸分析範例,28,多元迴歸分析範例同前一個期中考預測期末考之應用。今老師若以缺,多元迴歸分析範例輸出結果(1) (強迫進入法),敘述統計各變項的敘述統計量各變項之平均數標準差與個數,選入/刪除的變數顯示回歸分析的自變項清單計有五個自變項被納入分析,29,多元迴歸分析範例輸出結果(1) (強迫進入法)敘述統計選入/,多元迴歸分析範例輸出結果(1) (強迫進入法),模式摘要顯示自變數對依變數之整體解釋力。所有自變數可以解釋依變數(學期總分)95.4%的變異。調整後的R平方為89.6%。因為小樣本,宜採用調整後的R平方。,30,多元迴歸分析範例輸出結果(1) (強迫進入法)模式摘要30,多
16、元迴歸分析範例輸出結果(1) (強迫進入法),模式顯著性整體檢定用以檢定整體迴歸模式的顯著性。F檢定值為16.522,p-value = .009,顯示上述89.6%的迴歸解釋力。具有統計上的意義。,31,多元迴歸分析範例輸出結果(1) (強迫進入法)模式顯著性整體,多元迴歸分析範例輸出結果(1) (強迫進入法),係數估計各變項B,Beta值及顯著性檢定。僅缺席次數之B值=-0.610,達顯著(t=-3.649,p=0.022) 。說明缺席次數為影響學期總分的顯著變數,且次數越多,學期總分越低,32,多元迴歸分析範例輸出結果(1) (強迫進入法)係數估計32,多元迴歸分析範例輸出結果(1) (
17、強迫進入法),共線性檢驗特徵值越小,條件指標越大,顯示模式共線性明顯。偏高的變異比例指出,Homework (0.76), Midexam (0.80)與 Finexam (0.85)之間具有明顯共線性。,33,多元迴歸分析範例輸出結果(1) (強迫進入法) 共線性檢驗3,34,34,多元迴歸分析範例輸出結果(1) (強迫進入法),殘差分析用以檢定極端值的存在,以及是否違反常態性假設。殘差的值為觀察值與預測值的差,殘差越大,表誤差越大。標準化後之殘差絕對值若大於1.96,代表偏離值。結果顯示無偏離值,但因樣本太少,殘差非呈現常態分配。,35,多元迴歸分析範例輸出結果(1) (強迫進入法)殘差分
18、析35,多元迴歸分析範例輸出結果(2)(逐步迴歸法),選入/刪除的變數顯示(逐步迴歸法)的自變項清單,其選擇之準則為: (F-選入的機率 = .100)。總計有二個變項,分兩個步驟(模式)被選入迴歸方程式中。,模式1:僅期末考成績被選入模式中,模式2:再加入缺席次數變項故有缺席次數與期末考成績兩變項被選入模式中,36,多元迴歸分析範例輸出結果(2)(逐步迴歸法)選入/刪除的變數,多元迴歸分析範例輸出結果(2)(逐步迴歸法),模式摘要模式整體解釋力各為0.680與.868。其中.868(=.680+.218)為累積解釋量。,兩步驟下,個別自變項可以解釋之變異量為.680與.218。均達顯著水準,
19、因此被選入。,37,多元迴歸分析範例輸出結果(2)(逐步迴歸法)模式摘要兩步驟下,多元迴歸分析範例輸出結果(2)(逐步迴歸法),對於模式一之R平方(.680),F檢定值為16.997,p-value= .003對於模式二之R平方(.868),F檢定值為30.707,p-value= .000,均達顯著,顯示上述迴歸效果,具有統計上的意義。,38,多元迴歸分析範例輸出結果(2)(逐步迴歸法)對於模式一之R平,逐步迴歸法過程說明,39,加入ABSENT後,模式仍達顯著性逐步迴歸法過程說明39,多元迴歸分析範例輸出結果(2)(逐步迴歸法),逐步係數估計模式一顯示首先進入的自變數為(期末考成績),Be
20、ta值=.825,t 檢定達顯著。,逐步係數估計模式二再加入一個新的預測變數(缺席次數),其Beta值=-.510,而(期末考成績)之Beta值則降為.618,表示經過排除共變程度後之淨預測力,t 檢定亦達到顯著水準。,40,多元迴歸分析範例輸出結果(2)(逐步迴歸法) 逐步係數估計逐,路徑分析(PATH ANALYSIS),路徑分析由一系列的迴歸分析所組成,除了借用迴歸方程式的原理,並透過假設性的架構,將不同的方程式加以組合,形成結構化的模式。 路徑分析的基本程序是建立一套假設性的相關/因果關係模式,模型中存在因果關係,利用觀察到的資料與理論數值的比對,分析者可以評估假設出來的路徑模式是否能
21、夠有效解釋觀察到的資料,如果差異過大,假設模型也就被推翻如果模型沒有被推翻,路徑模式所假設的各種關係也就自動成立。其虛無假設與對立假設如下:,H0: 觀察數據=理論模式H1: 觀察數據理論模式,41,路徑分析(PATH ANALYSIS)路徑分析由一系列的迴歸,路徑分析的各種變項關係,42,路徑分析的各種變項關係 42,範例說明,假設三:自我效能感與社會期待具有相關,假設二:自我效能感、社會期待與成就動機影響學業表現此假設為多元回歸假設,其方程式如下:,假設一:自我效能感與社會期待影響個人成就動機此假設為多元回歸假設,其方程式如下:,這兩個方程式構成套結構化方程式,即路徑模式,43,範例說明假
22、設三:自我效能感與社會期待具有相關假設二:自我效能,路徑分析(Path Analysis)之路徑模式圖,44,路徑分析(Path Analysis)之路徑模式圖44,路徑分析的基本概念,由變項間之關係,可以由結構之方式呈現每個獨立之迴歸方程式(迴歸模式)。而每個迴歸模式,其自變數對於依變數之解釋能力,可以由R2與F檢定值來表示。每個箭頭可以獲自於迴歸係數,迴歸係數會出現在箭頭兩側,加星號代表不同顯著水準下係數達到顯著。參數估計直接效果(direct effect) :箭頭的迴歸係數若達到顯著,代表因果變項間具有直接效果。間接效果(indirect effect) :兩變項間,具有一個或多個中介
23、變項(mediated variable),而變項與變項之間之直接效果 均顯著,代表因果變項間具有間接效果。整體效果(total effect) :直接效果與間接效果知總合結果,45,路徑分析的基本概念由變項間之關係,可以由結構之方式呈現每個獨,路徑分析各項效果分解說明,46,路徑分析各項效果分解說明 46,自我效能感對於成就動機與學業表現均有直接效果,路徑係數分別為0.63(p0.001)與0.29(p0.01),成就動機對於學業表現亦有直接效果,路徑係數分別為0.21(p0.01),因此,自我效能感對於學業表現,除了具有直接效果外,尚具有一由成就動機所中介的間接效果,間接效果的強度=兩個直
24、接效果的乘積(0.63*0.21=0.13),47,自我效能感對於成就動機與學業表現均有直接效果,路徑係數分別為,自我效能感、社會期待與成就動機影響學業表現此假設為多元回歸假設,其方程式如下:,48,自我效能感、社會期待與成就動機影響學業表現48,上機練習,1 .簡單迴歸分析模型 (陳景堂著 課本第十八、第十九章) 【問題1】第十九章課本作業第二題 (see p.19-50p.19-51),49,上機練習1 .簡單迴歸分析模型 49,2.項目分析與信度估計,Item Analysis and Reliability Estimation,50,2.項目分析與信度估計Item Analysis
25、and R,心理測驗的量化分析,預試分析(pre-test)目的在確認量表題目的堪用程度(適切性評估)最重要的工作為項目分析,並進行試探性的信度分析,以作為題目改善的依據信效度檢驗提供各項客觀指標,作為測驗與量表良窳程度的具體證據。,51,心理測驗的量化分析預試分析(pre-test)51,項目分析的策略,遺漏值的數量評估法檢驗受測者是否抗拒或難以回答某一個題目,導致遺漏情形的發生。過多的遺漏情形表示該題目不宜採用。描述統計評估法利用各題目的描述統計量來診斷題目的優劣。如題目平均數評估法:各題目之平均數應趨於中間值,過於極端值平均數代表偏態或不良試題,無法反應題目之集中趨勢。題目變異數評估法:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Part 高等 统计 理论 课件
链接地址:https://www.31ppt.com/p-1286916.html