简单回归模型的基本假设.ppt
《简单回归模型的基本假设.ppt》由会员分享,可在线阅读,更多相关《简单回归模型的基本假设.ppt(98页珍藏版)》请在三一办公上搜索。
1、簡單迴歸模型的基本假設,用最小平方法(OLS-ordinary least square)找到一個迴歸式:,Y,xi,F(Y),Population regression line,我們假設在母體中,對於每一個xi值而言,其相對應的yi值遵循某種機率分配,且期望值為,與x相對應的一組y,其期望值剛好落在一條直線上,我們假設這些分配有相同的變異數2,Page 3,我們對於上面的迴歸模型有以下的假設(限制):linearity依變項Yi與自變項之間的關係為線性:Normality:ei為常態分配(或依變數為一常態分配)eiN or YiNZero conditional mean:對於每個xi,E
2、(ei|Xi)=0 殘差項的平均數為零 Independence of ei and Xi:殘差值與Xi不相關Cov(ei,X)=0 or E(ei,X)=0,簡單迴歸模型的基本假設,Page 4,簡單迴歸模型的基本假設,Homoscedasticity:Var(ei)=2變異數齊一性每組的殘差項的變異數均相等。而每一組的變異數實際上是指X=xi條件下的Y之變異數,因此2也可以表為2Y|X綜合以上:eiN(0,2)YiN(b0+b1Xi,2)No serial correlation:ei彼此不相關 Cov(ei,ej)=0X為一固定變數或事前決定之變數,Y為一隨機變數,Page 5,簡單迴歸
3、模型的基本假設,linearity:假設依變項Yi與自變項之間的關係為線性:,我們假設隨機誤差項ei有下列的性質:Normality:ei為常態分配Zero conditional mean:對於每個xi,E(ei|xi)=0 Independence of ei and xi:殘差值與xi不相關Homoscedasticity:Var(ei)=2No serial correlation:ei彼此不相關,Page 6,Residuals Sum to Zero,兩邊除以n,Page 7,Y,X,F(Y),E(e|xi)=0,given X,the mean of the distributi
4、on of“other factors”is zero無論xi為什麼數值,ei的平均值皆為0,其他因素與X無關,Page 8,殘差值與xi不相關,0,Page 9,殘差值與xi不相關,Page 10,No serial correlation:ei彼此不相關,兩個殘差值不相關表示它們彼此之間為獨立(independent),由於我們抽取的是隨機樣本,因此每一個觀察值之間彼此沒有關連。也就是說,某一戶人家的娛樂支出不會影響另一戶人家的育樂支出。,Page 11,Y,X,F(Y),Estimation of e2,前面我們假設Homoscedasticity:Var(ei)=2,每一個相對應於x值
5、的y不但為常態分配,且有相同的變異數2,2,2,(Xi,Yi)are independently and identically distributed,Y,xi,F(Y),Population regression line,我們假設在母體中,對於每一個xi值而言,其相對應的yi值遵循某種機率分配,且期望值為,Y,X,F(Y),Sample regression line,從樣本中可以推估出0,1的估計值,也可以建構出樣本迴歸線,由於母體參數0,1為未知數,因此母體迴歸線必須透過觀察到的樣本(xi,yi)來推估,由於觀察到樣本點(xi,yi)不會剛好落在母體迴歸線上,因此yi與E(yi|xi
6、)會有所差距。,Page 14,區分母體與樣本迴歸線,由於我們是從樣本中來估計迴歸線,用來估計迴歸線的截距b0及斜率b1 的估計式(estimator)為具有抽樣分配(sampling distribution)的隨機變數。,觀念,母體迴歸線,樣本迴歸線,Page 15,截距與斜率的抽樣分配,我們想進一步知道從樣本中估計的截距b0及斜率b1 是不是能夠正確的反映出母體的參數B0及B1。雖然每一次從樣本中估計出來的迴歸線都不同,但我們如果我們知道估計式的抽樣分配,則可以用統計檢定的方式來對我們的樣本參數進行統計的推估。因此我們第一步需要知道為截距b0及斜率b1 的抽樣分配為何?也就是說他們的期望
7、值及標準差為何?,觀念,Page 16,迴歸的統計檢定,統計檢定包含兩部分:(1)對截距與斜率的檢定(2)迴歸方程式的配適度,區分母體與樣本迴歸線,Page 18,區分母體與樣本迴歸線,因此每一個實際的觀察值可以表為母體迴歸線的函數或是樣本迴歸線的函數,我們經常用可觀察的殘差值ei(residual)來推估未知的i,Page 19,截距與斜率的抽樣分配,其中截距0及斜率1 為參數,xi為已知常數,且,觀念,由於yi為常態分配的線性組合(i為常態分配),故yi亦為一常態分配,Page 20,斜率b1的抽樣分配,b1分配的型態為何?E(b1)=?Var(b1)=?,觀念,=0,由於xi為已知常數,
8、因此b1的分配為常態分配yi的線性組合,故b1為常態分配,Page 21,斜率b1的抽樣分配,E(b1)=?,觀念,Page 22,斜率b1的抽樣分配,觀念,樣本觀察值與平均數之差的總合為零,Page 23,斜率b1的抽樣分配,觀念,等於零,b1為1的不偏估計式unbiased estimator,Page 24,斜率b1的抽樣分配,觀念,常數,Page 25,斜率b1的抽樣分配,觀念,Page 26,斜率b1的抽樣分配,觀念,Page 27,斜率b1的抽樣分配,觀念,從以上的討論得知:,b0的抽樣分配證明略,未知數,Page 28,Estimation of e2,令真正的變異數(true
9、variance)可分別表為2b0及2b1。一般而言,2b0及2b1通常為未知數(因為2未知),必須從樣本中估計求得,以符號S2b0及S2b1來表示估計的變異數。同理,我們以b0及b1來表示b0及b1的真正標準誤差,以Sb0及Sb1來表示估計的標準誤差(estimated standard error)。,觀念,Page 29,Estimation of e2,如何估計2?一個簡單的方法為利用Sum of Square Error(SSE)來估算,Page 30,Estimation of e2,但實際上,因為我們不知道真正的母體迴歸線,所以也就無法知道真正的殘差值ei(更正式的寫法為i)。因
10、此我們必須以估計的殘差值來取代,Page 31,Estimation of e2,在迴歸式中,SSE的自由度為樣本個數減去估計係數的數目,Se為迴歸線的估計標準差(estimated standard error of the regression),代表每一個相對應於x值的Y,分佈於迴歸線上的變異狀況。Se愈小,表示Y的散佈愈集中,Page 32,Estimation of e2,在簡單迴歸中:,Page 33,Estimation of e2,=0,Page 34,Estimation of e2,Page 35,Estimation of e2,Page 36,公式整理,Page 37,
11、Estimation of e2,Page 38,Estimation of e2,Page 39,Estimating standard error of b0 and b1,觀念,截距b0及斜率b1的變異數的公式,Page 40,Estimating standard error of b0 and b1,觀念,由於2未知,Estimated standard error of b1,Estimated standard error of b0,Page 41,Hypothesis Testing in the Linear Regression Model,觀念,若以S2e來推估2,則,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 简单 回归 模型 基本 假设

链接地址:https://www.31ppt.com/p-5341048.html