品质统计原理-统计估计.docx
《品质统计原理-统计估计.docx》由会员分享,可在线阅读,更多相关《品质统计原理-统计估计.docx(38页珍藏版)》请在三一办公上搜索。
1、授 課 目 錄 第1章 導 論第2章 統計資料的整理與描述第3章 機率導論第4章 常用的機率分佈與統計分佈第5章 描樣方法與描樣分佈第6章 統計估計第7章 統計檢定第8章 變異數分析第9章 相關分析與迴歸模式第10章 無母數統計檢定第11章 類別資料分析-列聯表與卡方檢定第六章 統計估計母體樣本分佈、參數統計量隨機抽取推 論檢定計算描述當獲得母體的樣本資料時,可由各種機率分佈當中,選擇出最接近該母體的機率分佈,續之即估計該分佈之參數值,使樣本資料與母體參數有最佳的推論與檢定能力。然即使隨機變數的機率分佈及其參數值已知,仍無法準確的預測某特定事件一定或不一定發生,而只能預測此事件發生之機率為若干
2、。此不確定性發生的原因主要是因為自然現象有固有的隨機性(Inherent Randomness)。但不確定性的其他因素則可能包括分佈模式選擇的不適切,或參數推定不準確所致。雖然參數推定值的準確性可因樣本數的增加而提高。但固有的變異性確可能因為樣本數增加而益形顯著。統計估計過程是由母體中抽取出數樣本,藉機率原理找出適當的樣本統計量,再以此樣本統計量推估母體參數。統計估計方法,一般分為點估計與區間估計兩種。6.1 點估計(Point Estimation) 假設隨機變數X的母體機率密度函數f(x|q),其中q為未知的參數。為估計此未知的參數,則由母體中抽取出數樣本,得到觀測值為x1, x2,xn。
3、 利用點估計方法求出一估計式(Estimator),以表示。再將觀測值為x1, x2,xn代入估計式中得到一數值,此數值稱之為參數q的估計值(Estimate)。 常用方法:(1) 最大概似法,(2) 動差法。母體f(x|q)觀測值為x1, x2,xn估計式 參數q的估計值6.2.1 最大概似法(Maximum Likelihood Method) 由Fisher (1912)提出。假設隨機變數X的母體機率密度函數f(x|q),其中q為未知的參數,為估計此未知的參數,則由母體中抽取出數樣本,得到觀測值為x1, x2,xn。則概似函數定義為L(x1, x2,xn;q) = f(x1,q)f(x2
4、,q)f(xn,q)(6.1) 使概似函數L(x1, x2,xn;q)值為最大,則能求出估計式,稱此為最大概似估計式(MLE, Maximum Likelihood Method)範例、某公司新推出光碟燒錄機,其使用壽命服從指數分佈f(x) = (1/q)e-x/q。為估計參數q以了解平均使用壽命,隨機抽取出11台樣本做測試,測得其壽命結果如下:8,10,13,14,19,21,27,28,34,41,52 (百小時)。試以最大概似法估計q值。SOL:L(x1, x2,xn;q) = f(x1, q)f(x2, q)f(xn, q)ln L(x1, x2,xn;q)= -n ln q -(1/
5、q)ni =1 xid (ln L)/dq = -n / q + (1/q2)ni =1 xi = 0Estimator(估計式) =ni =1 xi /n= (8+10+13+14+19+21+27+28+34+41+52)/11= 267/11母體f(x) =(1/q)e-x/q觀測值為8,10,13,14,19,21,27,28,34,41,52估計式 =ni =1 xi /n參數q的估計值 = 267/11範例、假設隨機變數XN(m, s2),從其中隨機抽取出一組樣本x1, x2,xn,試以最大概似法估計m, s2值。SOL:L(x1, x2,xn;m, s2) = f(x1, m,
6、s2)f(x2, m, s2)f(xn, m, s2)ln L(x1, x2,xn;m, s2) = ln = -(n/2) ln (2p) - (n/2) ln (s2)- (xi-m)2)/ 2s2範例、台灣的地理位置處於東亞地震帶,地震活動較頻繁。假設台灣發生有感地震的次數服從卜氏分佈Poi(m)。台東氣象站為了要估計此參數m,以了解台灣有感地震情形,於是觀察過去一年來的每月資料,得到台灣有感地震資料如下:9, 7, 12, 14, 3, 11, 7, 10, 4, 6, 8, 10。試以最大概似法求m之估計式,並由樣資料去估計m值。SOL:L(x1, x2,xn;m) = f(x1,
7、m)f(x2, m)f(xn, m)ln L(x1, x2,xn;m)= -nm +ni =1 xi ln m- ln Pni =1 xi!d (ln L)/dm = -n + (ni =1 xi)/ m = 0Estimator(估計式) =ni =1 xi /n= (9+7+12+14+3+11+7+10+4+6+8+10)/12= 101/12=8.426.2.2 動差法(Moment Method) 由Pearson (1894)提出。假設隨機變數X的k次動差為mk= EXk,則樣本動差定義為即為對k次動差mk點估計。對母體平均值m、變異數s2做點估計一次動差( k=1) 二次動差(k
8、=2) 對常態分配m、s2而言,用動差法估計與用最大概似法估計的結果是一樣的。但對其他分配,其結果有異。範例、假設隨機變數XU(0, q)代表致遠校門口學生等候計程車時間所滿足之分佈,茲從學生等候計程車時間,隨機抽取出5樣本:0.5、1、2、3.5、8 (分鐘),試以動差法估計q值。SOL:均勻分佈以XU(a, b)表示,其期望值與變異數為:Ex= (a+b)/2Varx = (b-a)2/12XU(0, q) Ex = q/2 m = q/2 q = 2m =(2/n) ni =1 xi = 2= 2(0.5+1+2+3.5+8)/5 = 6 (動差法)若用最大概似法估計U(0, q),易得
9、q之最大概似法估計式= max1 i n xi = 0.5、1、2、3.5、8= 86.2 如何評量點估計的優良性同一未知參數的估計式有很多種,何者最佳? 統計學定義三個準則:(1) 不偏 (2) 有效性(3) 最小變異數。定義:不偏估計式(Unbiased Estimator)設未知參數q的估計式為,可視為一隨機變數。因此,隨機變數會服從某一機率分佈,當此分佈的期望值E正好等於未知參數時,即E= q,稱為q的不偏估計式。範例、假設由一個隨機變數XN(m, s2),從其中隨機抽取出5個樣本x1, x2, x3, x4, x5,試下列4個估計式,何者是m的不偏估計式。(1) = x1,(2) =
10、 (x1+x5)/2,(3) = (x1+2x5)/2, (4) = (x1+x2+x3+x4+x5)/5SOL:(1) = Ex1= m(2) = E(x1+x5)/2= m(3) = E(x1+2x5)/2= 3m/2(4) = E(x1+x2+x3+x4+x5)/5= m是m的不偏估計式。範例、假設由一個隨機變數XN(m, s2),從其中隨機抽取出n個樣本,試下列樣本變異數S2是否是母體變異數s2之不偏估計式。SOL:ES2 = Eni =1(xi )2/(n-1)= Eni =1(xi2 n2)/(n-1) =ni =1Exi2- nE/(n-1) = n(m2+ s2)- n(m2+
11、 s2/n)/(n-1) = s2 通常由一個隨機變數XN(m, s2),從其中隨機抽取出n個樣本,下列關係成立,且為不偏估計值。 E= m、E= m1-m2、ES2= s2 E= p、E = p1-p2定義:有效性(Efficiency)設茲有二個不偏估計式,即為與。若VarVarVarVar之變異數最小,故選用來估計m最佳。Excel , p.175 p. 1866.3 區間估計(Interval Estimation)用點估計方法找出q的估計值為時,通常的樣本估計值不一定會準確的落於q上,而是略大於或小於q,即的樣本估計值會落於q附近區間內。將估計結果以區間的形式表示之-區間估計,即此區
12、間包含了真正的參數q。區間估計之程序:母體f(x|q)估計式 區間(L, U)區間(L, U)包含參數q的機率1-a以機率表示:P(L q U) = 1-a其中1-a 為信賴水準(Confidence Level)。a 為顯著水準(Significance Level)。(L, U)為信賴區間(Confidence Interval),即對參數q所做估計的1-a 信賴水準的信賴區間。L為信賴區間下限,U為信賴區間上限。以樣本平均值的95%信賴區間為例,即在100次抽樣中有95次包含母體平均值,亦就是表示會有5次沒有包含母體平均值。a = 5%,P(L q U) = 1-a = 1- 5% =
13、95%。令信賴區間長度 = L - U,在1- a 信賴水準下,區間長度(即誤差是也)愈短,表示此區間估計的精確度愈高。亦即對未知的母體參數q的可能變動範圍較小,其掌握度較高。6.3.1 常態分佈母體平均值m之區間估計母體N(m,s2)為m之最佳估計值m的區間估計由以 為中心往兩邊延伸變異數s2已知變異數s2未知6.3.1.(a) 變異數s2已知假設為由N(m, s2)中隨機抽取n個樣本的樣本平均值。令Za/2代表標準常態分佈下,右邊機率為a/2所對應的Z值;-Za/2代表標準常態分佈下,左邊機率為a/2所對應的Z值。95%a/2 =0.025a/2 =0.025Za/2-Za/21- a =
14、 P(-Za/2 Z Za/2) = P(-Za/2 Za/2) P(-Za/2(s)/(n)1/2 m + Za/2(s)/(n)1/2)母體平均值m的1- a信賴區間為:(-Za/2(s)/(n)1/2, + Za/2(s)/(n)1/2)範例、致遠實習銀行欲知學生的平均一般定期存款金額,以便業務拓展參考。於是隨機抽取49位一般定期存款金額學生,得知此49位學生一般定期存款金額為3萬元。假設學生一般定期存款金額為常態分佈,變異數已知為0.64萬元,試問平均一般定期存款金額的90%、95%與99%之信賴區間?SOL:母體平均值m的1- a信賴區間為(-Za/2(s)/(n)1/2,+ Za/
15、2(s)/(n)1/2)n = 49,= 3,s2= 0.64;90%之信賴區間 a/2 = 0.05(-Z0.05(s)/(n)1/2,+ Z0.05(s)/(n)1/2)= (3 1.645(0.8)/(49)1/2)萬元95%之信賴區間 a/2 = 0.025 (-Z0.025(s)/(n)1/2,+ Z0.025(s)/(n)1/2)= (3 1.96(0.8)/(49)1/2)萬元99%之信賴區間 a/2 = 0.005(-Z0.005(s)/(n)1/2,+ Z0.005(s)/(n)1/2)= (3 2.5758(0.8)/(49)1/2)萬元6.3.1.(b) 變異數s2未知一
16、般情況下,變異數s2常是未知的,則上述之信賴區間便不可使用,須修正如下:當n 夠大(n 30),S2=ni =1 (xi-)2/(n-1) s2 母體平均值m的1- a信賴區間為:(-Za/2(S)/(n)1/2, + Za/2(S)/(n)1/2)當n不大(n 30),= t n-1 母體平均值m的1- a信賴區間為:(-ta/2,n-1(S)/(n)1/2, + ta/2,n-1(S)/(n)1/2)萬一不是常態母體,而且樣本數又小,則須用其他方法,如無母體統計之方法。範例、致遠管理學院欲知學生每天上網平均時間,於是隨機抽取26位學生,得知此26位學生平均每天上網時間80分鐘。樣本標準差為
17、30分鐘。假設學生每天上網平均時間為常態分佈,變異數未知,試問該校學生每天上網平均時間的90%、95%與99%之信賴區間?SOL:母體平均值m的1- a信賴區間為(-ta/2,n-1(S)/(n)1/2, + ta/2,n-1(S)/(n)1/2) n = 26,= 80,S= 30;90%之信賴區間 a/2 = 0.05(-t0.05,25(S)/(n)1/2,+t0.05,25(S)/(n)1/2)= (80 1.708(30)/(26)1/2)分鐘95%之信賴區間 a/2 = 0.025 (-t0.025,25(S)/(n)1/2,+t0.025,25(S)/(n)1/2)= (80 2
18、.06(30)/(26)1/2)分鐘99%之信賴區間 a/2 = 0.005(-t0.005,25(S)/(n)1/2,+t0.005,25(S)/(n)1/2)= (80 2.787(30)/(26)1/2)分鐘6.3.2 常態分佈母體平均值m1-m2之區間估計通常是應用在不同母體間某性質差異之比較,如工管系學生統計學成績的差異,對母體平均值差m1-m2做區間估計,其方法與母體平均值m的區間估計方法相同。6.3.2.(a) 變異數s12, s22已知假設兩樣本平均值與分別來自兩母體N(m1, s12)、N(m2, s22),由上節知-為m1-m2之最佳點估計式,茲對此兩母體平均值差m1-m2
19、進行區間估計,便是以-為中心往兩邊延伸。1- a = P(-Za/2 Z Za/2)= 母體平均值m的1- a信賴區間為:Za/2(s12)/(n1)+(s22)/(n2)1/26.3.2.(b) 變異數s12, s22未知一般情況下,變異數s12, s22常是未知的,則上述之信賴區間便不可使用,須修正如下:當n 夠大,以S12, S22 s12, s22 母體平均值m的1- a信賴區間為:Za/2(S12)/(n1)+(S22)/(n2)1/2當n不大,而s12= s22= s2,採t分配處理之。其中共變異數為s2之估計式。母體平均值m的1- a信賴區間為:範例、某房地產投資公司現有2種土地
20、投資計畫,其5年盈收率平均值為m1, m2。假設投資第1類土地50筆,投資第2類土地75筆,其5年平均盈餘為=120,=110(百萬)。(a) 盈餘的變異數已知,且s12= s22=30,試問m1-m2的90%之信賴區間? (b) 盈餘的變異數未知,但樣本變異數S12=20, S22=25,試問m1-m2的90%之信賴區間? (c) 盈餘的變異數未知,但是s12= s22= s2,且n1=12,n2=10而樣本變異數S12=20,S22=25,試問m1-m2的90%之信賴區間?SOL:(a) s12= s22= 30,-=10,m1-m2的90%之信賴區間為:(b) S12=20,S22=25
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 品质 统计 原理 估计
链接地址:https://www.31ppt.com/p-1688120.html