【大学课件】統計推論與顯著性檢驗.ppt
《【大学课件】統計推論與顯著性檢驗.ppt》由会员分享,可在线阅读,更多相关《【大学课件】統計推論與顯著性檢驗.ppt(110页珍藏版)》请在三一办公上搜索。
1、http:/,社會統計,第六講統計推論與顯著性檢驗,Ming-chi Chen,http:/,Page.2,Hypothesis testing 假設檢定,對於母體參數(parameter)的推估可以透過以下兩種方式:先估計參數的估計值,然後建構出信賴區間。假設檢定:先給予母體未知數一個假設值,再利用樣本或實驗結果來推斷此假設的可信度。,Ming-chi Chen,http:/,Page.3,Hypothesis testing 假設檢定,假設檢定假設:從於一小撮觀察到的樣本中,提出的對於更一個大族群(母體)的某些性質的陳述、臆測、推論。檢定:這種從觀察到的樣本所得出的推論是否合理。,Ming
2、-chi Chen,http:/,Page.4,Hypothesis testing 假設檢定,檢定的假設:“台灣人民的平均教育年數為12年”“人社系男生的統計成績優於女生”“贊成一國兩制的人不會超過百分之五”,觀念,Ming-chi Chen,http:/,Page.5,Hypothesis testing 假設檢定的原理,假設檢定的基本原理:將”實際”觀察到的(observed)與”期望觀察到的”(expected)做比較。所謂”期望”是指在我們對於母體的陳述為真的條件下,我們期望觀察到.,觀念,Ming-chi Chen,http:/,Page.6,Hypothesis testing
3、假設檢定的步驟,(1)將我們對於母體的臆測寫成假設陳述。(2)如果假設為真,則我們期望觀察到世界為(3)檢查我們實際觀察到的世界,與在假設為真的情況下,我們期望觀察到的世界是否吻合。,觀念,Ming-chi Chen,http:/,Page.7,Hypothesis testing 假設檢定,母體參數(parameter)為一個描述母體性質的數量值。假設為關於母體參數有可能的數值的陳述(a statement about the value or set of values that a parameter or group of parameters can take.),觀念,Ming-c
4、hi Chen,http:/,Page.8,The null hypothesis H0 and the alternative hypothesis H1,The null hypothesis(虛無假設)H0 是一組直接被檢定,關於對於母體參數值的假定。通常我們設定這個參數值為無效果。The alternative hypothesis(對立假設)H1或Haspecifies an alternative set of possible values of the population parameter that are not specified in the null hypothe
5、sis.不包含在虛無假設中的母體參數的可能值。The two hypotheses are mutually exclusive.這兩種假設為互斥。,觀念,Ming-chi Chen,http:/,Page.9,假設檢定的基本原理,如果H0為真,那我們看到特定樣本統計量的機率有多少?Exp.如果台灣人平均月收入是3萬塊,那我們有多大機會在社會變遷調查中得到2.6萬的平均月所得?這個偏差很大嗎?利用前面提過的標準化常態分配的特質,或是這一講會說明的t分配特質,我們可以知道得到某個樣本統計量的機會為何。抽樣分配的特質,Ming-chi Chen,http:/,Page.10,The null hy
6、pothesis H0 and the alternative hypothesis H1,Simple hypothesis簡單假設:在統計假設之中只為一個數值之假設,如:,觀念,Composite hypothesis複合假設:在統計假設之中,其假設不只包含一個數值,而是一些數值的集合體,如:,Ming-chi Chen,http:/,Page.11,Null hypothesis about a population proportion,環保局宣稱20%的汽車的排氣設備被動過手腳。欲檢定這個假設,請寫出虛無假設:,例題,虛無假設為對母體比率的一個描述,除非我們有充分的證據顯示虛無假設為
7、偽,我們暫且假設它所描述的母體性質為真。請寫出前例的相對假設:,One-sided alternative hypothesis,Ming-chi Chen,http:/,Page.12,One sided alternative hypothesis,消基會想要知道某廠牌的洗衣粉是否如同其包裝盒上所標示的至少5公斤重,寫出虛無假設及相對假設:,例題,One-sided alternative hypothesis,Ming-chi Chen,http:/,Page.13,Two-sided alternative hypothesis,某公司購買新型的抽水機,想知道與標準型有沒有差異。舊型抽
8、水機每小時可抽5000加侖的水。虛無假設為:,例題,對立假設為:,Two-sided alternative hypothesis,Ming-chi Chen,http:/,Page.14,常用的假設,例題,Ming-chi Chen,http:/,Page.15,Which hypothesis is the null hypothesis?,(1)In many statistical applications,the null hypothesis should correspond to the assumption that no change occurs when some ne
9、w process or technique is tried.新的過程或技術沒有造成任何改變的假設。(如之前的抽水機例子),Ming-chi Chen,http:/,Page.16,Which hypothesis is the null hypothesis?,(2)Some statisticians argue that the null hypothesis should be the hypothesis that the decision maker wants to disprove.希望被決策者否定的假設稱為虛無假設。That is,the null hypothesis s
10、hould specify the values of the population parameter that the researcher thinks does not represent the true value(s)of the parameter;the alternative hypothesis then specifies the values of the parameter that the researcher believes do hold.虛無假設中所假設的母體參數值為研究者認為不對的母體參數值。,Ming-chi Chen,http:/,Page.17,W
11、hich hypothesis is the null hypothesis?,(3)another common practice is to assign no special meaning to either the null or the alternative hypothesis,but to let these hypotheses merely represent two different assumptions about the population parameter.不特別去區分虛無假設及對立假設的意義,讓兩者各自代表母體參數的一個可能值。,Ming-chi Che
12、n,http:/,Page.18,Which hypothesis is the null hypothesis?,消基會接獲很多消費者的抱怨,想調查超市中五磅的碎牛肉是否不夠重量。虛無及對立假設為:,例題,Ming-chi Chen,http:/,Page.19,Which hypothesis is the null hypothesis?,市政府所用的紅綠燈平均壽命為2000小時,一家新的製造商宣稱他們的產品比原來的壽命要長,且價格相同。市府想要測試新燈泡的壽命是否超過2000小時,虛無假設為:,例題,Ming-chi Chen,http:/,Page.20,Which hypothes
13、is is the null hypothesis?,一家公司的產品為30%的消費者所採用(p=.30),公司在某些區域測試新推出的廣告是否增加銷售,其虛無假設為:,例題,Ming-chi Chen,http:/,Page.21,Which hypothesis is the null hypothesis?,汽車車門的油漆平均五年會開始脫落,某科學家宣稱新的油漆壽命比較長,汽車公司想測試新油漆的壽命:,例題,Ming-chi Chen,http:/,Page.22,Consequences of choosing H0 and H1,The null hypothesis has the s
14、tatus of a maintained hypothesis that will not be rejected because it is assumed to be true unless the sample data provide strong contrary evidence.由於我們只有在證據很充分的情況下才能推翻虛無假設,因此虛無假設比對立假設佔據更有利的地位,假設的寫法對於結果有很大影響。,觀念,Ming-chi Chen,http:/,Page.23,Consequences of choosing H0 and H1,衛生署在核准新藥上市中,面臨以下兩個可能的結果:
15、一、新藥對於病患有益。二、新藥對於病患無益處。兩者都可以被選為null hypothesis,觀念,Ming-chi Chen,http:/,Page.24,Consequences of choosing H0 and H1,衛生署選擇以下的方式:H0:新藥對於大眾A沒有益處不應該上市。H1:新藥對於大眾有益處。此時藥廠必須舉證推翻H0,否則衛生署不會核准新藥上市。由於這種假設方式,新藥上市過程十分冗長,但好處為有害藥物要上市十分困難。,觀念,Ming-chi Chen,http:/,Page.25,Consequences of choosing H0 and H1,如果衛生署選擇以下列的
16、方式來核准新藥:H0:新藥對於病患有益處且應上市。H1:新藥對於病患沒有益處不應該上市。此時除非有強而有力的證據顯示藥物無效或有害,否則暫且假定此藥為有益處的。這種方式可以使新藥快速上市,但風險也很高。,觀念,Ming-chi Chen,http:/,Page.26,Consequences of choosing H0 and H1,在假設檢定中,我們能夠計算下列機率:P(theory is true|observed data)即給定目前觀察到的樣本資料,理論為真的條件機率為何?但實際上,我們計算的條件機率為:P(observed data|theory is true)即在假設理論為真的
17、前提下,觀察到目前樣本資料的機率為何?,觀念,Ming-chi Chen,http:/,Page.27,Consequences of choosing H0 and H1,如果理論為真,則樣本資料應比較有可能呈現比較不可能為。若觀察到與理論一致的樣本(較有可能發生的樣本),則暫且假定理論為真。若觀察到樣本在理論為真的假設下不太可能發生,則推翻理論。,觀念,Ming-chi Chen,http:/,Page.28,Decision rules,根據樣本所提供的資訊,我們面臨兩種可能的決定:一、拒絕接受null hypothesis(rejecting H0)二、無法推翻null hypothe
18、sis(not rejecting H0)有時候統計學者會說接受accepted null hypothesis,不過較為正確的說法應該是無法拒絕或無法推翻H0。,觀念,Ming-chi Chen,http:/,Page.29,Decision rules,推翻null hypothesis的決策法則:我們根據檢定統計量(test statistics)來決定是否推翻虛無假設,如樣本平均數、樣本比率、Z 或t值等。Test statistic:a test statistic is a random variable whose value is used to determine wheth
19、er we reject the null hypothesis.,觀念,Ming-chi Chen,http:/,Page.30,Decision rules,Decision rule:The decision rule specifies the set of values of the test statistic for which the null hypothesis H0 is rejected in favor of H1 and the set of values for which H0 is accepted(i.e.,not rejected).假設檢定中的決策法則為
20、決定推翻或無法推翻假設的檢定統計量的範圍值。,觀念,Ming-chi Chen,http:/,Page.31,Rejection Region and Acceptance Region,根據決策法則我們可以將檢定統計量分成窮盡及互斥的兩組數值區域:The rejection region(危險域或拒絕域)of a test,also called the critical region(棄卻域),consists of all values of the test statistic for which H0 is rejected.The acceptance region(接受域)con
21、sists of all values of the test statistic for which H0 is not rejected.,觀念,Ming-chi Chen,http:/,Page.32,Critical Value臨界值,The critical value of the test statistic is the value that separates the critical region from the acceptance region.區分拒絕域及接受域的界線。單邊對立假設(one-sided alternative hypothesis)有一個臨界值;雙邊
22、對立假設有兩個臨界值。,觀念,Ming-chi Chen,http:/,Page.33,Decision rules,統計檢定有點像法院中的陪審團在審理案件(虛無假設受到審判),在樣本資料還沒有充分證據顯示有罪之前,我們暫且假定虛無假設為真。在法院的審判中有兩種可能的錯誤:無罪的人被誤判為有罪,有罪的人被無罪釋放。正如同法院的審判,檢定有兩種犯錯的可能:null hypothesis在正確的情況下被推翻(type I error錯殺無辜)及null hypothesis不正確但沒有被拒絕(type II error縱放壞人)。,觀念,Ming-chi Chen,http:/,Page.34,T
23、ype I and Type II Errors,用樣本資料去推論母體未知參數時,由於抽樣的偏差,可能產生推論的誤謬。,觀念,Ming-chi Chen,http:/,Page.35,Type I and Type II Errors,型I誤差:當H0為真,但檢定結果拒絕H0。型II誤差:當H0不真,但檢定結果不拒絕H0。,觀念,Ming-chi Chen,http:/,Page.36,Level of Significance(risk),顯著水準:type I error發生的最大機率值。The level of significance of a test is the probabil
24、ity that the test statistic falls in the critical region given that H0 is true.The level of significance is denoted by the symbol,觀念,Ming-chi Chen,http:/,Page.37,Probability of a Type II Error(risk),風險:type II error發生的最大機率值。The probability of making a Type II error is the probability that the test s
25、tatistic falls in the acceptance region when the null hypothesis is false,denoted by,觀念,Ming-chi Chen,http:/,Page.38,Example of a Type I Error,USA Today報導在美國非法賭博的金額至少平均每人每年$200,妳覺得這個數字太過於誇張,因此找了n個人的樣本來估計每年非法賭博的平均金額。妳想要檢定的虛無假設為:H0:$200對立假設為H1:$200假設真正的母體平均數為$200,如果妳估計的樣本平均遠低於$200,則妳會推翻正確的假設,而犯下型I誤謬。,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学课件 大学 课件 統計推論與顯著性檢驗

链接地址:https://www.31ppt.com/p-5659217.html