区间估计和假设检验课件.ppt
第四章 区间估计和假设检验目录,区间估计和假设检验4.1 正态总体的均值、方差的区间估计4.2 均值、方差的假设检验4.3 正态性检验4.4 非参数秩和检验4.4.1配对的符号检验4.4.2 成组数据的秩和检验,返回,作业,思考题,1,第四章 区间估计和假设检验目录 区间估计和假设检验返回作业,区间估计和假设检验,利用样本的信息对总体的特征进行统计推断,是统计学要解决的主要问题之一。它通常包括两类方面:一类是进行估计,包括参数估计、分布函数的估计以及密度函数的估计等;另一类是进行检验。在这里,首先利用SAS提供的MEANS、UNIVARIATE和TTEST等过程对应用广泛的正态总体参数进行区间估计和假设检验,其次再来介绍对观测数据的正态性进行检验,最后介绍一些常用的非参数检验方法,本章目录,2,区间估计和假设检验 利用样本的信息对总体的特征进行统计推断,,区间估计和假设检验1 正态总体的均值、方差的区间估计,区间估计是通过构造两个统计量 ,能以 的置信度使总体的参数落入 区间中,即 。其中 称为显著性水平或检验水平,通常取 或 ; 分别称为置信下限和置信上限,本章目录,3,区间估计和假设检验1 正态总体的均值、方差的区间估计 区间,区间估计和假设检验 1 正态总体的均值、方差的区间估计,对于单个子样而言,设 是取自 的一个样本;对两个子样而言,设 , 是分别取自 和 的样本( 分别为二者的样本方差),则有如下结论,本章目录,4,区间估计和假设检验 1 正态总体的均值、方差的区间估计 本,区间估计和假设检验 1 正态总体的均值、方差的区间估计,本章目录,5,区间估计和假设检验 1 正态总体的均值、方差的区间估计,区间估计和假设检验 1 正态总体的均值、方差的区间估计,本章目录,6,区间估计和假设检验 1 正态总体的均值、方差的区间估计,区间估计和假设检验1 正态总体的均值、方差的区间估计,1 正态总体的均值、方差的区间估计注: , , , 分别表示标准正态分布, (自由度为 ),-分布(自由度为 ),分布(自由度为 )的上 分位点。,本章目录,7,区间估计和假设检验1 正态总体的均值、方差的区间估计 1,区间估计和假设检验 1 正态总体的均值、方差的区间估计,例1设某厂一车床生产的钮扣,其直径据经验服从正态 , 。为了判断其均值的置信区间,现抽取容量n=100的子样,其子样均值=26.56,求其均值的95%的置信区间.,本章目录,8,区间估计和假设检验 1 正态总体的均值、方差的区间估计 例,区间估计和假设检验 1 正态总体的均值、方差的区间估计,SAS程序为data val1; xbar=26.56; sigma=5.2;n=100; u=probit(0.975); delta=u*sigma/sqrt(n); lcl=xbar-delta; ucl=xbar+delta;Run;proc print data=val1; var lcl xbar ucl;run;,本章目录,9,区间估计和假设检验 1 正态总体的均值、方差的区间估计 本,区间估计和假设检验 1 正态总体的均值、方差的区间估计,SAS程序为其输出结果为: LCL XBAR UCL 25.5408 26.56 27.5792即总体均值的95%的置信区间为25.5408,27.5792;,本章目录,10,区间估计和假设检验 1 正态总体的均值、方差的区间估计 S,区间估计和假设检验 1 正态总体的均值、方差的区间估计,例2检验某种型号玻璃纸的横向廷伸率。测得的数据如下,现在要检验假设 ,并求出其95%的置信区间,本章目录,11,区间估计和假设检验 1 正态总体的均值、方差的区间估计 例,区间估计和假设检验 1 正态总体的均值、方差的区间估计,SAS程序为:data var22; input x fx; y=x-65;cards;35.5 7 37.5 8 39.5 11 41.5 9 43.5 9 45.5 12 47.5 17 49.5 1451.5 5 53.5 3 55.5 2 57.5 0 59.5 2 61.5 0 63.5 1;proc means data=var22 t prt clm; var y; freq fx;run;,CLM表示要输出95%置信区间,本章目录,12,区间估计和假设检验 1 正态总体的均值、方差的区间估计 C,区间估计和假设检验 1 正态总体的均值、方差的区间估计,输出结果: 分析变量 : Y T- 统计量 Prob|T| 95.0% 置信下界 95.0% 置信上界 - -34.29 .0001 -21.0939999 -18.7860001 -据此则得出结论,该批玻璃纸没有达到横向廷伸率的指标。,本章目录,13,区间估计和假设检验 1 正态总体的均值、方差的区间估计 本,区间估计和假设检验 1 正态总体的均值、方差的区间估计,例3 已知某次试验中测量不同性别的测试者的脂肪含量,问不同性别人的脂肪含量是否相同?(数据见程序),本章目录,14,区间估计和假设检验 1 正态总体的均值、方差的区间估计 例,区间估计和假设检验 1 正态总体的均值、方差的区间估计,SAS程序为:data bodyfat; input sex $ fatpct ; cards;男 13.3 女 22 男 19 女 26 男 20 女 16 男 8 女 12 男 18 女 21.7男 22 女 23.2 男 20 女 21 男 31 女 28 男 21 女 30 男 12 女 23男 16 男 12 男 24Run;PROC TTEST DATA=BODYFAT ; CLASS SEX; VAR FATPCT;RUN;,本章目录,15,区间估计和假设检验 1 正态总体的均值、方差的区间估计 本,区间估计和假设检验 1 正态总体的均值、方差的区间估计,其输出结果如下: T-Tests Variable Method Variances DF t Value Pr |t| fatpct Pooled Equal 21 -1.70 0.1031 fatpct Satterthwaite Unequal 20.5 -1.73 0.0980 Equality of Variances Variable Method Num DF Den DF F Value Pr F fatpct Folded F 12 9 1.29 0.7182,本章目录,16,区间估计和假设检验 1 正态总体的均值、方差的区间估计 本,区间估计和假设检验 1 正态总体的均值、方差的区间估计,其结论为:所测不同性别的人的脂肪含量没有显著差别。,本章目录,17,区间估计和假设检验 1 正态总体的均值、方差的区间估计 其,区间估计和假设检验 1 正态总体的均值、方差的区间估计,例4 假定初生婴儿(男孩)的体重服从正态分布,随机抽取12名新生婴儿,测其体重为3100,2520,3000,3000,3600,3160,3560,3320,2880,2600,3400,2540。试给出新生婴儿体重方差的置信区间(置信度为95% )。,本章目录,18,区间估计和假设检验 1 正态总体的均值、方差的区间估计 例,区间估计和假设检验 1 正态总体的均值、方差的区间估计,例4 SAS程序为data val2; input weight;cards;3100 2520 3000 3000 3600 3160 3560 3320 2880 2600 3400 2540run;proc means data=val2; output out=tval1 css=ss n=n;Run;data tval2; set tval1; df=n-1;xlchi=cinv(0.025,df);xuchi=cinv(0.975,df); lchi=ss/xuchi;uchi=ss/xlchi;Run;proc print data=tval2;var lchi uchi;run;,本章目录,19,区间估计和假设检验 1 正态总体的均值、方差的区间估计 例,区间估计和假设检验1 正态总体的均值、方差的区间估计,输出结果如下: LCHI UCHI 70687.19 406071.51即方差的置信区间为:70687.19, 406071.51,本章目录,20,区间估计和假设检验1 正态总体的均值、方差的区间估计 本章,区间估计和假设检验,假设检验是从样本特征出发去判断关于总体分布的某种“看法”是否成立。 一般步骤为 :,2 均值、方差的假设检验,(1)根据问题提出一个原假设H0和备择假设H1(2)构造一个统计量T,其抽样分布不依赖任何参数(3)计算概率值 (4)判断:若 ,则拒绝原假设H0,否则接受H1。,本章目录,21,区间估计和假设检验假设检验是从样本特征出发去判断关于总体分,区间估计和假设检验 2 均值、方差的假设检验,单正态总体的参数的假设检验,本章目录,22,区间估计和假设检验 2 均值、方差的假设检验 单正态总体的,区间估计和假设检验 2 均值、方差的假设检验,单正态总体的参数的假设检验,本章目录,23,区间估计和假设检验 2 均值、方差的假设检验 单正态总体的,区间估计和假设检验 2 均值、方差的假设检验,两正态总体的参数的假设检验,本章目录,24,区间估计和假设检验 2 均值、方差的假设检验 两正态总体的,区间估计和假设检验 2 均值、方差的假设检验,两正态总体的参数的假设检验,本章目录,25,区间估计和假设检验 2 均值、方差的假设检验 两正态总体的,区间估计和假设检验 2 均值、方差的假设检验,两正态总体的参数的假设检验,本章目录,26,区间估计和假设检验 2 均值、方差的假设检验 两正态总体的,区间估计和假设检验 2 均值、方差的假设检验,两正态总体的参数的假设检验,本章目录,27,区间估计和假设检验 2 均值、方差的假设检验 两正态总体的,区间估计和假设检验 2 均值、方差的假设检验,假设检验与区间估计的关系,本章目录,28,区间估计和假设检验 2 均值、方差的假设检验 假设检验与区,区间估计和假设检验 2 均值、方差的假设检验,例5设某厂一车床生产的钮扣,其直径据经验服从正态 , 。为了判断其均值的置信区间,现抽取容量n=100的子样,其子样均值=26.56,请检验假设是否成立:,本章目录,29,区间估计和假设检验 2 均值、方差的假设检验 例5本章目录,区间估计和假设检验 2 均值、方差的假设检验,例5 SAS程序data val3; xbar=26.56; mu=26; sigma=5.2; n=100; u=sqrt(n)*abs(xbar-mu)/sigma; p=2*(1-probnorm(u);Run;proc print data=val3; var u p; run;,本章目录,30,区间估计和假设检验 2 均值、方差的假设检验 例5,区间估计和假设检验 2 均值、方差的假设检验,结果 U P 1.07692 0.28151表明在0.05显著性水平下接受原假设。,本章目录,31,区间估计和假设检验 2 均值、方差的假设检验 本章目录31,区间估计和假设检验 2 均值、方差的假设检验,例6 方差的假设检验,本章目录,32,区间估计和假设检验 2 均值、方差的假设检验 例6 方差,区间估计和假设检验 2 均值、方差的假设检验,例6 方差的假设检验 这事实上是一个单侧检验问题。因为车床的精度不会自动提高,最多只能保持原来的水平,其备择假设则是车床的精度下降。,本章目录,33,区间估计和假设检验 2 均值、方差的假设检验 例6 方差,区间估计和假设检验 2 均值、方差的假设检验,SAS程序为:data val4; input x fx;cards;10.1 1 10.3 3 10.6 7 11.2 10 11.5 6 11.8 3 12 1run;proc means data=val4; var x; freq fx; output out=tval1 css=ss n=n;Run;data tval2; set tval1; sigma=0.18; df=n-1; chi=ss/sigma; p=1-probchi(chi,df);Run;proc print data=tval2; var chi p;run;,本章目录,34,区间估计和假设检验 2 均值、方差的假设检验 本章目录34,区间估计和假设检验 2 均值、方差的假设检验,结果为: CHI P 44.4552 0.043345 在0.05显著性水平下拒绝原假设,接受备择假设,即认为该车床经过一段时间的使用后,其精度有所下降。,本章目录,35,区间估计和假设检验 2 均值、方差的假设检验 本章目录35,区间估计和假设检验 2 均值、方差的假设检验,例7 成对数据的t检验和区间估计 设某个班级20名学生参加了两次课程的考试(成绩在下面的程序中),现想知道两次考试的难度是否相同 ?,本章目录,36,区间估计和假设检验 2 均值、方差的假设检验 例7 成对数,区间估计和假设检验 2 均值、方差的假设检验,data sta; input student exam1 exam2; scordiff=exam2-exam1;cards; 1 93 98 2 88 74 3 89 67 4 88 92 5 67 83 6 89 90 7 83 74 8 94 97 9 89 96 10 55 81 11 88 83 12 91 9413 85 89 14 70 78 15 90 96 16 90 9317 94 81 18 67 81 19 87 93 20 83 91Run;proc means data=sta t prt clm; var scordiff;run;,本章目录,37,区间估计和假设检验 2 均值、方差的假设检验 data s,区间估计和假设检验 2 均值、方差的假设检验,输出结果如下:MEANS过程中的选择项t prt clm等要求求出t值,概率值及置信上下限,其结果为: 分析变量 : SCORDIFF T- 统计量 Prob|T| 95.0% 置信下界 95.0% 置信上界 1.0394501 0.3116 -2.5846489 7.6846489从而可看出,这两次考试的难度相当,其95%的置信区间为-2.5846489 ,7.6846489,本章目录,38,区间估计和假设检验 2 均值、方差的假设检验 本章目录38,区间估计和假设检验,判断总体的分布是否为正态总体的假设检验称为正态性检验。从上面可以看出,许多统计结论是基于正态总体的,因此如何来判断某样本是否来自正态总体就显得非常重要。目前,正态性检验的方法很多,这里主要介绍SAS中常用的分布拟合优度检验,W检验和偏度峰度检验,Q-Q图检验等方法。,3 正态性检验,本章目录,39,区间估计和假设检验判断总体的分布是否为正态总体的假设检验称,区间估计和假设检验 3 正态性检验,判断总体的分布是否为正态总体的假设检验称为正态性检验。从上面可以看出,许多统计结论是基于正态总体的,因此如何来判断某样本是否来自正态总体就显得非常重要。目前,正态性检验的方法很多,这里主要介绍SAS中常用的分布拟合优度检验,W检验和偏度峰度检验,Q-Q图检验等方法。,本章目录,40,区间估计和假设检验 3 正态性检验 判断总体的分布是否为正,区间估计和假设检验 3 正态性检验,本章目录,41,区间估计和假设检验 3 正态性检验 本章目录41,区间估计和假设检验 3 正态性检验,本章目录,42,区间估计和假设检验 3 正态性检验 本章目录42,区间估计和假设检验 3 正态性检验,本章目录,43,区间估计和假设检验 3 正态性检验 本章目录43,区间估计和假设检验 3 正态性检验,例8已知20名学生的各科平均成绩为: 56,23,59,74,49,43,39,51,37,61,43,51, 61,99,23,56, 49, 49, 75, 20 试检验其正态性,本章目录,44,区间估计和假设检验 3 正态性检验 例8本章目录44,区间估计和假设检验 3 正态性检验,例8 分布拟合优度检验和Q-Q图检验SAS程序为:data score; input x;cards;56 23 59 74 49 43 39 51 37 6143 51 61 99 23 56 49 49 75 20run;proc univariate data=score normal plot; var x; run;,正态性检验,Q-Q图检验,本章目录,45,区间估计和假设检验 3 正态性检验 例8 分布拟合优度检验,区间估计和假设检验 3 正态性检验,例8 分布拟合优度检验和Q-Q图检验程序中NORMAL要求进行正态性检验,其结果输出为: W:Normal 0.94955 PrW 0.3720表明这些数据是来自正态性总体。,本章目录,46,区间估计和假设检验 3 正态性检验 例8 分布拟合优度检验,区间估计和假设检验 3 正态性检验,例8 分布拟合优度检验和Q-Q图检验,本章目录,47,区间估计和假设检验 3 正态性检验 例8 分布拟合优度检验,区间估计和假设检验 3 正态性检验,例8 偏度、峰度检验,data score;input x;cards;56 23 59 74 49 43 39 51 37 6143 51 61 99 23 56 49 49 75 20;proc univariate data=score;var x; output out=score1 skewness=skew kurtosis=kurt n=n; Run;,data score2; set score1; uskew=2*sqrt(6/n); lskew=-uskew; tkurt=2*sqrt(24/n); lkurt=-tkurt; ukurt=tkurt;Run;proc print data=score2; var skew lskew uskew kurt lkurt ukurt;run;,本章目录,48,区间估计和假设检验 3 正态性检验 例8 偏度、峰度检验d,区间估计和假设检验 3 正态性检验,例8 偏度、峰度检验其输出为: SKEW LSKEW USKEW KURT LKURT UKURT0.54497 -1.09545 1.09545 1.17388 -2.19089 2.19089 可以看出偏度值为0.54497,落在检验区间-1.09545 ,1.09545中,而峰度值为 1.17388,亦落在其检验区间-2.19089 ,2.19089内,故认为该数据来自正态总体。,本章目录,49,区间估计和假设检验 3 正态性检验 例8 偏度、峰度检验本,区间估计和假设检验 3 正态性检验,例8 图形法(概率密度函数法) SAS程序如下:data score;input x;cards;56 23 59 74 49 43 39 51 37 6143 51 61 99 23 56 49 49 75 20;proc capability data=score graphics ;histogram x/normal;run;,本章目录,50,区间估计和假设检验 3 正态性检验 例8 图形法(概率密度,区间估计和假设检验 3 正态性检验,例8 图形法(概率密度函数法),本章目录,51,区间估计和假设检验 3 正态性检验 例8 图形法(概率密度,区间估计和假设检验 3 正态性检验,例8 图形法(概率密度函数法) 累计分布的拟合优度统计量。 Goodness-of-Fit Tests for Normal Distribution Test -Statistic- DF -p Value- Kolmogorov-Smirnov D 0.14577970 Pr D 0.150 Cramer-von Mises W-Sq 0.06025691 Pr W-Sq 0.250 Anderson-Darling A-Sq 0.39276386 Pr A-Sq 0.250 Chi-Square Chi-Sq 3.00661099 3 Pr Chi-Sq 0.391从这里亦可判断该数据是来自正态总体。,本章目录,52,区间估计和假设检验 3 正态性检验 例8 图形法(概率密度,区间估计和假设检验 3 正态性检验,例8 图形法(拟合分布法)data score; input x;cards;56 23 59 74 49 43 39 51 37 61 43 51 61 99 23 56 49 49 75 20run;proc capability data=score graphics ; cdfplot x/normal;run;,本章目录,53,区间估计和假设检验 3 正态性检验 例8 图形法(拟合分布,区间估计和假设检验 3 正态性检验,本章目录,54,区间估计和假设检验 3 正态性检验 本章目录54,区间估计和假设检验,在前面的假设检验中,总是假定样本来自正态分布(即某一已知分布),且总是对正态分布的参数进行假设检验,故称此法为参数假设检验。然而在实际中,总体的分布往往很难确定,故用参数检验有其局限性,因而产生另一类不依赖于分布的假设检验方法,即非参数假设检验,其检验也不是对参数进行比较,而是用于分布间的比较。非参数检验方法很多,这里只讲用于配对资料的符号检验和用于两个样本间比较的Wilcoxon秩和检验(多样本间比较则为Kruskal-Wallis秩和检验),4 非参数秩和检验,本章目录,55,区间估计和假设检验 在前面的假设检验中,总是假定样本来自,区间估计和假设检验 4 非参数秩和检验,4.1配对的符号检验 符号检验是根据配对资料差值的正、负符号来进行假设检验的一种方法,它不依赖总体分布,,适应面广,本章目录,56,区间估计和假设检验 4 非参数秩和检验 4.1配对的符号检,区间估计和假设检验 4 非参数秩和检验,4.1配对的符号检验 例8(配对符号检验): 用二乙胺化学法与气相色谱法测定车间空气中CS2的含量(mg/m3),其测量值见表,问两法所得结果有无差别? 两种方法测定车间空气中CS2的含量(mg/m3)样品号 1 2 3 4 5 6 7 8 9 10化学法50.7 3.3 28.8 46.2 1.2 25.5 2.9 5.4 3.8 1.0色谱法60.0 3.3 30.0 43.2 2.2 27.5 4.9 5.0 3.2 4.0,本章目录,57,区间估计和假设检验 4 非参数秩和检验 4.1配对的符号检,区间估计和假设检验 4 非参数秩和检验,4.1配对的符号检验 例8(配对符号检验)data cs2; input x y; diff=x-y;cards;50.7 60.0 3.33.3 28.830.0 46.2 43.2 1.22.225.5 27.5 2.94.9 5.4 5.0 3.83.2 1.04.0;proc univariate data=cs2 normal; var diff;run;,本章目录,58,区间估计和假设检验 4 非参数秩和检验 4.1配对的符号检,区间估计和假设检验 4 非参数秩和检验,4.1配对的符号检验 例8(配对符号检验)输出结果为: M(Sign) -1.5 Pr=|M| 0.5078W:Normal 0.854817 PrW 0.0638从正态性检验的结果来看,在0.1显著性水平下拒绝这两种方法所测数据的差值服从正态分布(0.06380.1),故可采用非参数的符号检验和符号秩和检验. 从符号检验M=-1.5, P=0.5078来看,在0.05显著性水平下不能认为这两种方法的测结果有差异,本章目录,59,区间估计和假设检验 4 非参数秩和检验 4.1配对的符号检,区间估计和假设检验 4 非参数秩和检验,4.2 成组数据的秩和检验 秩是样本由小到大排列的位次,将所有秩加起来,即得到秩和,Wilcoxon1945年据此提出了两样本秩和检验法,虽然此方法只利用了样本的大小次序而忽略具体数值,但其效果还是很好的(这一点已为人们所证明)。当然该法最大的好处是不受未知分布的影响,即所谓的“分布自由”。,本章目录,60,区间估计和假设检验 4 非参数秩和检验 4.2 成组数据的,区间估计和假设检验 4 非参数秩和检验,4.2 成组数据的秩和检验 例9(成组数据的秩和检验) 实验室用局部温热治疗小鼠移植性肿瘤的疗效,以生存日数为观察指标,实验结果见表,问这两组小鼠生存日数有无差别? 小鼠发癌后生存日数实验组 10 12 15 15 16 17 18 20 23 90*对照组 2 3 4 5 6 7 8 9 10 11 12 13,本章目录,61,区间估计和假设检验 4 非参数秩和检验 4.2 成组数据的,区间估计和假设检验 4 非参数秩和检验,4.2 成组数据的秩和检验 此资料有截尾数据(表中90*),或观测指标不服从正态分布时,要检验此两组数据间是否具差别,宜用非参数秩和法进行检验.,本章目录,62,区间估计和假设检验 4 非参数秩和检验 4.2 成组数据的,区间估计和假设检验 4 非参数秩和检验,4.2 成组数据的秩和检验 data numdate;do I=1 to 2; input num; do j=1 to num; input y; output; end;end;cards;1010 12 15 15 16 17 18 20 23 90122 3 4 5 6 7 8 9 10 11 12 13 run; proc npar1way data=numdate wilcoxon; class I; var y; run;,本章目录,63,区间估计和假设检验 4 非参数秩和检验 4.2 成组数据的,区间估计和假设检验 4 非参数秩和检验,4.2 成组数据的秩和检验 输出结果如下: N P A R 1 W A Y P R O C E D U R E Wilcoxon Scores (Rank Sums) for Variable Y Classified by Variable I Sum of Expected Std Dev Mean I N Scores Under H0 Under H0 Score 1 10 170.0 115.0 15.1529004 17.0000000 2 12 83.0 138.0 15.1529004 6.9166667 Average Scores Were Used for Ties Wilcoxon 2-Sample Test (Normal Approximation) (with Continuity Correction of .5) S = 170.000 Z = 3.59667 Prob |Z| = 0.0003 T-Test Approx. Significance = 0.0017 Kruskal-Wallis Test (Chi-Square Approximation)CHISQ = 13.174 DF = 1 Prob CHISQ = 0.0003结果表明实验组的秩和为170,对照组的秩和为83,在H0下的期望值分别为115和138,标准差为15.1529004和15.1529004。平均秩为17和6.9166667。对较小样本的秩和S=170,其Z = 3.59667, Prob |Z| = 0.0003,说明这两组数据间有差别。,本章目录,返回,64,区间估计和假设检验 4 非参数秩和检验 4.2 成组数据的,