SAS假设检验(公选)ppt课件.pptx

资源ID：1946941 资源大小：3.76MB 全文页数：80页
资源格式： PPTX 下载积分：16金币

快捷下载

会员登录下载

三方登录下载：

下载资源需要16金币

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付方式：
验证码：	换一换

加入VIP免费专享

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

SAS假设检验(公选)ppt课件.pptx

第4章假设检验,4.1参数估计与假设检验的基本概念,4.1.1 参数估计4.1.2 假设检验,4.1.1参数估计,从总体中抽取样本，以样本统计量(即样本数字特征)作为未知总体参数(即总体数字特征)的估计量，并通过对样本观察值分析来估计和推断，即根据样本来推断总体分布的未知参数，称为参数估计（parameter estimation）。参数估计有两种基本形式：点估计和区间估计。,1.点估计点估计是用样本统计量估计总体分布中所含的未知参数。因为样本统计量为数轴上某一点，估计的结果也以一个点的数值表示，所以称为点估计。通常它们是总体的某个特征值，如均值、方差和相关系数等。点估计问题就是要构造一个只依赖于样本的量，作为未知参数或未知参数的函数的估计值。2.区间估计区间估计是通过从总体中抽取的样本，根据一定的正确度与精确度的要求，以一定可靠程度推断总体参数所在的区间范围，作为总体分布的未知参数或参数的函数的真值所在范围的估计。,区间估计是从点估计值和抽样标准误出发，按给定的概率值建立包含待估计参数的区间。其中这个给定的概率值称为置信度或置信水平(confidence level），指总体参数值落在样本统计值某一区内的概率。这个建立起来的包含待估计参数的区间称为置信区间（confidence interval），表示总体参数的可能范围。置信区间是指在某一置信水平下，样本统计值与总体参数值间误差范围。,置信区间,双侧：,置信区间,置信下限,置信上限,置信水平或置信度(称为显著性水平),单侧：,或,置信区间,正态分布（Normal Distribution),实践中，许多频率分布形状如此: 中间高, 两侧低、对称,计算中心,正态分布的实例,如果数据来自正态分布总体，则：68%的值落在距均值1个标准差的范围之内95%的值落在距均值2个标准差的范围之内99%的值落在距均值3个标准差的范围之内,例如：由12岁女孩体重组成一个总体，这个总体服从均值为39公斤，标准差4.5公斤，则： 68%的值落在34.543.5公斤之间 95%的值落在3048公斤之间 99%的值落在25.552.5公斤之间,正态分布描述落入不同范围的概率.例如,近似地有(“3 ”原则):68%的数据落入以均值为中心一倍标准差的范围内;95%的数据落入以均值为中心两倍标准差的范围内；99%的数据落入以均值为中心三倍标准差的范围内；若样本均值的分布为正态的,当构造置信区间时就可用正态分布给定的概率,这一概率对应于置信水平.所以,构造一个95%的置信区间,这个置信区间就有95%的概率包括总体均值.95%就为置信水平.,小概率事件的含义,小概率事件的含义:发生概率一般不超过5的事件，即事件在一次试验中几乎不可能发生,4.1.2假设检验,假设检验是抽样推断中的一项重要内容，是一种基本的统计推断形式，用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先依据原资料对总体的参数或分布作出某种假设，然后再利用样本对总体提供的信息，用适当的统计方法计算出有关检验的统计量，依据一定的概率原则，以较小的风险来对假设作出应该拒绝或不拒绝推断。,对总体参数进行假设检验时，首先要给定一个原假设H0，H0是关于总体参数的表述，与此同时存在一个与H0相对立的备择假设H1，H0与H1有且仅有一个成立；经过一次抽样，若发生了小概率事件（通常把概率小于0.05的事件称为小概率事件），可以依据“小概率事件在一次实验中几乎不可能发生”的理由，怀疑原假设不真，作出拒绝原假设H0，接受H1的决定；反之，若小概率事件没有发生，就没有理由拒绝H0，从而应作出拒绝H1的决定。,1.假设检验的基本思想,根据问题确立原假设H0和备择假设H1；确定一个显著性水平，它是衡量稀有性（小概率事件）的标准，常取为0.05；选定合适的检验用统计量W（通常在原假设中相等成立时，W的分布是已知的），根据W的分布及的值，确定H0的拒绝域。由样本观测值计算出统计量W的观测值W0，如果W0落入H0的拒绝域，则拒绝H0；否则，不能拒绝原假设H0。,2.假设检验的基本步骤,概率p值是SAS系统根据样本分布和样本数据自动计算一个实际的显著性水平，在SAS系统中进行假设检验，p值提供了一个直观的判断依据：当p，说明实际计算的显著性水平比理论的显著性水平更小，小概率事件在一次实验中发生的几率更小（比理论设定的概率还小）。此时在p值的显著性水平条件下，如果还能够观测到小概率事件发生，则说明假设更加不可靠，应拒绝原假设；当p，在p值的显著性水平条件下，如果能够观测到小概率事件发生，则说明假设可能没有任何问题。因为观测一个概率比较大的事件，其发生的可能性本来就比较大，故不能对假设做出否定的判断。,3. 假设检验的数学模型T检验是用于两组数据均数间差异的显著性检验，亦称学生T检验（Students t test），主要用于样本含量较小（例如n30），总体标准差未知的正态分布资料。 T检验是用于小样本（样本容量小于30）的两个平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率，从而判定两个平均数的差异是否显著。,（1）单样本T检验单样本T检验所采用的方法是，抽取一组数据作为一个样本，对样本均数与理论上的总体均数的差别作显著性检验，检验所测得的一组连续资料是否抽样于均数已知的总体。根据大量实验调查的结果或一般规律，可以得到某一事物的平均数，以此作总体均数看待。t统计量的计算公式如下：如果用程序方法作单样本T检验，可在SAS系统中采用MEANS过程，计算出观察与总体均数的差值，再对该差值的均数进行T 检验。,（2）两配对样本的T检验两配对样本T检验包括两种情况，即配对资料差异的显著性检验（配对比较检验）和同一组对象实验前后差异的显著性检验（自身对照比较）。t统计量的计算公式如下：SAS系统中采用MEANS过程，计算出两样本观察的差值（如服药前、后实验数据的差值），再对该差值的均数进行T检验。,（3）两独立样本的T检验两独立样本的t检验是指对两样本均数的差异作显著性检验。作为两样本均数差异比较的两组数据，它是分别取自两个独立样本，没有成对关系，两组的数据个数可以相等，也可以不一样。t统计量的计算公式如下：方差齐时，方差不齐时，方差齐性检验用F检验，F统计量的计算公式如下：,SAS系统中采用TTEST过程，先作方差齐性检验（f检验）。当方差齐性时，f应接近于1，f特大或特小都是极端情况。同时f的分布不依赖未知参数。统计上称它为自由度（n1-1，n2-1）的分布。n1，n2分别对应独立样本的两个样本个数。利用f分布，对统计量f的观测值可以得到它的p值并由此对原假设作出判断。然后根据方差齐（equal）和方差不齐（unequal）输出t值和p值以及基本统计量。,4. TTEST过程T过程是专门进行T检验的SAS过程，它可以做单样本均值的T检验、两配对样本均值的T检验和两独立样本均值的T检验。其语句格式为：PROC TTEST ; CLASS 分组变量名; PAIRED 变量名列表; BY 分组变量名; VAR 分析变量名列表; FREQ 变量名列表; WEIGHT 变量名列表; RUN;,语句说明：（1）PROC TTEST语句后可跟的选项及其表示的含义如表4-1所示。,（2）CLASS语句所指定的分组变量是用来进行组间比较的；（3）PAIRED语句用来指定配对t检验中要进行比较的变量对，其后所带的变量名列表一般形式及其产生的效果如表4-2所示。,（4）BY语句所指定的分组变量是用来将数据分为若干个更小的样本，以便SAS分别在各小样本内进行各自独立的处理；（5）VAR语句引导要检验的所有变量列表，SAS将对VAR语句所引导的所有变量分别进行组间均值比较的t检验；（6）FREQ指定作为频数的变量；（7）WEIGHT指定作为权数的变量。,4.2单样本正态总体的参数估计与假设检验,4.2.1单样本的参数估计4.2.2单样本的假设检验,4.2.1单样本正态总体的参数估计,1. 单样本正态总体均值的置信区间2. 单样本正态总体比例的置信区间3. 单样本正态总体方差的置信区间,1. 单样本正态总体均值的置信区间【例4-1】某小学要对各年级的学生健康状况进行评测，其中一项评测需要对五年级男生的平均体重进行估计，五年级男生体重的总体方差未知，现随机抽取20名男生的体重数据如表4-3所示。假定男生体重数据存放在数据集mylib.boy_w中，重量变量名为weight，求该校五年级男生的平均体重在95%置信水平下的置信区间。,（1）INSIGHT模块求单样本正态总体均值的置信区间，其步骤如下：打开数据集mylib.boy_w。选择菜单“分析”“分布”命令。在“分布”对话框中选择变量weight作为分析变量填入“Y” 框中。单击“输出”按钮，打开输出结果控制对话框，在“描述性统计量”选项中选择“基本置信区间” 。单击“确定”按钮，返回到“分布”对话框，再次单击“确定”按钮，得到置信区间的输出结果如图4-3所示。,图中显示了在95%的置信水平下，分别对均值、标准偏差和方差这3个总体参数进行参数估计的结果。估计值是对总体参数的点估计，置信下限和置信上限是对总体参数的区间估计。因此结果表明，该校五年级男生平均体重在95%置信水平下的置信区间为33.4435kg38.4565kg。此外，在结果输出窗口中，还可以选择“表”菜单重新设置不同的置信水平。,（2）用分析家模块求单样本正态总体均值的置信区间，其步骤如下：在“分析家”模块中打开数据集mylib.boy_w。选择菜单“统计”“假设检验”“均值的单样本t-检验”命令。在“One Sample t-test for a Mean”对话框中，选择变量weight作为分析变量。单击“tests”按钮，在对话框的“Confidence Intervals”选项卡中可以设置置信区间类型和置信水平。单击“OK”按钮，返回到“One Sample t-test for a Mean”对话框，再次单击“OK”按钮，得到置信区间的输出结果如图4-8所示。,结果表明，单样本均值的95%置信区间的下限是33.44，上限是38.46，因此该校五年级男生平均体重在95%置信水平下的置信区间为33.44kg38.46kg。,（3）用TTEST过程步求单样本正态总体均值的置信区间，程序如下：proc ttest data=mylib.boy_w alpha=0.05;/*alpha =0.05用于指定显著性水平为0.05*/var weight;run;,2. 单样本正态总体比例的置信区间【例4-2】某大学要对其1000名在校学生的月支出进行调查，随机抽取16名学生调查后结果如表4-4所示。设月支出数据存放于数据集mylib.outgo中，其中月支出变量名为exp。在95%置信水平下推断该校学生月支出在1000元以上的人占有的比例。,用分析家模块求单样本正态总体比例的置信区间，步骤如下：在“分析家”模块中打开数据集mylib.outgo。根据原变量exp生成一个新的分类变量exp_recoded。选择菜单“统计”“假设检验”“比例的单样本检验”命令。在“One-Sample Test for a Proportion”对话框中，选择分析变量，设置置信区间类型和置信水平，得到输出结果如图4-13所示。,结果表明，在95%置信水平下变量exp_recoded取值为“1000”的比例的置信区间是（0.194，0.681），即在95%置信水平下估计该校学生月支出在1000元以上的人所占比例在19.4%68.1%之间。,3.单样本正态总体方差的置信区间【例4-3】已知某股票在2014年3月的22个交易日的收益率如表4-5所示，求该股票收益率的方差在99%置信水平下的置信区间。设数据存放于数据集mylib.stock中，其中股票收益率变量名为yield。,用分析家模块求单样本正态总体方差的置信区间，步骤如下：在“分析家”模块中打开数据集mylib.stock。选择菜单“统计”“假设检验”“方差的单样本检验”命令。在“One-Sample Test for a Variance”对话框中选择变量yield作为分析变量。在“Var=”右侧文本框中输入任意正数，单击“Intervals”按钮，设置置信水平为99%。单击“OK”按钮，返回到“One-Sample Test for a Variance”对话框，再次单击“OK”按钮，得到分析结果如图4-16所示。,结果显示，该股票收益率的方差在99%置信水平下的置信区间为（0.0005，0.0028）。,4.2.2 单样本正态总体的假设检验,1. 单样本正态总体均值的假设检验2. 单样本正态总体比例的假设检验3. 单样本正态总体方差的假设检验,1. 单样本正态总体均值的假设检验【例4-4】市质监部门对超市袋装大米的净含量准确性进行抽检，随机从几家抽取了20袋大米，每袋标示的重量都是5公斤。工作人员对这些大米进行了称重测试。测试过程为：先把每袋大米连包装一起称重，记录下大米的毛重以后，再把大米倒出来，称包装袋的重量。最后根据两项称重值的差得出大米的实际净重为多少。测试结果如表4-6所示。假定大米重量数据存放在数据集mylib.dmzl中，重量变量名为weight，试从检验的样本数据出发，检验变量weight的均值与5公斤是否有显著差异。,设变量weight的均值为，根据题意作如下假设：H0：=5 H1：5（1）用INSIGHT模块对单样本正态总体均值进行假设检验，其步骤如下：在INSIGHT模块中打开数据集mylib.dmzl。选择菜单“分析”“分布”命令。在“分布”对话框中选择变量weight作为分析变量。单击“确定”按钮，得到变量的描述性统计量。选择菜单“表”“位置检验”命令，在弹出的“位置检验”对话框中输入5，得到输出结果如图4-18所示。,结果显示，观测值不等于5公斤的观测有20个，其中16个观测值大于5公斤。图中还显示出学生T检验、符号检验和符号轶检验的结果，如果分析变量是正态分布的，那么只需看T检验的结果；否则只需看符号检验的结果；而在没有具体数值，仅有两两比较大小的结果时看符号轶检验的结果。由于这三个检验的结论都是p值小于0.05，所以拒绝原假设，即总体的均值与5公斤有显著差异。,（2）用分析家模块对单样本正态总体均值进行假设检验，其步骤如下：启动分析家模块，并打开数据集mylib.dmzl。选择菜单“统计”“假设检验”“均值的单样本t-检验” 命令。选择变量weight作为分析变量填入Variable框中，在假设框中设置原假设的均值Mean=5。单击“Plots”按钮，在打开的对话框中选中t distribution plot复选框。单击“OK”按钮，返回到“One-Sample t-test for a Mean”对话框，再次单击“OK”按钮，得到分析结果如图4-20所示。,结果的第一部分是变量weight的简单描述统计量。第二部分显示了原假设条件与对立假设条件，显示了t统计量的观测值为4.015，p值为0.0007小于0.05,所以拒绝原假设，即总体的均值与5公斤有显著差异。结果的图形部分显示出t统计量抽样分布的密度曲线图形，两侧的阴影区域为拒绝域，占总面积的5%，竖线显示t统计量的观测值的位置落在阴影区域，因此拒绝总体的均值为5公斤的原假设。,（3）用TTEST过程步对单样本正态总体均值进行假设检验，程序如下：proc ttest h0=5 data=mylib.dmzl ;var weight;run;,2. 单样本正态总体比例的假设检验【例4-5】某大学要对其1000名在校学生的月支出进行调查，随机抽取16名学生的调查数据如例4-2表4-4所示。设月支出数据存放于数据集Mylib.outgo中，其中月支出变量名为exp。在95%置信水平下推断该校学生月支出在1000元以上的人所占比例是否超过40%。设学生月支出在1000元以上的人所占比例为，根据题意作如下假设：H0： =0.4 H1：0.4,用分析家模块作单样本正态总体比例的假设检验，步骤如下：在“分析家”模块中打开数据集mylib.outgo，选择菜单“统计”“假设检验”“比例的单样本检验” 。在“One-Sample Test for a Proportion”对话框中选择变量exp_recoded填入Variable框中。单击“Level of interest”右侧下拉按钮，选择1000。在Hypotheses栏设置原假设的值0.4，选择备择假设Prop 0.4，如图4-22a所示。单击“Plots”按钮，在打开的对话框中选择Normal distribution plot，如图4-22b所示。单击“OK”按钮，返回到“One-Sample Test for a Proportion”对话框，再次单击“OK”按钮，得到分析结果如图4-23所示。,结果显示，检验用的Z统计量p值为0.6203 0.05，所以不能拒绝原假设，该校学生月支出在1000元以上的人所占比例在0.05的显著性水平下超过40%。,3.单样本正态总体方差的假设检验【例4-6】某工厂生产的人造纤维强度服从标准差为5的正态分布，为检测生产的人造纤维强度是否符合要求，某日随机抽取12根人造纤维进行试验，测得纤维强度如下： 278285284282285286290292289280275293设测量数据存放于数据集Mylib.strength中，其中纤维强度变量名为str。这是一个单样本正态总体方差的假设检验，根据题意，设置假设：H0：2=25H1：225,用分析家作单样本正态总体方差的假设检验，步骤如下：选择菜单“统计”“假设检验”“方差的单样本检验”命令。在“One-Sample Test for a Variance”对话框中选择变量str作为分析变量。在Hypotheses栏设置原假设的值Var=25，选择备择假设Var =25。单击“Plots”按钮，在打开的对话框中选择Probability distribution plot。单击“OK”按钮，返回到“One-Sample Test for a Variance”对话框，再次单击“OK”按钮，得到分析结果如图4-25所示。,结果显示，样本方差为30.811，由于p值为0.5170，所以不能拒绝原假设，即生产的人造纤维强度是符合要求的。,4.3两样本正态总体的参数估计与假设检验,4.3.1两独立样本4.3.2两配对样本,4.3.1两独立样本正态总体的参数估计与假设检验,1.两独立样本正态总体均值的比较2.两独立样本正态总体比例的比较3.两独立样本正态总体方差的比较,1.两独立样本正态总体均值的比较【例4-7 】为比较大一新生男女生身高有无明显差别，分别抽取10名男生和8名女生为两个样本，数据如表4-7所示。建立数据集mylib.height，男女生身高数据记录在同一分析变量A下，分类变量B的值用以区分两个样本，试以0.05的显著性水平推断男女生身高是否存在明显差别。根据题意，设置假设：H0：男生平均身高与女生平均身高无显著差异，1-2=0H1：男生平均身高与女生平均身高有显著差异，1-20,（1）用分析家模块对两独立样本正态总体均值进行比较，其步骤如下：在分析家模块中打开数据集mylib. height。选择菜单“统计”“假设检验”“均值的双样本t-检验”命令。在“Two-Sample t-test for Means”对话框中选择变量A填入Dependent框中，选择变量B填入Group框中，如图4-27a所示。单击“Plots”按钮，在打开的对话框中选中t distribution plot复选框，如图4-27b所示。单击“OK”按钮，返回到“Two-Sample t-test for Means”对话框，再次单击“OK”按钮，得到分析结果如图4-28所示。,结果显示，t统计量的P值=0.00640.05 所以在0.05的显著性水平下拒绝原假设，男女生身高存在明显差别。图形中表示t统计量观测值位置竖线落在拒绝域，所以拒绝原假设，在0.05的显著性水平下男女生身高存在明显差别。,（2）用TTEST过程步对两独立样本正态总体均值进行假设检验，程序如下：PROC TTEST DATA = ; CLASS ; VAR ;RUN; 使用这一格式要求将两个样本中被比较均值的变量的观测值记在同一分析变量下，不同的样本用另一个分类变量的不同值加以区分，而且分类变量只能取两个值，否则将报错。proc ttest data=mylib.height;class B;var A;run;,从检验结果来看，关于方差齐性的检验结果，相应的p值=0.44240.05 所以不能拒绝方差相等的假设。在方差相等的前提下，检验t均值,相应的P值=0.00640.05 所以在0.05的显著性水平下拒绝原假设，男女生身高存在明显差别。,【例4-8】为调查两种不同识字教学法的效果，在小学一年级的两个班分别试验这两种教学方法，并在每班各随机抽取了10名小学生，记录下他们使用两种教学法的成绩如表4-8所示。试以0.05的显著性水平推断两种教学法是否有显著差异？由于两样本大小一致，所以在数据集mylib.score分别用变量A和变量B存储两个样本，推断两种教学法的考试成绩是否存在明显差别。根据题意，设置假设：H0：方法A和方法B的考试成绩无显著差异，1-2=0H1：方法A和方法B的考试成绩有显著差异，1-2 0,用分析家模块对两独立样本正态总体均值进行比较，步骤如下：启动分析家模块，并打开数据集mylib.score。选择菜单“统计”“假设检验”“均值的双样本t-检验”命令。在“Two-Sample t-test for Means”对话框中，选择“Groups are in”中的Two variables，并将变量A和B分别填入Group1和Group2中。单击“Plots”按钮，在打开的对话框中选中t distribution plot复选框，如图4-31b所示。单击“OK”按钮，返回到“Two-Sample t-test for Means”对话框，再次单击“OK”按钮，得到分析结果如图4-32所示。,结果显示，t统计量的P值0.05 所以在0.05的显著性水平下不能拒绝原假设，两种教学法的考试成绩的平均值没有显著差异，即两种教学法没有显著差异。,2.两独立样本正态总体比例的比较【例4-9】为调查男女生语文学习情况，在小学一年级随机抽取了27名男生和20名女生，记录下他们语文考试的成绩如表4-9所示。试以0.05的显著性水平推断考试成绩在90分以上的男女生所占比例是否有显著差异？设考试成绩存放于数据集Mylib.chinese中，其中语文成绩变量名为chinese。这是一个两独立样本比例检测的问题，若1和2分别表示男生和女生语文成绩90分以上的人所占比例，根据题意作如下假设：H0：1-2=0 H1：1-20,用分析家模块作两样本正态总体比例的假设检验，步骤如下：在分析家中打开数据集mylib.chinese。将变量chinese重编码得到新变量chinese_recoded。选择菜单“统计”“假设检验”“比例的双样本检验”命令，选择分析变量chinese_recoded，sex作为分组变量。单击“Level of interest”右侧下拉按钮，选择90。在Hypotheses栏设置原假设的值prop 1-prop2=0，选择备择假设prop 1-prop2 0，如图4-34a所示。单击“Plots”按钮，在打开的对话框中选择Normal distribution plot。单击“OK”按钮，得到分析结果如图4-35所示。结果显示，z统计量的p值为0.3138，所以在0.05的显著性水平下不能拒绝原假设，考试成绩在90分以上的男女生所占比例没有显著差异。,3.两独立样本正态总体方差的比较【例4-10】一家机床厂以生产某种圆形零件为主，每天的产量大约是8000个，每个零件的尺寸规格为直径21.5mm。生产厂家现购进一台新的机床进行生产，为了分析新机床生产的零件的尺寸是否比旧机床生产的零件尺寸偏差更小，现从某天新旧机床生产的零件中各随机抽取了10个，测得每个零件尺寸如表4-10所示。由于两样本大小一致，所以在数据集mylib.size中分别用变量A和变量B存储两个样本，如果12和22分别表示旧机床生产的零件的尺寸和新机床生产的零件尺寸的方差，根据题意，设置假设：H0：1 2 2 2H1：1 2 2 2,用分析家模块作单样本正态总体方差的假设检验，步骤如下：选择菜单“统计”“假设检验”“方差的双样本检验”命令。在打开的“Two-Sample Test for Variances”对话框中，选择“Groups are in”中的Two variables，选择分析变量A和B分别填入Group1和Group2中，如图4-36所示。在Hypotheses栏设置选择备择假设Variance1/Variance2 1，如图4-36所示。单击“OK”按钮，得到分析结果如图4-37所示。,结果显示，在0.05的显著性水平下不能拒绝原假设，新机床生产的零件的尺寸比旧机床生产的零件尺寸偏差更小。,4.3.2两配对样本的参数估计与假设检验,【例4-11】为探究两种公式还原魔方所需时间差异，随机选取10名实力相当的魔方爱好者分别采用两种公式进行操作实验，每个爱好者还原魔方所需的时间如表4-11所示，试分析这两种公式还原魔方所需时间有无显著差异。建立数据集mylib.time，两种公式还原魔方测得的时间分别用变量A和B存储，变量d为变量A和B的差值，根据题意对变量d的均值做如下假设：H0：ud=0即1-2=0 H1：ud0即1-20,（1）用INSIGHT模块对两配对样本正态总体均值进行比较，其步骤如下：在INSIGHT模块中打开数据集mylib.time。选择菜单“分析”“分布”命令，打开“分布”对话框。在“分布”对话框中设置分析变量d。单击“输出”按钮，在弹出的对话框中选择“位置检验”复选框。单击“确定”按钮，返回“分布”对话框，再次单击“确定”按钮，得到输出结果如图4-39所示。结果显示三个检验的结论都是p值大于0.05，所以不拒绝原假设，即两种公式还原魔方所需时间之差的均值与0无显著差异。因此在0.05的显著性水平下不能拒绝原假设，两种公式还原魔方所需时间无显著差异。,（2）用分析家模块对两配对样本正态总体均值进行比较，其步骤如下：在分析家模块中打开数据集mylib.time。选择菜单“统计”“假设检验”“均值的双样本成对t-检验”命令，打开“Two-Sample Paired t-test for Means”对话框。在“Two-Sample Paired t-test for Means”对话框中选择变量A和B分别填入Group1和Group2中，如图4-40a所示。单击“Plots”按钮，在打开的对话框中选中t distribution plot复选框，如图4-40b所示。单击“OK”按钮，返回到“Two-Sample Paired t-test for Means”对话框，再次单击“OK”按钮，得到分析结果如图4-41所示。,结果显示t统计量的p值=0.71750.05，因此在0.05的显著性水平下不能拒绝原假设，两种公式还原魔方所需时间无显著差异。,（3）用TTEST过程步对两配对样本正态总体均值进行比较，程序如下：proc ttest data=mylib.time;paired A*B;run;,4.4分布检验,4.4.1 正态分布4.4.2 正态性检验,4.4.1 正态分布,正态分布（Normal distribution）又名高斯分布（Gaussian distribution），该分布由两个参数平均值和方差决定。概率密度函数曲线以均值为对称中线，方差越小，分布越集中在均值附近。1.正态分布的概率密度函数则称X服从正态分布，记作XN(,2)。其中为X的总体均数，2为总体方差。,（1）曲线在x轴上方,与x轴不相交。（2）曲线关于直线x=对称。（3）在x=时位于最高点。（4）当x时,曲线下降.并且当曲线向左、右两边无限延伸时，以x轴为渐近线，向它无限靠近。（5）当一定时，曲线的形状由确定。越大，曲线越“扁平”，表示总体的分布越分散；越小，曲线越“尖陡”，表示总体的分布越集中,2.正态分布曲线的性质,3.标准正态分布当0，1时，正态总体称为标准正态总体；其相应的曲线称为标准正态曲线。标准正态总体N（0，1）在正态总体的研究中占有重要地位。任何正态分布的问题均可转化成标准总体分布的概率问题。,4.4.2正态性检验,正态分布是连续型变量的理论分布，有些统计方法只适用于正态分布或近似正态分布资料，因此在用这些方法前，需考虑进行正态性检验。进行正态性检验的方法有非参数检验中的K-S检验，探索性描述统计中的P-P图，Q-Q图。对于正态性检验，原假设为H0：数据服从正态分布；备择假设H1：数据不服从正态分布。使用UNIVARIATE过程对变量进行正态分布检验，其一般格式为：PROC UNIVARIATE DATA=数据集 NORMAL;VAR 变量;RUN;,【例4-12】随机抽取某班22名学生3门功课的成绩如表4-12所示。将数据集保存在mylib.exam中，分析该班3门功课的成绩分布是否符合正态分布。1.用INSIGHT模块进行正态性检验，其步骤如下：在INSIGHT模块中打开数据集mylib.exam。选择菜单“分析”“分布”命令。在“分布”对话框中选择分析变量Subjects1, Subjects2, Subjects3。单击“输出”按钮，在打开的对话框中选中正态性检验复选框。单击“确定”按钮得到分析结果如图4-46所示。,用分析家模块进行正态性检验，其步骤如下：在“分析家”模块中打开数据集mylib. exam。选择菜单“统计”“描述性统计”“分布”命令，在打开的“分布”对话框中选择分析变量Subjects1, Subjects2, Subjects3。单击“Fit”按钮，在打开的对话框中选择“normal”复选框。单击“OK”按钮，返回到“分布”对话框，再次单击“OK”按钮。在分析家窗口的项目管理器中双击“Fitted Distributions of Exam”,查看检验结果如图4-48所示。,3.用univariate过程步进行正态性检验，程序如下：proc univariate data=mylib.exam normal;var Subjects1 Subjects2 Subjects3;run;,本章小结,本章主要介绍了参数估计的基本概念、假设检验的基本原理和总体的正态性检验方法，并从INSIGHT模块、分析家模块和TTEST过程步三个方面，结合具体实例演示了SAS系统的统计推断功能。通过本章的学习，能掌握如何使用SAS系统实现单样本正态总体的参数估计与假设检验、两独立样本正态总体的参数估计与假设检验，以及两配对样本正态总体的参数估计与假设检验。,

注意事项

本文（SAS假设检验(公选)ppt课件.pptx）为本站会员（小飞机）主动上传，三一办公仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三一办公（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。