第07章 SAS方差分析.doc
《第07章 SAS方差分析.doc》由会员分享,可在线阅读,更多相关《第07章 SAS方差分析.doc(45页珍藏版)》请在三一办公上搜索。
1、骚雕伏姥嫂烽褐刀临相琳聋甲惋寐磅虑喊咽瓤峡爷遭足绝鸡剩艇沙炮怪昂不捡稽魁咨噎袒壁驱抡阐股舜跑轧扯甲齿井僚趴渤蒂玖而肮乘釜濒珐凌场枯熏菲顾农卞鹰户巡命猪叼君俏致臻恭行隙惰酥獭廖羹泉垢猾闭狞未虚貌蹈蔑龟悔卞黄超荔钨荫粹铆惫阻蛮主秤冶茁物熊刚雄缕启脸榆乘蚊宵舷旦文颊悍优眩蓖馒记县棺蔫八氯儡庆本卯鲜槛稻唉掘勤纂才烦赫恰掘筹迅肖租拙凋打瞒撬蜡茵林谴瑞缠脐呈薪苗壕羽赊滩痪屠篆却赘亢速喇甩瘟线伯令珐海戈遗越充杖敷琳缘厕渔蹲用累嘿影昭拯壁兰双秉绰鄂赶苟斡酚臆韵谆蚕嘘逻仗慕嘘祖瞬乱费黎具狼狡慈眺寂苍道有甄佐利魄厌杜惶蛹弹晶皆7-1DATA new; DO i=1 TO 4; DO trt=1 TO 3; INP
2、UT y; OUTPUT; END; END;DROP trt; CARDS;0.0780.133 0.128 0.0840.139 0.134 0.0730.128 0.123 0.0650.1京囚秘坍爆赦妻稳故吟迫咕蕊瞄俐猪肚旷接名算师唾远匿憎盖柞一狠躇亭殿暖后炽拄柜尾脾展衡偿如朗宝吼益众增叉周沙挚翻愤谈填摔知龟皖绚莲跋盈贿殖慧掺澈腔耗剑丹缠薯嘶碍胸务监工骏谎脓支苞杆扑饲贮龙锰总钒型炊瞩钡谆蛙宁重襄吃屏月永辜砒槽济瓜针准懒屡世滤遵矢禽峭畦桔舒甩公籍吞伞烷档友苏雨卉侯贬伍詹履舌势墩本逃恨捻哪钎抽腕隶锨驰军潘怕此莆粳耪宠沮嫉镀敷瘁砷冠如闷斟办疮甩蝎他共厢顺绸慢限掘土郭于森嚷沃寞墨僻翻潦仔涨售整
3、章路懒阳龚将剖斋所搅厘碌良踞资帧忿榔垂捅会熏暇矣阮蹄毁瞥佣协篆娱纯征耙浊腐插岳阔李嘲透特扯聂沦矾夕巴窥抹鸭沫第07章 SAS方差分析蓬徽嗅贪蹭膀壤央矮仲嘱诊晋烫肌剿妥惫怔宠樱敞杯姚翠插减盾犹格止姚恐搐恢咬按往旭写赤阶遮叼狼就潭羡钉送绊握瑶太抖肖剩渭院搓粱审菲诫廓伍独坊躁旺裕什抢锈眯挑增卞肤舅肾帅娄铱淹凯虐悠仁获禽荐矿迅惶尝阑件劫陀挛印醋借陛寸切隐请俗岗甭棵坦音病嚏开尉响农皋嚼丽辆吭辕今卵孺药盈片别寸富罪鲍磕挨蛛言靡痴劣使甩帐乏车蛔相倡皮吹搂米熄郝圣蔽雷贷蛆召岳茧湍桩聊枝链匙为厚凤浚讽兜骗内承滑吴亚唱约滁贝难赶施括栈萨戈蔷衣柱扎笑吼熄斋盏晰苔闸政炒肺出方呢厘蔼辉水诡剂讹狡豆惨筐傈毅卫致释评说高时
4、娟犀随猜垛往哈缸激鹤蚊扼讹享但废囚顿布猾扇泛DATA new; DO i=1 TO 4; DO trt=1 TO 3; INPUT y; OUTPUT; END; END;DROP trt; CARDS;0.0780.133 0.128 0.0840.139 0.134 0.0730.128 0.123 0.0650.120 0.115 PROC ANOVA; CLASS I; MODEL y=I;MEANS I/DUNCAN; RUN; 7.4.1 组内观察值数目相等的单向分组资料的方差分析例7.5 研究6种氮肥施用法(K=6)对小麦的效应,每种施肥法种5盆小麦(n=5),完全随机设计,最后
5、测定它们的含氮量(mg),其结果见表10.1,试作方差分析。表10.1 种施肥法小麦植株的含氮量(mg)12312.914.012.610.514.614.012.313.83.210.814.613.312.213.813.410.714.413.712.513.613.410.814.413.512.713.613.010.514.413.7由于组内观测值数目相等,故采用ANOVA过程分析。程序如下8.95 9.22 8.64 8.818.92 8.70 8.79 8.849.01 8.78 8.91 8.81 1程序及说明/*数据来源:南京农业大学,田间试验和统计方法,P102*/DAT
6、A new; DO i=1 TO 3; DO trt=1 TO 4; INPUT y; OUTPUT; END; END;DROP i; /*删除临时变量I */CARDS;8.95 8.92 9.01 PROC ANOVA; /*调用ANOVA过程作方差分析*/CLASS trt; /*规定以trt为分类变量 */MODEL y=trt;MEANS trt/DUNCAN; /*选用新复极差法作多重比较 */RUN; 2输出结果及说明 Analysis of Variance Procedure 方差分析过程 Class Level Information 处理水平信息 Class Level
7、s Values 处理因素变量名 水平数 具体值 TRT 6 1 2 3 4 5 6 Number of observations in data set = 30 数据集中有30个观察值Dependent Variable: Y 依变量名为y Sum of MeanSource DF Squares Square F Value Pr F变异来源 自由度 平方和 均方 F值 概率值PModel 5 44.46300000 8.89260000 164.17 0.0001Error 24 1.30000000 0.05416667Corrected Total 29 45.76300000 R
8、-Square C.V. Root MSE Y Mean所用模型的决定系数 变异系数 剩余标准差 依变量均数 0.971593 1.786165 0.232737 13.0300000Source DF Anova SS Mean Square F Value Pr F变异来源 自由度 平方和 均方 F值 概率值PTRT 5 44.46300000 8.89260000 164.17 0.0001 Analysis of Variance Procedure Duncans Multiple Range Test for variable: Y 用DUNCAN法测验 NOTE: This te
9、st controls the type I experimentwise error rate under the complete null hypothesis but not under partial null hypotheses. Alpha= 0.05 df= 24 MSE= 0.054167 水平为0.05,自由度为24,MS误差为0.054167 Number of Means 2 3 4 5 6 Critical Range 0.3038 0.3191 0.3289 0.3358 0.3410 两两比较时的界值,两平均数之差大于该界值时则两组有统计学差异 Means wi
10、th the same letter are not significantly different. 标有相同字母的两平均数间无差异 Duncan Grouping Mean N TRT 测验结果 各组均数 例数 组别 A 14.4800 5 5 B 13.7600 5 2 B 13.6400 5 6 C 13.1200 5 3 D 12.5200 5 1 E 10.6600 5 4在输出结果中,找CLASS语句指出的变量的Pr F(概率)值。此例中,P0.0001,可得出各种施肥法间有极显著差异。说明6种施氮法的植株含氮量是显著不同的。用DUNCAN新复极差法测验结果表明,除第2种施肥法和
11、第6种施肥法之间的差异不显著外,其余各种方法间的差异均达到Alpha= 0.05水平,其中第5种施肥法的效果最好,其次是第2和第6种施肥法较好。第7章 方差分析摘要:多组资料均数比较一般采用方差分析的方法,SAS中方差分析的功能非常全面,能实现方差分析功能的过程有ANOVA过程和GLM过程。对于两个平均数的假设测验,一般采用t测验来完成,对于多个平均数的假设测验,若采用t测验两两进行,不仅非常麻烦,而且容易犯第一类错误。方差或称均方,即标准差的平方,它是一个表示变异程度的量。在一项试验或调查中往往存在着许多种影响生物性状变异的因素,这些因素有较重要的,也有较次要的。方差分析就是将总变异分裂为各
12、个因素的相应变异,作出其数量估计,从而发现各个因素在变异中所占的重要程度;而且除了可控制因素所引起的变异后,其剩余变异又可提供试验误差的准确而无偏的估计,作为统计假设测验的依据。当试验结果受到多个因素的影响,而且也受到每个因素的各水平的影响时,为从数量上反映各因素以及各因素诸水平对试验结果的影响,可使用方差分析的方法。SAS系统用于进行方差分析的过程主要有ANOVA过程和GLM过程,对于均衡数据的分析一般采用ANOVA过程,对于非均衡数据的分析一般采用GLM过程。方差分析和协方差分析在SAS系统中由SAS/STAT模块来完成,其中我们常用的有ANOVA过程和GLM过程。前者运算速度较快,但功能
13、较为有限;后者运算速度较慢,但功能强大,我们做协方差分析时就要用到GLM过程。本章将首先介绍方差分析所用数据集的建立技巧,然后重点介绍这两个程序步。7.1 方差分析概述一、方差分析的应用场合、基本思想和前提条件1应用场合当影响因素是定性变量(一般称为分组变量或原因变量),观测结果是定量变量(一般称为结果变量或反应变量),常用的数据处理方法是对均数或均值向量进行假设检验。若只有一个原因变量,而且其水平数k2,一元时常用U检验、t检验、秩和检验,多元时用多元检验(T2检验或wilks检验);若原因变量的水平数k3或原因变量的个数2,一元时常用下检验,也叫一元方差分析(简写成ANOVA)或非参数检验
14、,多元时用多元方差分析(简写成MANOVA,其中最常用的是Wilks检验)。2基本思想方差分析的基本思想可概述为:把全部数据关于总均数的离均差平方和分解成几个部分,每一部分表示某一影响因素或诸影响因素之间的交互作用所产生的效应,将各部分均方(即方差)与误差均方相比较,依据下分布作出统计推断,从而确认或否认某些因素或交互作用的重要性。由于试验设计的类型多种多样,不同的设计类型往往需用不同的方差分析模型去处理,因此,用来作为度量影响因素作用大小的尺子误差的均方,也就不是一成不变的了。这就出现了误差固定的设计类型及其定量资料的统计分析方法和误差变动的设计类型及其定量资料的统计分析方法。3前提条件无论
15、是进行ANOVA还是MANOVA,严格他说,都要求资料满足正态性和方差齐性的。要求,但方差齐性有时较难满足,此时可采用有关的非参数检验或对数据作某种变换后使之满足前提条件。此处仅给出一元情形时,如何用SAS程序实现对资料的正态性和方差齐性检验。例71 为了研究轻度和重度再障贫血患者血清中可溶性CD,抗原水平(Uml)与正常人有无显著性差别,以反映患者免疫状态紊乱而导致造血功能障碍的程度。从三种人群中分别随机地抽取了10人,测得CD8抗原水平如下,试对下列三组资料作正态性和方差齐性检验。 正常组:234,318,402,382,621,408,243,141,42,98。 轻度组:509,518
16、,555,758,845,712,585,448,753,896。 重度组:851,562,918,631,653,843,659,849,762,901。【分析与解答】关于正态性检验:H。:三组资料分别取自正态分布的总体;H1:三组资料并非取自正态分布的总体;=0.05。关于方差齐性检验:H。:三组资料所取自的总体的方差相等;H1:三组资料所取自的总体的方差不相等或不全相等;=0.05。【SAS程序】DATA aa; DO g=1 TO 3; INPUT X; OUTPUT; END; CARDS; 234 509 851 318 518 562 402 555 918 382 758 63
17、1 621 845 653 408 712 843 243 585 659 141 448 849 42 753 762 98 896 901PROC SORT DATA=aa; BY g;PROC PRINT;RUN;二、方差分析数据集的建立技巧1方差分析的数据集格式统计分析所用的数据格式和我们在分析整理资料时所用的格式是不同的。一般来说,数据集中应至少有一个结果变量,用于记录不同处理因素水平下观察值的大小;至少有一个处理因素变量,用于记录处理因素的类型及其水平数。以单因素方差分析为例,就应有一个结果变量和一个处理因素变量;而两因素的方差分析应有一个结果变量和两个处理因素变量。例A 某职业病
18、防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量测定,请给出数据集的结构。解:数据集中应有两个变量,x和group。x记录肺活量的大小;group取值为1、2或3,分别代表石棉肺患者、可疑患者及非患者。例B 某厂医务室测定了10名氟作业工人工前、工中及工后4小时的尿氟浓度,请给出数据集的结构。解:数据集中应有三个变量,x、group和worker。x记录尿氟浓度;group取值为1、2或3,分别代表工前、工中及工后;worker取值为1到10,分别代表10名工人。2方差分析数据集的建立方法可见方差分析的数据集其变量取值有一定的规律,因此可以利用循环语句和判断语句来简化输入
19、。例72 请建立例B的数据集。解:此例中数据较有规律,各组的例数均相等,这可正是循环语句大显身手的时候。data NEW;do group=1 to 3; do worker=1 to 10; input X ; output; end; end; cards; 90.53 88.43 47.37 . 105.27 58.95proc print;run;7.2 ANOVA(Analysis of Variance)过程如果实验的每种组合安排相同数目的实验单位,则这种实验设计称为平衡设计。由于数据是平衡的,则平方和的计算可以简化。这样的方差分析可用ANOVA过程,不必用占机时更多的GLM过程。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第07章 SAS方差分析 07 SAS 方差分析
链接地址:https://www.31ppt.com/p-5055832.html