试验设计与数据处理(及统计软件SAS)普通版.ppt
《试验设计与数据处理(及统计软件SAS)普通版.ppt》由会员分享,可在线阅读,更多相关《试验设计与数据处理(及统计软件SAS)普通版.ppt(421页珍藏版)》请在三一办公上搜索。
1、试验设计与数据处理(及统计软件SAS),编者 江南大学理学院 吴有炜,目录,课程目的与主要内容 预备篇:SAS数据和SAS分析员应用系统 第一章 矩阵代数 第二章 概率论与抽样分布 第三章 统计推断 第二节 区间估计 第三节 假设检验 第四章 方差分析 第五章正交试验设计 第六章 回归分析 第一节回归方程的最小二乘估计 第二节 多元线性回归 第三节 回归模型的检验 第五节最优回归方程和逐步回归法 第六节关于参数的线性模型,第七节响应面分析 第八节 非线性回归 第九节复共线性 第十节残差分析 第七章回归正交设计 第八章均匀设计 第九章 单纯形优化设计 SAS的试验设计模块(ADX)第十章析因试验
2、设计 第七节 重复试验 第十一章 测试误差 第十二章 多指标综合评价概论 第十三章 主成份分析法 第十四章 模糊综合评价 第十五章 聚类分析与判别分析 第十六章 典型相关分析 稳定性寻优与三次设计(选讲)二分数据回归与LOGISTIC 回归(选讲)列联表分析(选讲),课程目的与主要内容,1.试验设计部分-介绍主要的试验设计方法,用尽可能少的试验点采集尽可能多的信息.2.数据处理部分-介绍常用的统计分析方法,从数据中根据需要有效地提取信息.3.SAS软件部分-学习操作SAS,应用SAS进行数据的实际分析.,预备篇:SAS数据和SAS分析员应用系统,一维数据输入:data E21;input N$
3、x1 x2 x3;/*说明N是字符型变量,N后加$*/y=x1+x2;z=x1*x2;u=x1*3;/*用加,乘,乘方产生新变 量*/cards;/*说明以下输入数据*/A 1.1 2.6 3.8 B 4.5 5.7 6.0 C 7.6 8.2 9.7;/*空语句说明数据输入结束*/Proc print;/*有此打印语句则在output窗口有输出,否则 只在explorework储存*/run;SAS程序不区分大小写字母请看演示,不等重复数据的两种输入法,Data E4122;input c$t;cards;1 19 1 15 1 22 1 20 1 18 2 20 2 40 2 21 2 3
4、3 2 273 16 3 17 3 15 3 18 3 16 4 18 4 22 4 19;proc print;RUN;Data E4122;do c=1 to 4;do rep=1 to 5;input t;output;end;end;cards;19 15 22 20 18 20 40 21 33 27 16 17 15 18 16 18 22 19./*缺失数据需加点*/;proc print;RUN;,SAS数据输入(带三个下标的一维变量Rijr),SAS数据输入(带二个下标的二维变量(x,y)ij),进入SAS的分析员应用系统,1.编辑程序输入数据并保存;或者调用在V8中的数据:
5、FileOpen 选中数据名打开2.SolutionAnalysis Analyst(分析员系统)(出现空白数据表)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名(Data norm见V8文件)(OK)Statistics请看演示,调用其它SAS数据集中的数据,形式:data 数据名;set 其它SAS数据集中数据名;(用于DATA步的其它SAS语句;)run;例 data E20;input number sex$x1 x2;cards;1 m 12 54 2 w 45 76 3 m 43 76 4 w 42 17;run;/*以
6、下为调用*/data E24;set E20;/*注:set 调取sas数据库数据E23*/if sex=m;/*数据的删选,即只选取E20中女性的数据进入E24*/y=(x1+x2)/3;z=x1*x2;I=int(y);/*注:int(y)表对y取整数部分*/run;,变量变换,data E23;input member$sex$x1 x2 x3;w=Abs(x2);/*绝对值函数*/if x1x2 then D=yes;else D=no;/*五种条件语句之 1*/if x1x2 then Do;E=yes;end;else Do;E=no;end;/*五种条件语句之 2*/if sex
7、=m then sex1=男;else sex1=女;/*五种条件语句之3*/if(x1=x2)or(x2=x3)then F=eql;/*逻辑判断or或,and且,not否定五种条件语句之4*/cards;A m 1.1 3.8 3.8B w 4.5-5.7./*遗漏数据一定要加符号.*/C m-8.2-8.2 9.7;title数据的各种输入;run;,一般函数1.x的绝对值ABS(x)2.x的平方根sqrt(x)3.符号函数Sign(x)例 sign(-6.7)=-1,sign(0)=0,sign(3.8)=14.取整函数Int(x)例Int(-3.6)=-4,Int(4.8)=4;5.
8、数学函数Exp(x)Log(x)Log2(x)Log10(x)Cos(x)Sin(x)Tan(x)Arcos(x)Arsin(x)Atan(x),随机变量X的分布函数 F(x)满足:F(x)=PXxPROBnorm(x)标准正态 分布 PROBnorm(x)=Pux,其中u是标准正态随机变量 PROBf(x,分子自由度,分母自由度,非中心参数)F-分布 PROBt(x,自由度,非中心参数)t分布随机数函数-seed每随意赋一个值可得到给定分布的随机变量抽样值 1 均匀分布随机数函数UNIFORM(seed)或RANuni(seed)2 标准正态分布随机数函数normal(seed)或RANno
9、r(seed),均值为a方差为2 的正态分布随机数函数X=a+sqrt(2)*RANnor(seed),以下程序运行后产生两组各100个抽样于均值为170,方差为30的正态分布随机数 data norm;do seed=1 to 100;x=170+sqrt(30)*rannor(seed);/*x=均值为170,方差为30的正态分布随机数*/y=170+sqrt(30)*rannor(seed);/*注意由于是随机数,两组结果不一样,且每次都不一样*/output;end;proc print;run;,预备篇练习题,第一章 矩阵代数,第一种情况的例,第二种情况的例,向量代数,第二章 概率论
10、与抽样分布,已经知道随机现象可以用随机变量来描述.对于随机变量X,最好知道它的分布函数(则讲已经完全掌握了它的变化规律),或者至少能知道它的某些数字特征(比如数学期望EX,方差DX).但是对于刻划一个具体随机现象的随机变量,它的分布函数或它的某些数字特征往往是未知的,如何确定它的分布函数或数字特征是数理统计要解决的问题.当然对被研究的对象全体进行全面观测或试验是解决此类问题获得最准确结果的方法,但这样实施往往有很大的困难或不可行.例如,要了解全国人口的某些情况,虽然可以进行全国人口普查,但由于工作量惊人而不可能轻易采用这种方法;又如要了解某厂家生产的一批灯管的质量,由于试验带有破坏性不可能通过
11、点坏所有灯管来确定寿命分布.在长期的实践研究中,人们总结出解决上述问题的合适而有效的方法:从研究对象中随机抽取一小部分进行试验或观测,对所得资料加以整理和分析,根据这些资料所显示的统计规律性,应用概率论原理,对研究对象的分布或它的某些数字特征作出推断.依据概率论原理由局部推断整体是数理统计学科的的研究方法.数理统计方法往往涉及大量计算,随着计算机科学技术的迅速普及,借助于计算机和计算软件,数理统计在科学研究和国民经济的众多领域已得到了广泛的应用.试验设计与数据处理是以概率论与数理统计为理论基础的实用性课程.,1.对于随机事件A,概率P(A)是事件A发生的可能性大小的度量.通过随机变量X的分布F
12、(x)可以给出随机变量取某个区间上值的概率:PaXb=F(b)-F(a)2.随机变量X分布的两个最重要的数字特征:1)数学期望(均值)EX 2)方差DX=E(X-EX)23.两个随机变量(X,Y)相互联系密切程度的数字特征:1)协方差V(X,Y)=E(X-EX)(Y-EY)2)相关系数(X,Y)=V(X,Y)/4.最重要的分布:正态分布N(,2),其中EX=,DX=2在SAS中PROBNorm(x)=PYx,其中Y服从标准正态分布N(0,1)描述性统计量通过X的抽样x1,x2,xn或(X,Y)抽样(x1,y1),(x2,y2),(xn,yn)可用样本统计量作为随机量数字特征的估计称为描绘性统计
13、量常用的有以下:,第三章 统计推断,统计推断包括区间估计与假设检验,在SAS中用同一个菜单系统完成.SolutionAnalysis Analyst(分析员系统)(出现空白数据表)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名(Data E3212见V8文件)(OK)Statistics Hypothesis Tests,第二节 区间估计,问题:估计分布的未知参数,通常是均值和方差抽样x1,x2,xn构造统计量1(x1,x2,xn)与2(x1,x2,xn)统计结论:的置信区间(1 2)以显著性水平为1-包含未知参数,例3.2.12
14、设有一组来自正态总体N(,2)的样本值:0.497,0.506,0.518,0.524,0.488,0.510,0.510,0.515,0.512.1.数据输入:data E3212;input x;cards;0.497 0.506 0.518 0.524 0.488 0.510 0.510 0.515 0.512;proc print;run;以下介绍统计原理,SolutionAnalysis Analyst(分析员系统)(出现空白数据表)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名(Data E3212见V8文件)(OK)S
15、tatistics Hypothesis TestsOne Sample ztest for a Mean待分析变量xVariablestd.dev.of(即)填入0.01(或Variance(即2)内填入0.012)Tests Interval OK OK 类似可以求未知方差的的均值的区间估计及方差的区间估计.请看演示,第三节 假设检验,问题:检验分布的未知参数.统计方法:提出关于未知参数的零假设和备择假设.小概率原理:小概率事件在一次观测中是几乎不可能发生的.如果在某个零假设 下,在一次观测中小概率事件发生了,就要拒绝零假设.统计结论:当零假设概率Pr0.05时接受零假设;当零假设概率Pr
16、0.05时拒绝零假设.,例 某车间用一台包装机包装葡萄糖.包得的袋装糖重是一个随机变量,它服从正态分布.当机器正常时,其均值为0.5公斤,标准差为0.015公斤.某日开工为检验包装机是否正常,随机地抽取它所包装的糖9袋,称得净重为(公斤):0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512问机器是否正常?(数据名Data E331)请看通过菜单系统进行假设检验的演示,SolutionAnalysis Analyst(分析员系统)(出现空白数据表)FileOpen By Sas Name(在Make one selection窗口中)wor
17、k 选中数据名(Data E331见V8文件)(OK)Statistics Hypothesis TestsOne Sample ztest for a Mean待分析变量xVariablestd.dev.of(即)填入0.015(或Variance(即2)内填入0.0152)Tests Interval OK OK 类似可以求未知方差的的均值的假设检验及方差的假设检测.请看演示,1.编程序输入数据:Data E335;input x y;card;6 2 4 1 5 2 5 2 6 1 5 0 5 3 6 2 4 1 6 0 7 1 4 3;proc print;run;,2.Solutio
18、nAnalysisAnalyst(分析员系统)(出现空白数据表)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名(DataE335见V8文件(OK)Statistics Hypothesis Tests Two Sample ttest for VarianceGroups are in 选Two variable(待分析变量xGroup1)(待分析变量yGroup2)(在Hypothesis框;备择假设Alternate(选择)Variance1/Variance21)Intervals(置信区间)Interval)OK OK 特别
19、提醒:PrF项下是零假设成立的概率,当Pr0.05时接受零假设否则拒绝零假设.请看演示,3.SolutionAnalysis Analyst(分析员系统)(出现空白数据表)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名(DataE333见V8文件)(OK)Statistics Hypothesis Tests Two Sample ttest for MeansGroups are in 选Two variable(待分析变量xGroup1)(待分析变量yGroup2)(在Hypothesis框填入零假设值)Null:Mean1-M
20、ean2=2;备择假设Alternate(选择)Mean1-Mean2=2 TestsInterval OK OK 类似可求其它各种情况的假设检验,请看演示(E335),第三章练习题,第四章 方差分析,问题-研究分类变量取不同水平对指标的影响统计原理-将指标的总波动(方差)分解成诸因素和随机误差之和,以随机误差的平均方差为参照对被考察对象的平均方差即方差比进行分析.设立零假设:被检验对象效应(即方差)(相对于误差)不显著统计结论:零假设为Pr0.05因素的主效应(或因素间的交互效应)不显著;当Pr0.05时认为影响显著;当Pr0.01时认为影响高度显著.直观上当总波动主要由模型的波动解释时称模
21、型显著,而误差的波动在总波动中占比例较大时称为不显著.三种情况:1)单因素 2)二因素 3)多因素(3)以及4)含协变量的协方差分析,第一节 单因素方差分析,例4.1.1 设有三台机器,用来生产规格相同的铝合金薄板.取样,测量薄板的厚度精确至千分之一厘米.得结果如表所示.问不同机器对生产的铝合金板的厚度有无影响?,特别提醒:方差分析(无论单因素双因素)中的误差平方和本质是重复试验的随机误差平方和(区别于后面回归分析中的误差平方和),对前例编程进行单因素方差分析Data E411;input c$y;cards;1 0.236 2 0.257 3 0.258 1 0.238 2 0.253 3
22、0.264 1 0.248 2 0.255 3 0.259 1 0.245 2 0.254 3 0.267 1 0.243 2 0.261 3 0.262;proc glm data=E411;/*glm为方差分析*/class c;/*分类变量c*/model y=c;/*模型 因变量=自变量*/lsmeans c;/*最小误差法*/means c;/*求c的均值*/RUN;请看演示,输出方差分析表如下:,利用菜单系统进行方差分析(设已输入数据data E411)SolutionAnalysisAnalyst(分析员系统)(出现空白数据表)FileOpen By Sas Name(在Make
23、 one selection窗口中)work 选中数据名E411(OK)StatisticsANOVA One-Way ANOVA Independent填分类变量c Dependent因变量yPlots可选择分水平的盒形图(Box-Whisker Plot),条形图(Bar Chart)及均值、标准差图MeansComparisons Methods给出了10种多重比较的方法 为选择的显著性水平,Breakdown可按水平分组出描述性统计量 OK(点击运行后的结果树标签则会打开相应图.,*关于自由度自由度=变量个数-约束方程个数 譬如在单因素方差分析中:,自由度公式总自由度ft=试验次数n-
24、1;误差自由度fe=总自由度ft-模型自由度f模型方差分析中(单因素模型)因素A(即模型)的自由度fA=水平数-1(A,B双因素考虑交互效应模型)因素A的自由度fA=水平数-1 因素B的自由度fB=水平数-1 交互效应A*B的自由度fA*B=fA*fB 模型自由度f模型=fA+fB+fA*B 回归分析中 项自由度=1 模型自由度f模型=项自由度之和,对于不等重复试验,方差分析同样进行,请看例,Data E412;input c$t;cards;1 19 1 15 1 22 1 20 1 182 20 2 40 2 21 2 33 2 273 16 3 17 3 15 3 18 3 164 18
25、 4 22 4 19;proc glm data=E412;/*glm为方差分析*/class c;/*分类变量c*/model t=c;/*模型 因变量=自变量*/lsmeans c;/*最小误差法*/means c;/*求c的均值*/RUN;,第二节 两因素方差分析,1.数据输入:见Data Rocket2.编程进行:proc glm data=rocket;class f m;/*class语句说明对分类变量 f,m分析*/model r=f m f*m;/*模型:连续变量r;考虑因素f,m及交互f*m*/lsmeans f m f*m;run;说明:如果要考虑交互效应,则每一水平组合必
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 试验 设计 数据处理 统计 软件 SAS 普通
链接地址:https://www.31ppt.com/p-6376762.html