欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    试验设计与数据处理及统计软件SAS普通.ppt

    • 资源ID:6344408       资源大小:4.32MB        全文页数:421页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    试验设计与数据处理及统计软件SAS普通.ppt

    试验设计与数据处理(及统计软件SAS),编者 江南大学理学院 吴有炜,目录,课程目的与主要内容 预备篇:SAS数据和SAS分析员应用系统 第一章 矩阵代数 第二章 概率论与抽样分布 第三章 统计推断 第二节 区间估计 第三节 假设检验 第四章 方差分析 第五章正交试验设计 第六章 回归分析 第一节回归方程的最小二乘估计 第二节 多元线性回归 第三节 回归模型的检验 第五节最优回归方程和逐步回归法 第六节关于参数的线性模型,第七节响应面分析 第八节 非线性回归 第九节复共线性 第十节残差分析 第七章回归正交设计 第八章均匀设计 第九章 单纯形优化设计 SAS的试验设计模块(ADX)第十章析因试验设计 第七节 重复试验 第十一章 测试误差 第十二章 多指标综合评价概论 第十三章 主成份分析法 第十四章 模糊综合评价 第十五章 聚类分析与判别分析 第十六章 典型相关分析 稳定性寻优与三次设计(选讲)二分数据回归与LOGISTIC 回归(选讲)列联表分析(选讲),课程目的与主要内容,1.试验设计部分-介绍主要的试验设计方法,用尽可能少的试验点采集尽可能多的信息.2.数据处理部分-介绍常用的统计分析方法,从数据中根据需要有效地提取信息.3.SAS软件部分-学习操作SAS,应用SAS进行数据的实际分析.,预备篇:SAS数据和SAS分析员应用系统,一维数据输入:data E21;input N$x1 x2 x3;/*说明N是字符型变量,N后加$*/y=x1+x2;z=x1*x2;u=x1*3;/*用加,乘,乘方产生新变 量*/cards;/*说明以下输入数据*/A 1.1 2.6 3.8 B 4.5 5.7 6.0 C 7.6 8.2 9.7;/*空语句说明数据输入结束*/Proc print;/*有此打印语句则在output窗口有输出,否则 只在explorework储存*/run;SAS程序不区分大小写字母请看演示,不等重复数据的两种输入法,Data E4122;input c$t;cards;1 19 1 15 1 22 1 20 1 18 2 20 2 40 2 21 2 33 2 273 16 3 17 3 15 3 18 3 16 4 18 4 22 4 19;proc print;RUN;Data E4122;do c=1 to 4;do rep=1 to 5;input t;output;end;end;cards;19 15 22 20 18 20 40 21 33 27 16 17 15 18 16 18 22 19./*缺失数据需加点*/;proc print;RUN;,SAS数据输入(带三个下标的一维变量Rijr),SAS数据输入(带二个下标的二维变量(x,y)ij),进入SAS的分析员应用系统,1.编辑程序输入数据并保存;或者调用在V8中的数据:FileOpen 选中数据名打开2.SolutionAnalysis Analyst(分析员系统)(出现空白数据表)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名(Data norm见V8文件)(OK)Statistics请看演示,调用其它SAS数据集中的数据,形式:data 数据名;set 其它SAS数据集中数据名;(用于DATA步的其它SAS语句;)run;例 data E20;input number sex$x1 x2;cards;1 m 12 54 2 w 45 76 3 m 43 76 4 w 42 17;run;/*以下为调用*/data E24;set E20;/*注:set 调取sas数据库数据E23*/if sex=m;/*数据的删选,即只选取E20中女性的数据进入E24*/y=(x1+x2)/3;z=x1*x2;I=int(y);/*注:int(y)表对y取整数部分*/run;,变量变换,data E23;input member$sex$x1 x2 x3;w=Abs(x2);/*绝对值函数*/if x1x2 then D=yes;else D=no;/*五种条件语句之 1*/if x1x2 then Do;E=yes;end;else Do;E=no;end;/*五种条件语句之 2*/if sex=m then sex1=男;else sex1=女;/*五种条件语句之3*/if(x1=x2)or(x2=x3)then F=eql;/*逻辑判断or或,and且,not否定五种条件语句之4*/cards;A m 1.1 3.8 3.8B w 4.5-5.7./*遗漏数据一定要加符号.*/C m-8.2-8.2 9.7;title数据的各种输入;run;,一般函数1.x的绝对值ABS(x)2.x的平方根sqrt(x)3.符号函数Sign(x)例 sign(-6.7)=-1,sign(0)=0,sign(3.8)=14.取整函数Int(x)例Int(-3.6)=-4,Int(4.8)=4;5.数学函数Exp(x)Log(x)Log2(x)Log10(x)Cos(x)Sin(x)Tan(x)Arcos(x)Arsin(x)Atan(x),随机变量X的分布函数 F(x)满足:F(x)=PXxPROBnorm(x)标准正态 分布 PROBnorm(x)=Pux,其中u是标准正态随机变量 PROBf(x,分子自由度,分母自由度,非中心参数)F-分布 PROBt(x,自由度,非中心参数)t分布随机数函数-seed每随意赋一个值可得到给定分布的随机变量抽样值 1 均匀分布随机数函数UNIFORM(seed)或RANuni(seed)2 标准正态分布随机数函数normal(seed)或RANnor(seed),均值为a方差为2 的正态分布随机数函数X=a+sqrt(2)*RANnor(seed),以下程序运行后产生两组各100个抽样于均值为170,方差为30的正态分布随机数 data norm;do seed=1 to 100;x=170+sqrt(30)*rannor(seed);/*x=均值为170,方差为30的正态分布随机数*/y=170+sqrt(30)*rannor(seed);/*注意由于是随机数,两组结果不一样,且每次都不一样*/output;end;proc print;run;,预备篇练习题,第一章 矩阵代数,第一种情况的例,第二种情况的例,向量代数,第二章 概率论与抽样分布,已经知道随机现象可以用随机变量来描述.对于随机变量X,最好知道它的分布函数(则讲已经完全掌握了它的变化规律),或者至少能知道它的某些数字特征(比如数学期望EX,方差DX).但是对于刻划一个具体随机现象的随机变量,它的分布函数或它的某些数字特征往往是未知的,如何确定它的分布函数或数字特征是数理统计要解决的问题.当然对被研究的对象全体进行全面观测或试验是解决此类问题获得最准确结果的方法,但这样实施往往有很大的困难或不可行.例如,要了解全国人口的某些情况,虽然可以进行全国人口普查,但由于工作量惊人而不可能轻易采用这种方法;又如要了解某厂家生产的一批灯管的质量,由于试验带有破坏性不可能通过点坏所有灯管来确定寿命分布.在长期的实践研究中,人们总结出解决上述问题的合适而有效的方法:从研究对象中随机抽取一小部分进行试验或观测,对所得资料加以整理和分析,根据这些资料所显示的统计规律性,应用概率论原理,对研究对象的分布或它的某些数字特征作出推断.依据概率论原理由局部推断整体是数理统计学科的的研究方法.数理统计方法往往涉及大量计算,随着计算机科学技术的迅速普及,借助于计算机和计算软件,数理统计在科学研究和国民经济的众多领域已得到了广泛的应用.试验设计与数据处理是以概率论与数理统计为理论基础的实用性课程.,1.对于随机事件A,概率P(A)是事件A发生的可能性大小的度量.通过随机变量X的分布F(x)可以给出随机变量取某个区间上值的概率:PaXb=F(b)-F(a)2.随机变量X分布的两个最重要的数字特征:1)数学期望(均值)EX 2)方差DX=E(X-EX)23.两个随机变量(X,Y)相互联系密切程度的数字特征:1)协方差V(X,Y)=E(X-EX)(Y-EY)2)相关系数(X,Y)=V(X,Y)/4.最重要的分布:正态分布N(,2),其中EX=,DX=2在SAS中PROBNorm(x)=PYx,其中Y服从标准正态分布N(0,1)描述性统计量通过X的抽样x1,x2,xn或(X,Y)抽样(x1,y1),(x2,y2),(xn,yn)可用样本统计量作为随机量数字特征的估计称为描绘性统计量常用的有以下:,第三章 统计推断,统计推断包括区间估计与假设检验,在SAS中用同一个菜单系统完成.SolutionAnalysis Analyst(分析员系统)(出现空白数据表)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名(Data E3212见V8文件)(OK)Statistics Hypothesis Tests,第二节 区间估计,问题:估计分布的未知参数,通常是均值和方差抽样x1,x2,xn构造统计量1(x1,x2,xn)与2(x1,x2,xn)统计结论:的置信区间(1 2)以显著性水平为1-包含未知参数,例3.2.12 设有一组来自正态总体N(,2)的样本值:0.497,0.506,0.518,0.524,0.488,0.510,0.510,0.515,0.512.1.数据输入:data E3212;input x;cards;0.497 0.506 0.518 0.524 0.488 0.510 0.510 0.515 0.512;proc print;run;以下介绍统计原理,SolutionAnalysis Analyst(分析员系统)(出现空白数据表)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名(Data E3212见V8文件)(OK)Statistics Hypothesis TestsOne Sample ztest for a Mean待分析变量xVariablestd.dev.of(即)填入0.01(或Variance(即2)内填入0.012)Tests Interval OK OK 类似可以求未知方差的的均值的区间估计及方差的区间估计.请看演示,第三节 假设检验,问题:检验分布的未知参数.统计方法:提出关于未知参数的零假设和备择假设.小概率原理:小概率事件在一次观测中是几乎不可能发生的.如果在某个零假设 下,在一次观测中小概率事件发生了,就要拒绝零假设.统计结论:当零假设概率Pr0.05时接受零假设;当零假设概率Pr0.05时拒绝零假设.,例 某车间用一台包装机包装葡萄糖.包得的袋装糖重是一个随机变量,它服从正态分布.当机器正常时,其均值为0.5公斤,标准差为0.015公斤.某日开工为检验包装机是否正常,随机地抽取它所包装的糖9袋,称得净重为(公斤):0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512问机器是否正常?(数据名Data E331)请看通过菜单系统进行假设检验的演示,SolutionAnalysis Analyst(分析员系统)(出现空白数据表)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名(Data E331见V8文件)(OK)Statistics Hypothesis TestsOne Sample ztest for a Mean待分析变量xVariablestd.dev.of(即)填入0.015(或Variance(即2)内填入0.0152)Tests Interval OK OK 类似可以求未知方差的的均值的假设检验及方差的假设检测.请看演示,1.编程序输入数据:Data E335;input x y;card;6 2 4 1 5 2 5 2 6 1 5 0 5 3 6 2 4 1 6 0 7 1 4 3;proc print;run;,2.SolutionAnalysisAnalyst(分析员系统)(出现空白数据表)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名(DataE335见V8文件(OK)Statistics Hypothesis Tests Two Sample ttest for VarianceGroups are in 选Two variable(待分析变量xGroup1)(待分析变量yGroup2)(在Hypothesis框;备择假设Alternate(选择)Variance1/Variance21)Intervals(置信区间)Interval)OK OK 特别提醒:PrF项下是零假设成立的概率,当Pr0.05时接受零假设否则拒绝零假设.请看演示,3.SolutionAnalysis Analyst(分析员系统)(出现空白数据表)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名(DataE333见V8文件)(OK)Statistics Hypothesis Tests Two Sample ttest for MeansGroups are in 选Two variable(待分析变量xGroup1)(待分析变量yGroup2)(在Hypothesis框填入零假设值)Null:Mean1-Mean2=2;备择假设Alternate(选择)Mean1-Mean2=2 TestsInterval OK OK 类似可求其它各种情况的假设检验,请看演示(E335),第三章练习题,第四章 方差分析,问题-研究分类变量取不同水平对指标的影响统计原理-将指标的总波动(方差)分解成诸因素和随机误差之和,以随机误差的平均方差为参照对被考察对象的平均方差即方差比进行分析.设立零假设:被检验对象效应(即方差)(相对于误差)不显著统计结论:零假设为Pr0.05因素的主效应(或因素间的交互效应)不显著;当Pr0.05时认为影响显著;当Pr0.01时认为影响高度显著.直观上当总波动主要由模型的波动解释时称模型显著,而误差的波动在总波动中占比例较大时称为不显著.三种情况:1)单因素 2)二因素 3)多因素(3)以及4)含协变量的协方差分析,第一节 单因素方差分析,例4.1.1 设有三台机器,用来生产规格相同的铝合金薄板.取样,测量薄板的厚度精确至千分之一厘米.得结果如表所示.问不同机器对生产的铝合金板的厚度有无影响?,特别提醒:方差分析(无论单因素双因素)中的误差平方和本质是重复试验的随机误差平方和(区别于后面回归分析中的误差平方和),对前例编程进行单因素方差分析Data E411;input c$y;cards;1 0.236 2 0.257 3 0.258 1 0.238 2 0.253 3 0.264 1 0.248 2 0.255 3 0.259 1 0.245 2 0.254 3 0.267 1 0.243 2 0.261 3 0.262;proc glm data=E411;/*glm为方差分析*/class c;/*分类变量c*/model y=c;/*模型 因变量=自变量*/lsmeans c;/*最小误差法*/means c;/*求c的均值*/RUN;请看演示,输出方差分析表如下:,利用菜单系统进行方差分析(设已输入数据data E411)SolutionAnalysisAnalyst(分析员系统)(出现空白数据表)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名E411(OK)StatisticsANOVA One-Way ANOVA Independent填分类变量c Dependent因变量yPlots可选择分水平的盒形图(Box-Whisker Plot),条形图(Bar Chart)及均值、标准差图MeansComparisons Methods给出了10种多重比较的方法 为选择的显著性水平,Breakdown可按水平分组出描述性统计量 OK(点击运行后的结果树标签则会打开相应图.,*关于自由度自由度=变量个数-约束方程个数 譬如在单因素方差分析中:,自由度公式总自由度ft=试验次数n-1;误差自由度fe=总自由度ft-模型自由度f模型方差分析中(单因素模型)因素A(即模型)的自由度fA=水平数-1(A,B双因素考虑交互效应模型)因素A的自由度fA=水平数-1 因素B的自由度fB=水平数-1 交互效应A*B的自由度fA*B=fA*fB 模型自由度f模型=fA+fB+fA*B 回归分析中 项自由度=1 模型自由度f模型=项自由度之和,对于不等重复试验,方差分析同样进行,请看例,Data E412;input c$t;cards;1 19 1 15 1 22 1 20 1 182 20 2 40 2 21 2 33 2 273 16 3 17 3 15 3 18 3 164 18 4 22 4 19;proc glm data=E412;/*glm为方差分析*/class c;/*分类变量c*/model t=c;/*模型 因变量=自变量*/lsmeans c;/*最小误差法*/means c;/*求c的均值*/RUN;,第二节 两因素方差分析,1.数据输入:见Data Rocket2.编程进行:proc glm data=rocket;class f m;/*class语句说明对分类变量 f,m分析*/model r=f m f*m;/*模型:连续变量r;考虑因素f,m及交互f*m*/lsmeans f m f*m;run;说明:如果要考虑交互效应,则每一水平组合必须做重复试验,否则可以不做重复试验.,3.应用分析员应用系统:SolutionAnalysisAnalyst(分析员系统)(出现空白数据表)FileOpen By Sas(在Make one selection窗口中)work(选中数据名Data rocket)(OK)Statistics ANOVA Factorial ANOVA Independent填分类变量f,mDependent填因变量R Model-Standard Models Main effects only只考虑主效应;Effects up to 2-way interactions考虑交互效应Plots可选择响应变量的均值(主效应或交互效应)连线图MeansComparisons Methods给出了10种多重比较的方法 为选择的显著性水平,Breakdown可按水平分组出描述性统计量OK 请看演示,第三节 多因素(3)方差分析,对于多因素方差分析由于往往受试验次数约束而采用回归分析中的方差分析模型进行平方和分解,此时显著性参照物误差为指标的观测值和理论模型值的均方差(与模型选择有关),误差来源于不在模型内的因素(项)和随机误差.这不同于ANOVA(或GLM)程序中的方差分析中的误差来源于重复试验.指标y(回收率),因素:XA(尿素量),XB(水量),XC(反应时间),XD(溶剂量)(一)初步分析:从数据表(见data Q98)看出各因素等间距取值,由正交多项式理论,此时因素的主效应(在以下变换的前提下,注意未经变换主效应的线性部分和二次项部分无法有正交性分解)可以进一步分解成线性部分和二次项部分.对于显著因素,如果二次项部分不显著,只是线性项部分显著,那么因素与指标呈线性关系;如果二次项部分显著那么因素与指标呈抛物线关系.因素等间距取值时,因素的取值与水平数(自然数1,2,3)可以有线性变换关系 新变量(可看成水平序号,已经无量纲影响)=(原变量左端点)/步长+1 此时在SAS中应先用水平数为自变量进行项的删选,删选结束用水平数与原始变量进行方差分析和回归分析结论完全相同,说明:A,B,C,B分别是四个因素在正交表上的水平值(二)数据输入data Q98;input number$A B C D XA XB XC XD y;A2=A*2;B2=B*2;C2=C*2;D2=D*2;XA2=XA*2;XB2=XB*2;XC2=XC*2;XD2=XD*2;cards;(数据略)proc print;run;,(三)分析过程进行分析时(1)当因素很多或误差自由度显然不够时可先只考察所有因素的主效应,如有可能再进一步考虑主要因素的二次项和交互项或(2)当试验次数相对较多时直接在进行变量代换 新变量(可看成水平序号)=(原变量左端点)/步长+1后,可考虑所有一次项和二次项采用逐步回归删去不显著的项直接讨论本例先采用方法(1)分步讨论与直接采用方法(2)讨论的结果是一致的方法(1)第一步得输出表如下:,分析:由于每个因素自由度2,合计模型自由度8,n-1-p=0即误差自由度为0,从而无法产生统计量F和相应概率Pr,但从平方和分解中可以看出因素效应大小的顺序,并看出因素D是不显著的,故可以删去因素D后进入 Statistics Regression-Linear重新分析(在选项Statistics中选择型平方和SS)得表如下(从平方和比较中可以看出因素A只是线性效应而因素B,C呈抛物线效应,):,删除A2项重新上步工作得最终结果如表:,项的删选结束后当采用原始数据进行回归可发现方差分析结束完成一致并且得原变量和指标的回归方程见下表 方法(1)的以上过程与对新变量采用方法(2)直接利用逐步回归直接完成的结论相同,多因素(3)方差分析(续),五因素三水平安排在正交表L18(37)上,要考察每个因素和其平方对指标y的影响的显著性.数据见下程序data Q146;input number$A B C D E y;A2=A*A;B2=B*B;C2=C*C;D2=D*D;E2=E*E;cards;1 1 1 1 1 1 943.44 2 1 2 2 2 2 975.06(数据部分略);proc print;run;,SolutionAnalysis Analyst(“分析员应用”)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名 Q146(OK)Statistics Regression Linear线性回归在线性回归主窗口中Dependen填入因变量;Explanatory填入各自变量;(以下为返回式选项窗口,进入该类窗口并进行选择后OK 返回)OK Model 选择筛选变量的方法逐步回归stepwise selection(如果对项的入选采取较宽容的态度可以适当调大值譬如0.1)OK;Statistics选择Type 1 sum of squares OK OK请看演示,总和T以及各列的波动平方和S和总波动平方和ST等可以用SAS求得:data Q143;input A B C Em y;cards;1 1 1 1 5.09/*数据前三列为正交表L9(34)前三列*/1 2 2 2 20.39 1 3 3 3 24.56 2 1 2 3 16.8 2 2 3 1 23.23 2 3 1 2 18.94 3 1 3 2 21.01 3 2 1 3 15.59 3 3 2 1 22.34;proc print;run;,运行数据后再利用SAS菜单系统进行方差分析:SolutionAnalysis Analyst(分析员系统)(出现空白数据表)File Open By Sas(在Make one selection窗口中)work(选中数据名Data Q143)(OK)Statistics ANOVA Linear Models Independent填分类变量A,B,C Dependent因变量(响应变量)填y 在选项Statistics Type1下打勾 OK OK请看演示,发现因素A不显著,准备删去因素A,重新进入菜单系统:StatisticsANOVALinearModels Reset后 Independent填分类变量B,C Dependent因变量(响应变量)填y 在选项Statistics Type1下打勾 OK OK 请看演示,方差分析中的平方和分解定理,第四节 协方差分析,data pig;input a$;/*输入字符变量A+数组(do-end语句实际给出相当于 x1y1x2y2x8y8)*/do i=1 to 8;input x;/*用input x;input y;输入向量(x,y)*/input y;output;end;cards;(数据略);proc glm data=pig;class a;model y=a x/solution;/*模型:连续(响应)变量y=分类变量a,协变量x(用/solution表示)*/lsmeans a/stderr tdiff pdiff;/*用最小误差平方和法估计的均值估计a(称为修正均值)选项stderr 要求输出修正均值的标误 tdiff和pdiff表示要求输出各组修正均值相互比较的t值和P值*/means a;/*求出a中各组的均值*/run;(运行后主要输出结果如下),data fab;do b=1 to 4;do a=1to 4;do rep=1 to 2;/*注:用三个do-end语句输入三个下标的二维向量(x,y)bar*/input x;/*(b=1-4;a=1-3;r=1,2)(下标:两因素+重复)顺序(外层内层):*/input y;/*行(b=1-4)列(a=1-4)重复(r=1-2)向量(x,y)*/output;end;end;end;cards;(数据略);proc glm;class a b;model y=a b a*b x/solution;lsmeans a b a*b;means a b a*b;run;,第四章练习题,第五章正交试验设计,正交试验设计由于具有优良的均衡分散性和整齐可比性,其设计的试验点具有强烈的代表性,在工艺改革等多因素试验设计问题中,往往能以较少的试验次数,分析出各因素的主次顺序以及对试验指标的影响规律,删选出较满意的试验结果.正交试验法还渗透到其它一些试验设计方法中,提高了试验的效率和分析质量.正交试验法应用广泛,具有卓越的经济效益,是多因素试验设计问题中的常用手段.,第一节正交表介绍,L8(27)有8个横行和7个纵列,由数码“1”和“2”组成.它有两个特点:(1)每纵列恰有四个“1”和四个“2”;(2)任意两个纵列,其横方向形成的八个数字对中,恰好(1,1)、(1,2)、(2,1)和(2,2)各出现两次.这就是说对于任意两个纵列,数码“1”、“2”间的搭配是均衡的.在正交表L9(34)中.(1)每纵列“1”、“2”和“3”出现的次数相同,都是三(2)任意两个纵列,其横方向形成的九个数字对中,(1,1)、(1,2)、(1,3)、(2,1)、(2,2)、(2,3)、(3,1)、(3,2)和(3,3)出现的次数相同,都是一次,即任意两列的数码“1”、“2”和“3”间的搭配是均衡的.,第二节 二水平正交试验和分批试验,分批试验的思想:,例5.2.1 2,4二硝基苯肼的工艺改革,考察指标:产出率和颜色,第二批撒小网,对第一批试验确定的主次因素,若认为不再需要进一步考虑的因素,则主要因素固定在好水平上,次要因素固定在适当水平上,第二批试验中要考虑的因素包括第一批试验中确定的主要因素且认为有必要进一步详细考察的因素以及第一批试验中未及考虑到而认为有必要在第二批试验中补充考虑的因素.,第三节多水平正交试验和水平趋势图,例5.3.1 晶体退火工艺改进,定量因素的水平趋势图 发现有用量选偏的因素(在本例中是恒温温度B)是认识上的重大收获.下批试验中把用量选准后,常能取得明显的进展.,第四节 正交试验设计的优良性质,1.均衡分布见P.97图5.4.1(L9(34)前三列)使每个试验点有强烈的代表性 正交试验的试验次数(空心点总数):全面试验试验次数(格子点数)=每个平面上空心点数:每个平面上格子点数=每条棱上空心点数:每条棱上格子点数即 9/27=3/9=1/3(三因素三水平场合)局部试验的最优点的平均名次=(N+1)/(n+1)这儿N是全面试验次数,n是局部试验次数,对于正交表L8(27)则有(128+1)/(8+1)14,2.整齐可比性使正交表的同一列可比较产生”好水平”.下表说明A1的三次试验(空心点)中因素B的三个水平和因素C的三个水平各出现一次,A2和A3有同样情况,就是说,对因素A的三个不同水平,受因素B和因素C的水平影响处于对等状态.,正交试验采用极差分析或方差分析都可以,两者没有本质区别只是前者较方便而后者分析更精确,以下见例用方差进行分析(E531).data E531;input A B C D y;cards;input A B C D xa xb xc y;cards;(数据略);proc print;proc anova data=E531;class xa xb xc d;model y=xa xb xc d;/*当各因素单因素方差分析同时进行时由于没有误差自由度所以无法进行显著性分析*/means xa xb xc d/snk;/*选项snk要求作各水平组均值间的两两比较*/run;亦可利用菜单系统对每个因素进行单因素方差分析,模型的平方和即该因素的平方和在正交试验的分析中与极差作用类似.亦可用因素的原始数据值(xa xb xc)求水平趋势图(plot选项中选取均值图),第六节 正交表的灵活安排,定量因素的试验用量或定性因素的状态叫做因素的水平,在确定参加正交试验的因素后,各种类型的正交表的格式是固定的,有时候各因素的水平必须灵活处理以适应某张合适的正交表.1.活动水平2.拟水平和后备水平,配比试验,第五章练习题,第六章 回归分析,在现实世界中,存在着大量这样的情况:一个变量和一个或多个变量,譬如y和x1,x2,xp有一些依赖关系,由x1,x2,xp可以部分地决定y的值,但这种决定往往不很确切.常常用来说明这种依赖关系的最简单、直观的例子是体重与身高、腰围.若用x1表示某人的身高,用x2表示某人的腰围,用y表示他的体重,众所周知,一般说来,当x1,x2大时,y也倾向于大,但由x1,x2不能严格地决定y.类似的例子还很多.变量之间的这种关系称为“相关关系”,回归模型就是研究相关关系的一个有力工具.,第一节回归方程的最小二乘据估计,一元线性回归的例data E621;input mumber$y x;cards;数据略;proc print;run;请看演示,例散点图,由散点图可见x增大时y反而小,散点散布在一条直线附近.不过找不到一条直线穿过所有散点(这就是由误差决定的相关关系的特征).现在要求这样的直线方程:y=b0+b1xi,即由数据确定回归参数b0,b1.对于每一数据对(xi,yi)中的xi,同时有y的观测值yi与回归直线上的计算值b0+b1xi与之对应,相应有误差ei=yi-(b0+b1xi).回归分析中参数的最小二乘估计就是要求这样的b0,b1使,利用分析员应用系统进行一元回归,SolutionAnalysis Analyst(“分析员应用”)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名E621(OK)Statistics Regression Simple一元回归(一元回归主窗口)在线性回归主窗口中,Dependen因变量选中y;Explanatory自变量选中x;然后进入各返回式选项窗口(进入该类窗口并进行选择后OK 返回)OK 请看演示,第二节 多元线性回归,假设y为因变量,x1,xp为对y有影响的p个自变量,并且它们之间具有线性关系 y=b0+b1x1+bpxp+e,其中e为误差项,它表示除了x1,xp之外其它因素对y的影响以及试验或测量误差.b0,b1,bp是待估计的未知参数.假定我们有了因变量y和自变量x1,xp的n组观测值(xi1,xip;yi),i=1,n,它们满足 yi=b0+b1xi1+bpxip+ei,i=1,n(6.1.3)这里ei为对应的随机误差.,数据中心化,最小二乘的几何意义,例6.4.1 研究某一地区土壤中含植物可给态磷的情况.设y是35时土壤中可给态磷含量;x1是土壤中所含无机盐浓度;x2是土壤中溶于K2CO3溶液并受溴化物水解的有机磷;x3是土壤中溶于K2CO3溶液但不溶于溴化物的有机磷,经18次测量(见程序中数据),求x1,x2,x3对y的线性回归方程 Y=b0+b1x1+b2x2+b3x3,data pcontent;input x1-x3 y;cards;数据略;proc print;run;,利用SAS进行多元线性回归,1.编程进行(设数据已输入):proc reg data=pcontent;/*reg回归分析*/model y=x1-x3;/*模型 因变量=自变量*/run;2.利用菜单系统:SolutionAnalysis Analyst(“分析员应用”)FileOpen By Sas Name(在Make one selection窗口中)work 选中数据名(OK)Statistics Regression Linear线性回归 Dependen填入因变量;Explanatory填入各自变量;以下为返回式选项窗口(进入该类窗口并进行选择后OK)OK 请看演示,第三节 回归模型的检验,SAS不能替我们选择模型,模型的选择是我们决定的.但SAS可以帮我们判断模型选择的好坏,与此有关的就是方程的显著性检验和失拟检验.看例data E123;input x y;cards;0.1 1.10 0.2 1.36 0.3 1.38 0.4 1.45 0.5 1.56 0.6 1.41 0.7 1.39 0.8 1.36 0.9 1.08 1.0 0.96;proc print;run;,用直线拟合数据E123,用抛物线拟合数据E123,显著性检验的几何意义:F=(b1x1*+b2x2*2/fr)/(e2/fe),回归分析中的平方和分解定理,方程显著性检验的三个方法1.总离差平方和St=回归平方和Sr+误差平方和Se,相应有自由度:总自由度ft=试验次数-1;回归自由度fr=项数;误差自由度fe=ft fr.用F-统计量 F=(Sr/fr)/(Se/fe)参照临界值F(ft,fe)判断显著性:若F F0.01(fr,fe),称方程高度显著;若F F0.05(fr,fe),称方程显著;若F F0.05(fr,fe),(或FF0.1(fr,fe),称方程不显著;,2.假设检验:零假设为 H0:b1=b2=bp=0 SAS根据数据给出零假设成立的概率(PrF)当Pr0.05时接受零假设,认为方程不显著;当Pr0.05时拒绝零假设,认为方程显著;当Pr0.01时拒绝零假设,认为方程高度显著;3.y和自变量集的(修正的)复相关系数(y;x1,xp)=cos(y*,b1x1*+bpxp*)其平方越大越显著建议采用考虑自由度的复相关系数平方Adj R-sq 4.重复试验和失拟检验(见第十章第七节)请看演示:数据E123(分别用线性和二次进行),数据pcontent的分析结果,第五节最优回归方程和逐步回归法,由偏回归平方和的概念可知当回归方程中项数p时,误差平方和e2.同时显著性检验统计量 F=(Sr/p)/(e2/n-1-p)中却有n-1-p,因此,当p或时e2/n-1-p的变化决定于因子的显著性,所谓“最优”回归方程,是指包括对因变量有明显影响的自变量,不包括那些影响不显著或根本无影响的自变量,而且是残余方差较小的回归方程.SAS利用逐步回归stepwise或Adjusted

    注意事项

    本文(试验设计与数据处理及统计软件SAS普通.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开