《因素实验设计方法》PPT课件.ppt
单因素试验设计方法,卫生统计学教研室郜艳晖,单处理因素试验设计,处理因素非处理因素研究主要目的:处理因素各个水平的作用有无差异?特点:不能分析因素间交互作用,Outline,完全随机设计(completely randomized design)配对设计(paired design)配伍组设计(randomized block design)平衡不完全配伍组设计(balanced incomplete blocks design)拉丁方设计(latin square design),完全随机设计(completely randomized design),又称简单随机分组设计(simple randomized design),是最为常用的考察单因素两水平或多水平的实验设计方法。平衡设计(各组样本含量相等)非平衡设计(各组样本含量不等)。,两独立样本(A),受试对象,随机分组,样本1,样本2,A 完全随机分组得到两独立样本,甲药,乙药,两独立样本(B),样本1,总体1,样本2,总体2,B 从两总体中随机抽样得到两独立样本,随机抽样,两独立样本(C),总体,样本,样本2,样本1,按某属性分类,C 按某一两分类的属性分组得到两独立样本,例1 今测得12名正常人和15名病毒性肝炎患者的血清转铁蛋白含量,结果如下:,例2.20只雌性大鼠,随机分入甲(3mg/kg内毒素)乙(空白对照)两组,测得肌酐数据。(数据略),(一)分组方式,将受试对象随机分配到各个处理组。e.g.将12头动物随机分配到A、B两组。分别从不同的总体进行随机抽样,获取代表各个不同总体的随机样本。e.g.比较慢性胃炎病人和健康人胃粘膜组织中T淋巴细胞的含量。,(二)举例,例1、按完全随机设计方法将15名患者随机分为甲、乙、丙三组。(1)先按患者的就诊顺序编号;(2)从随机数字表中任意指定某行某列,如从第6行29列开始,向下录入15个两位数的随机数字,并依次列于各患者编号之下;(3)将随机数字从小到大编秩后得序号R,并规定R:15者为甲组,610者为乙组,1115者为丙组。结果如下:,注意:随机数字的位数不应小于n的位数,遇有相同的随机数字应舍去。如果设计上需要各组例数不相等时,可利用R调整各组例数。如,若要求例8-3中甲组8例、乙组4例、丙组3例时,可规定R:18者为甲组,912者为乙组,1315者为丙组。,随机分组的SAS程序,Data a;%Let n=15;/*sample sizes*/Do i=1 to,例2、拟从慢性胃炎病人190例胃粘膜活体组织检查标本中随机抽取10份,与健康人的10份标本比较T淋巴细胞含量。(1)将病人依次编为1、2、190号,等分10段,每段19人;(2)从随机数字表中任意指定某行某列,如从第10行1列开始,向右录入10个两位数的随机数字,并依次列于各段患者编号之下;(3)以19分别除各段的随机数,记余数。若遇到除尽则记余数为19,小于19的随机数即为余数。(4)将各段的起始病例号加上“余数”减“1”,即为该段抽到的病例号。结果如下:,随机抽样的SAS程序,Data a;%Let n=10;/*sample sizes*/Do i=1 to,Obs i x Y1 1 0.76131 1442 2 0.20731 39 3 3 0.21904 41 4 4 0.69481 132 5 5 0.82155 1566 6 0.46336 88 7 7 0.12528 23 8 8 0.52107 99 9 9 0.82685 1510 10 0.06664 12,(三)常用统计分析方法,用于两个样本或多个样本均数比较。统计分析方法:t检验 方差分析(PROC ANOVA,PROC GLM)秩和检验,(四)优缺点,优点:设计简单,易于实施,出现缺失数据时仍可进行统计分析。缺点:小样本时,可能均衡性较差,抽样误差大,效率相对较低。,配对设计(paired design),是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同处理组。一定条件?-可能影响实验结果的混杂因素动物实验:种属、窝别、性别、体重等临床试验:病情轻重、性别、年龄、职业等,配对设计(A),甲药,乙药,A 受试对象按某些特征配对,两对象随机接受两种处理,配对设计(B),方法甲,方法乙,B 一份样品,一分为二,随机接受两种处理,治疗前,治疗后,治疗,配对设计(C),C 受试对象处理前后比较,(一)配对形式,(1)将两个条件相同或相近的受试对象配成对子(含同一个体的两对器官或组织),分别接受两种不同的处理。(2)同一受试对象(人或标本)分别接受两种不同的处理。(3)前后配对,即同一受试对象接受一种处理的前后。(影响因素:气候、饮食、心理等?-实验内对照),(二)举例,例3 试将已配成10对的20名受试者随机分配到甲、乙两处理组。(1)先将受试者编号,如第一对第一受试者编号为1.1,第二受试者编号为1.2,余仿此。(2)再从随机排列表中随机指定某行,例如第6行,依次将09之间的随机数字录于受试者编号下,舍去1019之间的数字,并规定随机数字为奇数时取甲乙顺序,偶数时取乙甲顺序。,结果:1.2、2.2、3.1、4.2、5.1、6.2、7.1、8.2、9.1、10.1 号受试者被分配到甲组,1.1、2.1、3.2、4.1、5.2、6.1、7.2、8.1、9.2、10.2 号受试者被分配到乙组。,随机区组的SAS程序,Proc plan Seed=20080306;Factors pair=10 ordered treat=2 random;Output out=b;Run;,(三)常用统计分析方法,配对t检验秩和检验:符号检验 符号秩检验配对 检验,(四)优缺点,优点:抽样误差较小,实验效率较高、所需样本含量也较小缺点:当配对条件未能严格控制造成配对失败或配对欠佳时,反而会降低效率。,(五)注意事项,不要“匹配”过头:e.g.研究高血压与钠盐摄入量的关系时,按饮食习惯将病例和对照进行配对。在实验过程中能始终辨认属于同一对的是哪两只动物;记录实验数据应保持每对的一一对应关系。,配伍组设计(randomized block design),亦称随机区组设计,是配对试验的扩大。该设计是将受试对象先按配比条件(如动物的性别、体重,病人的病情、性别、年龄等非实验因素)配成b个配伍组,每个配伍组有k个受试对象,再按随机化原则分别将各配伍组中的受试对象分配到各个处理组。分析方法:随机区组的方差分析,(一)举例,例4、将16头动物按体重配成区组,随机分入4个处理组。(1)将16头动物称重后,按体重大小依次编号为1,2,16,将体重相近的4头动物作为一个区组。(2)再从随机数字表中随机指定某行,例如第6行第10列向下读取4个随机数39、74、00、99,排列后的序号R为2、3、4、1,则第一个区组处理为B、C、A、D,余类推。,结果:A组:3、8、9、14 B组:1、5、12、13 C组:2、7、10、16 D组:4、6、11、15,随机区组的SAS程序,Proc plan Seed=20080306;Factors block=4 ordered treat=4 random;Output out=b;Run;,(二)优缺点,优点:该类设计是按配比条件将受试对象配成对子或配伍组,从而排除了非处理因素对实验的影响,保证了各组间的可比性,减少了抽样误差;该类设计增加了区组信息,可以减少样本含量,提高统计效率。缺点:由于受配对或配伍条件的限制,有时难以将受试对象配成对子或配伍组,从而损失部分受试对象的信息;即使区组内有一个受试对象发生意外,也会使统计分析较麻烦。,平衡不完全配伍组设计(balanced incomplete blocks design),完全区组设计:区组内试验单位数处理数不完全区组设计:区组内试验单位数处理数解决当实验处理数大于每个区组所能容纳的实验单位数时的一种设计方法。,t=处理数;r=处理的重复数;b=区组数;k=区组容量(试验单位数)所有观察数:bk=tr=N,平衡不完全配伍组设计,平衡所有区组容量相同;每种处理出现的次数(即重复数)相等;任何两个处理都有机会同时安排在一个配伍组内,并且同时出现在同一区组内的次数相同。因此,任何两种处理之间具有可比性。,随机分配步骤,设计方案表 处理数5,区组容量3,将设计方案中各配伍组随机分配给各试验单位组;将设计方案中各配伍组内的处理组随机分配给试验单位组内的各个试验单位。,统计分析方法,例 实验动物只能用药3次,但要比较的药物有4种,试用平衡不完全区组设计。结果如下:,t=4;r=3;b=4;k=3;,1、计算属于各处理的Q值:Qi=(k)*(处理i的反应合计)-(有处理i的区组合计)QA=3*8.320-(4.865+6.550+7.250)=6.295QB=3*3.975-(4.865+6.550+4.155)=-3.645同理:QC=QD=满足:QA+QB+QC+QD=0,2、计算校正的各处理反应平均,3、计算SS,4、校正后反应平均的两两比较(见表9.10),SAS参考程序,data BIB;do block=1 to 4;do rep=1 to 3;input treat$x;output;end;end;cards;a 2.190 b 0.975 c 1.700a 3.130 b 1.850 d 1.570a 3.000 c 2.570 d 1.680b 1.150 c 2.275 d 0.730;,proc glm;class block treat;model x=block treat;lsmeans treat/pdiff;run;,与随机区组设计比较:,相对于随机区组设计的效率,拉丁方设计(latin square design),e.g.为了研究5个不同剂量甲状腺提取液对豚鼠甲状腺肿的影响,考虑到种系和体重对观测指标可能有一定的影响,设计实验时,将这两个重要因素一并安排处理。根据专业知识,这三个因素的交互作用可以忽略不计。处理因素:5水平区组因素1:5水平区组因素2:5水平,拉丁方设计(latin square design),将r个拉丁字母排成r行r列的方阵,使每行每列中的每个字母只出现一次,这样的方阵叫r阶拉丁方或rr拉丁方。用拉丁字母安排处理因素,行和列安排控制因素,这样的试验称为拉丁方试验。,试验设计的基本要求:,必须是三因素同水平的试验 行数列数处理数行、列、处理间无交互作用各行、列、处理间的方差齐,优缺点,优点:纵横两项均为配伍组,可用较少的重复次数,获得较多的信息(减少试验次数);缺点:要求各因素的水平数相等且无交互作用;重复数少,对差别的估计不够精确(为了提高精确度,可将处理数相同的几个拉丁方结合起来进行试验设计);如有数据缺失,统计分析困难。,例 研究蛇毒的抑瘤作用,拟将四种瘤株匀浆接种小白鼠;一天后分别用四种不同的蛇毒成分,各取四种不同的剂量腹腔注射,每日一次,连续10天,停药一天,解剖测瘤重。瘤株:4水平蛇毒成分:4水平剂量:4水平,试验设计的步骤:,1、根据处理因素的水平选择一个基本型拉丁方,本例r=4,选用44基本拉丁方。A B C D B A D C C D A B D C B A,2、将基本型拉丁方进行行和列的随机化(必须整行(列)进行交换),3、随机决定各个字母所代表的处理 按随机数字表,随机读取第13行第1列四个随机数:61 96 48 95,排序3 1 4 2,分别对应A,B,C,D,4、按以上设计安排试验,并进行试验观察,根据观察值进行统计分析,方差分析表如下:,统计分析举例:,例 四只大白鼠对不同药液、不同次序的反应的拉丁方试验设计的实验数据的方差分析。,1.H0:(1)各动物对药液的反应总体均数相等(2)各用药次序的反应总体均数相等(3)各药液的反应总体均数相等 H1:(1)各动物对药液的反应总体均数不全相等(2)各用药次序的反应总体均数不全相等(3)各药液的反应总体均数不全相等,2.,3.列方差分析表,4.P值5.结论,SAS参考程序,data latin;do mice=1 to 4;do ord=1 to 4;input drug$x;output;end;end;cards;a 75 b 29 c 27 d 42b 45 d 71 a 81 c 53c 25 a 71 d 80 b 23d 47 c 31 b 48 a 87;,proc anova;class mice ord drug;model x=mice ord drug;means drug/snk;run;,Thank you,