正交设计与统计分析.ppt
医学统计学,正交设计与统计分析,张丕德,广东药学院2008年12月9日,概述,所有的试验设计方法都建立在一定的数学模型下,一个好的试验设计方法,能够在相应的模型下,有最好的(或优秀的)表现:(1)参数可以估计,(2)当试验数n 固定时,参数估计的方差达到最小等。试验设计的目的:应用统计方法对试验因素作合理的、有效的安排,最大限度地减少试验误差,使之达到高效、快速和经济的目的。正交试验设计是试验设计中最重要的方法之一,它能用少量的试验,提取出丰富的信息。,概述,正交试验设计是利用“正交表”进行科学地安排与分析多因素试验问题的设计方法。其主要优点是能在很多试验方案中挑选出代表性强的少数几个试验方案,并且通过对这少数试验方案的试验结果的分析,推断出最优实验方案,同时还可作进一步地分析,得到比试验结果本身给出的还要多的有关各因素的信息。正交设计已有几十年历史,在我国普及使用始于上世纪六十年代末期,正值困难时期,七十年代达到高潮,目前已是科学试验最常用的方法,包括社会科学也在应用。,概述,本讲座首先从正交设计的实例分析入手,再逐步叙述正交设计的一些原理和注意的问题。有些内容还是目前正在研究的热点。不管是非统计专业人员,还是统计工作者,以下知识对恰当地应用正交设计都有重要的启发。,讲座内容,正交表的特征,正交表的特点 正交表是一套规格化的表格,是正交试验设计的基本工具。正交表,L是表示正交表的记号,n表示正交表的行数,也是需要作的试验次数;r表示正交表的列数,也是该表最多能安排的因素个数,其中包括交互作用和误差;p表示表中数码个数,也是各因素的水平个数。下面以正交表和正交表为例,说明正交表的构造特点。,正交表,正交表,正交表的特征,特点:正交表中任意一列中,不同的数码出现的次数相等,这一性质表明正交表具有均衡分散性;正交表中任意两列,把同行的两个数码看成有序数对时,所有可能的数对出现的次数相同。这一性质表明正交表具有整齐可比性,也称为正交性。2.选用正交表与表头设计:在多因素的试验中,除了各个因素对指标的单独影响外,还存在着因素间的联合作用,即交互作用。两个因素间的交互作用称为一级交互作用,如因素A和因素B间的交互作用记为AB;三个因素间的交互作用称为二级交互作用。三阶以上的交互作用很少出现或一般不考虑。,正交试验设计的直观分析法,例1 用正交试验设计优化四物汤提取工艺条件(无交互作用)。(1)明确试验目的,确定试验指标、选定因素和水平:为提高药材提取率,优化多糖提取工艺,以药材中多糖含量为试验指标。根据研究实践主要影响四物汤多糖提取率因素是回流提取时间A、加入水量B、提取次数C三个因素,每个因素选取3个水平,具体数据如表1。,表1 试验因素、水平表,正交试验设计的直观分析法,(2)选用正交表,作表头设计。因考察三因素三水平,所以,选用正交表 来安排试验,将三因素A、B、C分别放在表的前三列上;(3)按正交表的安排方案进行试验,并将结果记在表中最后一列;(4)直观分析。首先计算各个因素各个水平下的结果之和,用 表示,求出各个水平的平均值,用 表示。如果结果以大为好,平均值越大,说明该水平比其它水平优,通过平均值可以选择每个因素最优的试验水平;各因素最优水平组合在一起就是最佳试验方案。,正交试验设计的直观分析法,表2 四物汤提取工艺条件的试验安排及数据计算表,16.25 21.40 17.33,23.01 20.53 22.67,23.41 20.75 22.68,7.16 0.87 5.35,正交试验设计的直观分析法,用各个因素水平中的最大的平均值减去最小的平均值的差值称为该因素的极差,通常用表示第j列因素的极差,因素极差越大,说明因素水平(各因素水平相同时)的改变对试验结果影响也越大,所以,极差的大小反映了因素对试验指标影响的程度。可以通过比较极差大小排定因素对试验指标影响的顺序。比较极差,最大,故因素A对试验结果影响最大,其次是C和B,所以因素对多糖含量指标影响大小排序为:再比较各个因素水平的平均值,以A因素为例,在第1水平下所做试验的综合平均值为:,正交试验设计的直观分析法,同理;比较,由,从而得 水平最优;B因素对提取效果影响不大,考虑最小的溶媒用量可以节省浓缩时间,所以B 因素的最优水平选取 水平;C 因素水平中综合平均值最大的是,但 和 之间差异很小,考虑生产实际情况,选取水平 作为C因素的最优水平;确定四物汤中多糖提取的最佳试验方案为,即提取2次,时间为1h,溶媒用量为10倍量。最优方案往往未必出现在试验中,试验只提示最优方案的方向。为了确定 是否是最佳方案,可对该方案追加试验,考察效应是否稳定,如果重复试验的均值的确是最优的,就确定。,正交试验设计的直观分析法,为了更直观的观察,将各因素的指标数据绘成图,把因 素作为横坐标,指标作为纵坐标,从图中可以分析因素 对试验指标影响次序和每个因素的最优水平,见图1(a),(b),(c)。优点:简单易操作,可以初步看出效应随各因素水平变化的规律。缺点:不能判断差异的显著性,容易把无差异的因素保留,甚至把无意义的试验方案当做最优设计。,图1(a)图1(b)图1(c),正交试验设计的直观分析法,如果试验者对响应和因素间的关系已有一些认识,可以猜出效应与因素间的回归模型,这时回归分析应建立在试验者提供的先验模型上。同时,也可用二次回归模型来拟合,最后比较二次模型和先验模型的效果,以决定何者最优。,正交试验设计的直观分析法,例2 用有机溶液提取某中药的有效成分,欲寻找浸出率的影响因素和适宜水平(有交互作用)。选取因素及水平如下:因素A 溶液浓度:;因素B 催化剂的量:;因素C 溶剂的PH值:;因素D 温度:。需要考虑因素间的交互作用AB,AC,BC。试用正交试验直观分析法对结果进行分析。,正交试验设计的直观分析法,本例试验目的在于寻找提高浸出率的条件,故以浸出率(%)为试验效应指标。要求考察4个因素A,B,C,D及其交互作用AB,AC,BC,每个因素选取2个水平。可选择 表,将A,B,C,D及其交互作用AB,AC,BC分别置于表的1,2,4,7,3,5,6列中见表3。,312 320 334 306 318 318 316,320 312 298 326 314 314 316,78 80 83.5 76.5 79.5 79.5 70,表3 例2中考虑有交互作用的试验安排及数据计算表,正交试验设计的直观分析法,由表12,各因素及其交互作用对试验结果影响大小的排序为:AB C D 可见交互作用 AB 对试验结果影响最大,它比因素 A 和因素 B 对试验结果的独立影响都大,所以,在这种情况下,因素 A 的最优水平和因素 B 的最优水平搭配组合,并不一定是最优的试验组合,需要根据两因素各个水平组合下试验的平均结果来决定 A 和 B 的最优组合。A和B各水平组合的试验结果的均值见表4。,表4 A和B的二元表,A1,A2,正交试验设计的直观分析法,由表4,可得 和 组合下结果最优。考虑到 更省,选择组合;交互作用 AC 和 BC 作用较少,可不考虑;根据因素 C 的平均值选取 为最优水平;因素 D 影响最小,为了节省能源,选取 为最优水平;所以,考虑交互作用的最佳试验方案为。即溶剂浓度取70%,催化剂的量取0.1%,溶剂pH值取7.2,温度取 进行试验,对该方案追加试验,再确定是否最优。,正交试验的方差分析法,正交设计立足于方差分析模型。例如,若有三个因素A,B 和C,每个因素取了三个水平,且因素间没有交互作用,相应的统计模型(加法效应)是 其中,为总平均效应,主效应满足:如考虑因素有一级交互作用,则统计模型为 其中,。,正交试验的方差分析法,(1)总离差平方和的分解:例2中有8次试验,结果为。则总离差平方和为:分解公式为:其中 是正交表 中第j 列因素的离差平方和。例2中A,B,C,D及交互作用AB列的离差平方和,依次为。,正交试验的方差分析法,(2)计算各因素离差平方和:根据方差分析中组间离差平方和计算公式可推出 的计算公式。如:对于任何2水平的正交表,一般有:其中m表示第j列中因素“1”水平出现次数。n为试验总数。对于任何3水平的正交表,可将推广为:其中m为第j列因素“1”出现次数,n为试验总数。,正交试验的方差分析法,(3)误差平方和等于正交表中空白列的离差平方和之和,所以,在用方差分析的方法分析试验结果时,必须留有空白列,空白列也称为误差列。(4)确定各个因素离差平方和的自由度。正交表中总离差的自由度等于试验次数减1;正交表各列的自由度也是这个列上所安排的因素的自由度等于数码数减去1;正交表交互作用的自由度等于两个因素的自由度之积。所以,误差的自由度等于总的自由度减去所有考察的因素和交互作用的自由度。如上例中:;,正交试验的方差分析法,(5)进行F检验 代入样本值,列出方差分析表,按F检验可以判断有关因素是否有显著性影响。注意两点:第一,两因素交互作用的自由度等于两因素的自由度之积,这样,有时交互作用不止占有一列。如用表 安排试验,因素的自由度都等于2,必须占有两个列,交互作用自由度是4,而每个3水平列只提供2个自由度,所以交互作必须占两个列,表头设计如表5。第二,对结果影响不显著的因素的离差平方和可以合并到误差平方和,以提高检验精确度。,表5 用正交表,安排试验的表头设计,正交试验的方差分析法,例3 将例2结果作方差分析。只考虑AB的交互作用。(1)计算离差平方和及其自由度 由公式 算得:将计算结果列于表10-10中。,正交试验的方差分析法,(2)作F检验,列出方差分析表6:(3)分析结果。选取最佳试验方案:由表6可知,AB最显著,由A和B的二元表,取;其次为C,再由,故取;D不显著,可任取。确定最优试验方案为。,表6 例3的方差分析表,回归分析法,例4 用正交试验法优选中药半枝莲提取工艺。中药提取工艺筛选试验中常用化学法、生物学法以及有效出物综合评价法,用一种评价指标筛选提取工艺条件往往不够全面,所以,选择醇锓膏得率、总黄酮和野黄苓苷提取率为评价指标,用表来安排试验。所选因素水平见表7:表7 例4的因素和水平表,回归分析法,将所选因素和水平安排在表的1、2、3列中,表头设计及结果列于表8中。,回归分析法,1.直观分析影响大小排序:ABC,确定最佳方案:。如为节省时间、能源,也可采用。2.方差分析模型参数估计法 将各因素作为分类资料划分水平,经伪变量变换,进行回归分析,估计各参数:,=55.72,,=-18.29,,=14.71,,=18.29-14.71=3.58,13.84,,0.71,,=-13.84-0.71=-14.55,1.64,,-2.82,,-1.64+2.82=1.18,决定系数,=0.98,,回归分析法,检验结果:A因素各水平有显著差异,主效应大小顺序为,第2水平作用最大;B因素1、3水平作用显著,2水平作用不显著,主效应大小顺序为,第1水平作用最大;C因素各水平不显著。,回归分析法,影响排序:ABC,最佳方案:。预测值:=55.72+14.71+13.84+1.18=85.45 对方案 进行重复试验,考察试验结果与预测值85.91是否接近,确定该方案是否最优。3.回归分析法 只拟合线性回归的分析结果:把各因素作为连续资料,并对各水平中心化,A1=A-75,B1=B-8,C1=C-1.5,然后进行线性回归分析,结果如下:Root MSE 14.58343 R-Square 0.6444Dependent Mean 55.72222 Adj R-Sq 0.4311Coeff Var 26.17166,回归分析法,只有B因素线性项接近显著.进一步拟合二次方程,以最大决定系数为标准,选择一个最优方程,其中R-Square=0.9700,C(p)=2.4962,参数估计与检验结果如下:,回归分析法,A因素的线性项、二次项均非常显著,B因素线性项显著,二次方程为由于二次项系数小于0,方程有最大值,通过求导,可以得到,最大值点约为,即方案,预测值为,84.63,多指标正交试验设计分析方法,在实际工作中,衡量试验效应的指标不止一个,常常有多个指标,称为多指标正交试验设计。在多指标正交试验中,各指标的最优试验方案之间可能存在一定的矛盾,所以,分析试验结果时需要兼顾各项指标,找出使每个指标都尽可能好的试验方案。1综合评分法 是根据各个指标重要程度,确定相应指标的组合系数或权,然后,对每号试验进行综合评分,评分公式是:这样,将多指标结果分析问题化为了以试验得分为指标的单指标结果分析问题。,试验得分=,多指标正交试验设计分析方法,例5 用正交试验法优选复方鱼腥草提取工艺。由于成品质量标准中含量测定指标为黄苓苷,同时考虑到其他活性成分的提取,故以出膏率和黄苓苷含量为试验指标。选取药材提取过程中的影响因素和水平见表9。将所选因素和水平安排在 表的1、2、3列上,根据以往的经验知道,黄苓苷含量比出膏率更重要,因此,两个指标的权重系数分别取为和,为使各指标单位统一,把试验结果的每项指标中最好的指标定为60分和40分,综合评分为100分。在统一标准下加权评分为:,表9 例5的因素和水平表,多指标正交试验设计分析方法,出膏率:黄苓苷含量:综合评分为:将表头设计及结果列于下表10中。,多指标正交试验设计分析方法,以综合评分值为指标,对结果进行方差分析,列出方差分析表11:方差分析表明,因素A为次要因素,可根据生产实际情况确定加水量;因素B,C对综合指标有显著性影响,最佳试验组合应为。但从生产实际出发考虑,与之间相差不大,煎煮3次能耗较大且易煎出更多杂质,给后期分离带来困难,所以,选择 较为合适。因此,最优工艺为水煎2次,煎煮时间为2.5h,第一次1.5h,第二次1h。,表11 例5的方差分析表,多指标正交试验设计分析方法,2.主成分评分法 有一些多指标试验分析方法不断被使用,如综合比较法、公式法等等,这里不在一一讲述。,正交试验模型,正交设计立足于方差分析模型。例如,若有三个因素A,B 和C,每个因素取了三个水平,且因素间没有交互作用,相应的统计模型(加法效应)是其中,为总平均效应,主效应满足:试验设计的目的是用最少的试验次数给出模型各参数的最好估计,该模型共有8个独立参数,因此试验次数必须满足,否则,有些参数难以估计。如考虑因素有一级交互作用,则统计模型为,正交试验模型,其中,这时共有20 个未知独立参数需要估计,因此试验次数必须满足。当因素个数以及每个因素的水平数增加时,方差分析模型中的未知参数个数呈指数增长。因此,在大多数的教科书中,包括实际工作中,特别偏好使用2 水平和3 水平的正交表。但2 水平设计有时给出不正确的或不充分的信息。设在试验中因素A 对响应Y 有重要作用,图1 给出了三种常见的情形。设计(1)选择了正确的试验范围,但不幸二个水平的响应值接近,从而误判A 对Y 不重要。设计(2)是我们期望的,但A 和Y 更细致的关系不能提供。情形(3)选错了试验区域,从而误判A 对Y 不重要。二水平试验的局限性是一目了然的(方开泰,等,正交设计的最新发展和应用-回归分析在正交设计的应用,数理统计与管理18 卷2 期1999 年1 月),,,,,,,正交试验模型,图1 二水平设计,效应、因素与水平的选取:效应:试验指标最好是定量指标,最能够反映试验目标,最容易正确测量.如果不能用数量表示,也要通过评分或分级将指标量化。如果效应指标值不能直接测量,而是通过中间指标转换得到,必须保证转换的一致性和灵敏性.因素:凭借专业知识和实践经验,选择对试验效应可能有显著影响的因素。相关性强的或可替代的因素尽量少选。注意因素之间的比例(如混料试验)。,正交试验模型,水平:注意因素的取值范围,各因素的水平数可以相等,也可以不等,主要因素的水平数可以多些,次要的可以少些。分类水平选取代表性水平,水平之间必有最佳水平;连续变量的水平注意范围和间隔,对单峰效应,最佳水平必须在最大最小水平之间出现。多个水平的选择:对单峰效应注意中心化、对称化、等概率取点等单因素设计的优势。图2的设计1(-1,0,1)拟合效果可能比设计2(-2/3,0,2/3)差一点(对某些模型证明)。,图2 三水平设计,正交试验模型,二因素单峰曲面,二因素马鞍面,正交表 的选择,正交表的特点 正交表是一套规格化的表格,是正交试验设计的基本工具。正交表,L是表示正交表的记号,n表示正交表的行数,即试验次数;r表示正交表的列数,即该表最多能安排的因素个数,其中包括交互作用和误差;p表示表中数码个数,也是各因素的水平个数。下面以正交表 和正交表 为例,说明正交表的构造特点。,正交表,正交表,正交表 的选择,特点:正交表中任意一列中,不同的数码出现的次数相等,这一性质表明正交表具有均衡分散性;正交表中任意两列,把同行的两个数码看成有序数对时,所有可能的数对出现的次数相同。这一性质表明正交表具有整齐可比性,也称为正交性。2.选用正交表与表头设计:在多因素的试验中,除了各个因素对指标的单独影响外,还存在着因素间的联合作用,即交互作用。两个因素间的交互作用称为一级交互作用,如因素A和因素B间的交互作用记为AB;三个因素间的交互作用称为二级交互作用。三阶以上的交互作用很少出现或一般不考虑。,正交表 的选择,选用正交表 首先根据水平的个数选择正交表,如全是二水平,可以选择 等表;三水平,可以选择 等表;全是四水平,可以选择 等表。混合水平正交表。若水平和因素增多,应考虑采用均匀设计。表头设计 在作表头设计时,首先把因素安排在适当的列上,如考虑因素间的交互作用,需要把交互作用作为独立的因素来对待。然后借助于与正交表匹配的两列间交互作用表,确定因素间的交互作用列。表14是 与正交表匹配的两列间交互作用表。,正交表 的选择,表14 两列间交互作用表,正交表 的选择,如要安排一个4因素2水平的试验,若不考虑交互作用,可选用表,并将A,B,C,D四个因素分别置于表1,2,4,7列上,表头设计为若要考虑交互作用AB,AC,表头设计为:正交表中不安排因素的列称为空白列,如果用方差分析方法作结果分析,至少要有一列空白列以估计误差,所以,在表头设计时,一般至少都要留一列作为空白列。,正交表 的选择,3.正交表的等价、同构与分类 因素能否随便安排到各列?若考虑3因素2水平无交互作用试验,3个因素可以安排在表 的任意3列,共有 种设计方法,不同的设计效果不同。比如,设计1选用了(1,2,3)列,设计2选用了(1,2,4)列。两个设计比较:(1)设计2是一个全面试验,设计1将水平组合(1,1,1),(1,2,2),(2,1,2),(2,2,1)分别重复两次,而另四个水平组合(1,1,2),(1,2,1),(2,1,1),(2,2,2)没有出现。直观上来看,以设计2为佳。若因素间没有交互作用,两个设计等价,所有主效应及总平均的估计值有同样的精度。,正交表 的选择,(2)若A,B,C 间有交互作用,设计1 的主效应和交互效应完全混杂,而设计2 可以估出所有效应和交互效应,详情如下:,正交表 的选择,综合上述两条,设计2优于设计1。可见,因素是不能随便排列的。35 种设计,比较了其中两种设计,其余33 种情形如何呢?如果能将这35 种方案按同构进行分类,则问题将大大简化,这正是目前仍在研究的问题。等价:通过行置换和列置换变出的表。等价的表使用无本质差别。正交表不是唯一的。同构:通过行置换、列置换以及水平置换变出的表。从方差分析的角度看,同构的表统计推断能力有有相同的统计推断能力。,正交表 的选择,4.分辨能力与混杂效应多个效应在同一列出现称为“混杂”,所谓“效应稀疏原则”就是降低混杂。分辨力设计:主效应之间没有混杂。分辨力设计:主效应之间没有混杂,主效应与一阶交互作用没有混杂。分辨力设计:主效应之间没有混杂,主效应与二阶交互作用没有混杂,任两对二阶交互作用没有混杂。分辨力级别越高,效果越好,但分辨力越高,试验次数就越多,折中方案是:当试验者对模型不十分清楚时,通常取分辨力级别高的设计.,正交表 的选择,设计3为分辨力设计,设计4为分辨力设计,故设计3为推荐方案。混杂技术:当试验次数有限时,混杂现象是不可避免的,首先保证主效应的估计,其次保证低阶交互效应,让混杂发生在次要的交互效应之间。除试验因素外,试验条件或受试对象的一致性是很难保证的,而这恰恰是试验效应可比的关键,如不同的分析仪器,不同批次的样品,不同时间进行试验等。如果怀疑样品批次有差异,为防止混杂,可把批次作为一个因素考虑,单独安排1列,类似区组设计,同一批次在同一组,如下表设计:,正交表 的选择,例 为提高某化工产品的转化率,选择三个相关因素:温度、时间和加碱量,每个因素分三个水平,按温度对转化率有影响,三个实验员操作习惯不同,甲经常偏低,乙适中,丙偏高,如果甲全测80,乙全测85,丙全测90,会把测试人员的作用与温度的作用混杂。,正交表 的选择,5.重复试验如果正交表安排因素后,已没有空白列,难以分解出纯试验误差,不能进行方差分析。可以对部分方案进行重复试验,以便分解纯试验误差,但造成计算不规则。到底对那些方案重复试验,正是目前讨论的热点,本人认为,要么随机选择,保证分析条件的合理;要么,在试验中心进行重复,最佳效应的重复。6.拟水平和分类水平的伪变量:各因素水平数不等时,可以选择混合表;也可以通过拟水平法,即,将某些因素的水平重复补充,使各因素水平数一致,如,正交表 的选择,进行回归分析,多个水平的分类变量必须取伪变量。常用的编码方法有如下几种。假设变量X有四个分类水平1,2,3,4,若水平为无序属性分类,可以采用水平对照设计、一般回归设计、水平参照设计,若水平为数值型分类,可以采用多项式设计、正交设计等方法编码。将一个水平以向量来表示,比如在水平对照设计中,=(1,0,0)表示X=1,=(0,1,0)表示X=2,=(0,0,1)表示X=3,=(-1,-1,-1)表示X=4,X=4分别作为其他三个水平的对照。,正交表 的选择,表15 分类指标编码方法8.均匀设计(另一专题)7.设计空白:正交设计如何与其它设计如裂区设计、嵌套设计等结合?,参考文献,1.方开泰(2002),马长兴,正交设计与均匀设计,科学出版社。2.方开泰,马长兴,李久坤(1999)。正交设计的最新发展和应用(1)-(5),数理统计与管理.3.项可风,吴启光(1989),试验设计与数据分析,科学出版社。,Thank You!,