正交设计与统计分析.ppt
《正交设计与统计分析.ppt》由会员分享,可在线阅读,更多相关《正交设计与统计分析.ppt(58页珍藏版)》请在三一办公上搜索。
1、医学统计学,正交设计与统计分析,张丕德,广东药学院2008年12月9日,概述,所有的试验设计方法都建立在一定的数学模型下,一个好的试验设计方法,能够在相应的模型下,有最好的(或优秀的)表现:(1)参数可以估计,(2)当试验数n 固定时,参数估计的方差达到最小等。试验设计的目的:应用统计方法对试验因素作合理的、有效的安排,最大限度地减少试验误差,使之达到高效、快速和经济的目的。正交试验设计是试验设计中最重要的方法之一,它能用少量的试验,提取出丰富的信息。,概述,正交试验设计是利用“正交表”进行科学地安排与分析多因素试验问题的设计方法。其主要优点是能在很多试验方案中挑选出代表性强的少数几个试验方案
2、,并且通过对这少数试验方案的试验结果的分析,推断出最优实验方案,同时还可作进一步地分析,得到比试验结果本身给出的还要多的有关各因素的信息。正交设计已有几十年历史,在我国普及使用始于上世纪六十年代末期,正值困难时期,七十年代达到高潮,目前已是科学试验最常用的方法,包括社会科学也在应用。,概述,本讲座首先从正交设计的实例分析入手,再逐步叙述正交设计的一些原理和注意的问题。有些内容还是目前正在研究的热点。不管是非统计专业人员,还是统计工作者,以下知识对恰当地应用正交设计都有重要的启发。,讲座内容,正交表的特征,正交表的特点 正交表是一套规格化的表格,是正交试验设计的基本工具。正交表,L是表示正交表的
3、记号,n表示正交表的行数,也是需要作的试验次数;r表示正交表的列数,也是该表最多能安排的因素个数,其中包括交互作用和误差;p表示表中数码个数,也是各因素的水平个数。下面以正交表和正交表为例,说明正交表的构造特点。,正交表,正交表,正交表的特征,特点:正交表中任意一列中,不同的数码出现的次数相等,这一性质表明正交表具有均衡分散性;正交表中任意两列,把同行的两个数码看成有序数对时,所有可能的数对出现的次数相同。这一性质表明正交表具有整齐可比性,也称为正交性。2.选用正交表与表头设计:在多因素的试验中,除了各个因素对指标的单独影响外,还存在着因素间的联合作用,即交互作用。两个因素间的交互作用称为一级
4、交互作用,如因素A和因素B间的交互作用记为AB;三个因素间的交互作用称为二级交互作用。三阶以上的交互作用很少出现或一般不考虑。,正交试验设计的直观分析法,例1 用正交试验设计优化四物汤提取工艺条件(无交互作用)。(1)明确试验目的,确定试验指标、选定因素和水平:为提高药材提取率,优化多糖提取工艺,以药材中多糖含量为试验指标。根据研究实践主要影响四物汤多糖提取率因素是回流提取时间A、加入水量B、提取次数C三个因素,每个因素选取3个水平,具体数据如表1。,表1 试验因素、水平表,正交试验设计的直观分析法,(2)选用正交表,作表头设计。因考察三因素三水平,所以,选用正交表 来安排试验,将三因素A、B
5、、C分别放在表的前三列上;(3)按正交表的安排方案进行试验,并将结果记在表中最后一列;(4)直观分析。首先计算各个因素各个水平下的结果之和,用 表示,求出各个水平的平均值,用 表示。如果结果以大为好,平均值越大,说明该水平比其它水平优,通过平均值可以选择每个因素最优的试验水平;各因素最优水平组合在一起就是最佳试验方案。,正交试验设计的直观分析法,表2 四物汤提取工艺条件的试验安排及数据计算表,16.25 21.40 17.33,23.01 20.53 22.67,23.41 20.75 22.68,7.16 0.87 5.35,正交试验设计的直观分析法,用各个因素水平中的最大的平均值减去最小的
6、平均值的差值称为该因素的极差,通常用表示第j列因素的极差,因素极差越大,说明因素水平(各因素水平相同时)的改变对试验结果影响也越大,所以,极差的大小反映了因素对试验指标影响的程度。可以通过比较极差大小排定因素对试验指标影响的顺序。比较极差,最大,故因素A对试验结果影响最大,其次是C和B,所以因素对多糖含量指标影响大小排序为:再比较各个因素水平的平均值,以A因素为例,在第1水平下所做试验的综合平均值为:,正交试验设计的直观分析法,同理;比较,由,从而得 水平最优;B因素对提取效果影响不大,考虑最小的溶媒用量可以节省浓缩时间,所以B 因素的最优水平选取 水平;C 因素水平中综合平均值最大的是,但
7、和 之间差异很小,考虑生产实际情况,选取水平 作为C因素的最优水平;确定四物汤中多糖提取的最佳试验方案为,即提取2次,时间为1h,溶媒用量为10倍量。最优方案往往未必出现在试验中,试验只提示最优方案的方向。为了确定 是否是最佳方案,可对该方案追加试验,考察效应是否稳定,如果重复试验的均值的确是最优的,就确定。,正交试验设计的直观分析法,为了更直观的观察,将各因素的指标数据绘成图,把因 素作为横坐标,指标作为纵坐标,从图中可以分析因素 对试验指标影响次序和每个因素的最优水平,见图1(a),(b),(c)。优点:简单易操作,可以初步看出效应随各因素水平变化的规律。缺点:不能判断差异的显著性,容易把
8、无差异的因素保留,甚至把无意义的试验方案当做最优设计。,图1(a)图1(b)图1(c),正交试验设计的直观分析法,如果试验者对响应和因素间的关系已有一些认识,可以猜出效应与因素间的回归模型,这时回归分析应建立在试验者提供的先验模型上。同时,也可用二次回归模型来拟合,最后比较二次模型和先验模型的效果,以决定何者最优。,正交试验设计的直观分析法,例2 用有机溶液提取某中药的有效成分,欲寻找浸出率的影响因素和适宜水平(有交互作用)。选取因素及水平如下:因素A 溶液浓度:;因素B 催化剂的量:;因素C 溶剂的PH值:;因素D 温度:。需要考虑因素间的交互作用AB,AC,BC。试用正交试验直观分析法对结
9、果进行分析。,正交试验设计的直观分析法,本例试验目的在于寻找提高浸出率的条件,故以浸出率(%)为试验效应指标。要求考察4个因素A,B,C,D及其交互作用AB,AC,BC,每个因素选取2个水平。可选择 表,将A,B,C,D及其交互作用AB,AC,BC分别置于表的1,2,4,7,3,5,6列中见表3。,312 320 334 306 318 318 316,320 312 298 326 314 314 316,78 80 83.5 76.5 79.5 79.5 70,表3 例2中考虑有交互作用的试验安排及数据计算表,正交试验设计的直观分析法,由表12,各因素及其交互作用对试验结果影响大小的排序为
10、:AB C D 可见交互作用 AB 对试验结果影响最大,它比因素 A 和因素 B 对试验结果的独立影响都大,所以,在这种情况下,因素 A 的最优水平和因素 B 的最优水平搭配组合,并不一定是最优的试验组合,需要根据两因素各个水平组合下试验的平均结果来决定 A 和 B 的最优组合。A和B各水平组合的试验结果的均值见表4。,表4 A和B的二元表,A1,A2,正交试验设计的直观分析法,由表4,可得 和 组合下结果最优。考虑到 更省,选择组合;交互作用 AC 和 BC 作用较少,可不考虑;根据因素 C 的平均值选取 为最优水平;因素 D 影响最小,为了节省能源,选取 为最优水平;所以,考虑交互作用的最
11、佳试验方案为。即溶剂浓度取70%,催化剂的量取0.1%,溶剂pH值取7.2,温度取 进行试验,对该方案追加试验,再确定是否最优。,正交试验的方差分析法,正交设计立足于方差分析模型。例如,若有三个因素A,B 和C,每个因素取了三个水平,且因素间没有交互作用,相应的统计模型(加法效应)是 其中,为总平均效应,主效应满足:如考虑因素有一级交互作用,则统计模型为 其中,。,正交试验的方差分析法,(1)总离差平方和的分解:例2中有8次试验,结果为。则总离差平方和为:分解公式为:其中 是正交表 中第j 列因素的离差平方和。例2中A,B,C,D及交互作用AB列的离差平方和,依次为。,正交试验的方差分析法,(
12、2)计算各因素离差平方和:根据方差分析中组间离差平方和计算公式可推出 的计算公式。如:对于任何2水平的正交表,一般有:其中m表示第j列中因素“1”水平出现次数。n为试验总数。对于任何3水平的正交表,可将推广为:其中m为第j列因素“1”出现次数,n为试验总数。,正交试验的方差分析法,(3)误差平方和等于正交表中空白列的离差平方和之和,所以,在用方差分析的方法分析试验结果时,必须留有空白列,空白列也称为误差列。(4)确定各个因素离差平方和的自由度。正交表中总离差的自由度等于试验次数减1;正交表各列的自由度也是这个列上所安排的因素的自由度等于数码数减去1;正交表交互作用的自由度等于两个因素的自由度之
13、积。所以,误差的自由度等于总的自由度减去所有考察的因素和交互作用的自由度。如上例中:;,正交试验的方差分析法,(5)进行F检验 代入样本值,列出方差分析表,按F检验可以判断有关因素是否有显著性影响。注意两点:第一,两因素交互作用的自由度等于两因素的自由度之积,这样,有时交互作用不止占有一列。如用表 安排试验,因素的自由度都等于2,必须占有两个列,交互作用自由度是4,而每个3水平列只提供2个自由度,所以交互作必须占两个列,表头设计如表5。第二,对结果影响不显著的因素的离差平方和可以合并到误差平方和,以提高检验精确度。,表5 用正交表,安排试验的表头设计,正交试验的方差分析法,例3 将例2结果作方
14、差分析。只考虑AB的交互作用。(1)计算离差平方和及其自由度 由公式 算得:将计算结果列于表10-10中。,正交试验的方差分析法,(2)作F检验,列出方差分析表6:(3)分析结果。选取最佳试验方案:由表6可知,AB最显著,由A和B的二元表,取;其次为C,再由,故取;D不显著,可任取。确定最优试验方案为。,表6 例3的方差分析表,回归分析法,例4 用正交试验法优选中药半枝莲提取工艺。中药提取工艺筛选试验中常用化学法、生物学法以及有效出物综合评价法,用一种评价指标筛选提取工艺条件往往不够全面,所以,选择醇锓膏得率、总黄酮和野黄苓苷提取率为评价指标,用表来安排试验。所选因素水平见表7:表7 例4的因
15、素和水平表,回归分析法,将所选因素和水平安排在表的1、2、3列中,表头设计及结果列于表8中。,回归分析法,1.直观分析影响大小排序:ABC,确定最佳方案:。如为节省时间、能源,也可采用。2.方差分析模型参数估计法 将各因素作为分类资料划分水平,经伪变量变换,进行回归分析,估计各参数:,=55.72,,=-18.29,,=14.71,,=18.29-14.71=3.58,13.84,,0.71,,=-13.84-0.71=-14.55,1.64,,-2.82,,-1.64+2.82=1.18,决定系数,=0.98,,回归分析法,检验结果:A因素各水平有显著差异,主效应大小顺序为,第2水平作用最大
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 正交 设计 统计分析
链接地址:https://www.31ppt.com/p-5776658.html