DPS应用(5、专业试验统计).ppt
第五章 专业试验统计,一、生物测定,生物测定,又称为半数效量,是生物、医学研究中最普遍的一类实验,通常包括供试因子(如化学或生物性杀虫剂、杀菌剂、除草剂、植物生长调节剂、新医药、保健品或可能具有某种活性的物质或产品)和受试靶体(如一种昆虫、植物或小白鼠之类的实验动物)。这类实验有定性与定量水平之分。定性测定较为简单,如仅测定某种微生物是否对某种动物有致病性,其结果仅仅回答是或非两种可能;定量测定则较为复杂,通常包括供试因子的一系列剂量,每剂量要处理合理数量(越多实验误差越小)的受试靶体并且整个实验要持续观察一段时间。,一、生物测定,定性数据概率分析例:根据甘蔗工业科学研究所用农药液剂、烟草粉肥皂液和烟脉肥皂液三种药液对棉蚜进行毒力测定的数据(王鉴明,1985),进行机值分析并检验三种毒力回归直线的平行性。数据编辑格式:第1列为农药药剂(依次从1,2,)编号、第2列为农药处理浓度,第3、4列分别为供试虫数和死亡虫数。定义数据块。,一、生物测定,定义数据块选择“专业统计生物测定计数型机值分析”,一、生物测定,定性数据概率分析系统提示确认浓度是否经过对数转换。如果已经转换则按“Y”再回车,若没有转换则直接回车。然后,根据系统提示输入待求的致死剂量效应指标,致死剂量可同时输入10、50、90 等,各值间用空格隔开,再按回车。如果直接回车,系统将取默认值LD50、LD95。回车后可立即得到回归独立曲线图和分析结果。,一、生物测定,结果分析解释 拟合程度卡方值及其显著水平。如显著水平大于0.05,则表明所建立的毒力回归曲线模型是合适的,即否定所求模型异质性的假设;反之,则认为所建立的模型不合适。,本例中三种农药各自的概率分析模型的拟合度以第一、二个较差,第三个较好,卡方检验x2值分别为36.63,140.35和5.82。,一、生物测定,对多种药剂进行机值分析并检验毒力回归直线平行性。可以其方差分析结果推断:当方差分析表中的F 值的显著水平小于等于0.05 时,表明毒力回归直线互相不平行。本例中,害虫对三种农药反应的差异极显著(F=10.522,大于Fa=0.01=8.05),所以这三条回归线的斜率不同,即不存在共同斜率。,上述方差分析只能揭示毒力回归直线的总的趋势,而两种药剂其致死剂量之间的差异,DPS系统则采用致死剂量比率测定方法来检验:当致死剂量比率的95%置信区间包含1,则两种药剂的某致死剂量之间的差异不显著。注意:有时因异质因子较大,计算的置信限会溢出,以致于不能给出其置信区间。,一、生物测定,定量数据概率分析数据编辑格式是每一个浓度在一行中按浓度和死亡(抑制)率顺序填入。对多种药剂,且每种药剂有几个剂量水平处理的试验结果进行机值分析时,数据编辑格式为:第1 列为药剂(依次从1,2,)编号,第2列为药剂浓度,第3 列为死亡(抑制)率。,一、生物测定,定量数据概率分析定义数据块后,选择“专业统计生物测定数量型机值分析”,系统提示确认浓度是否已经过对数转换。如果已经转换则按“Y”再回车,若没有转换则直接回车。此后,系统再提示用户输入待求的致死剂量效应指标。致死剂量可同时输入10、50、90 等,各值间用空格隔开,再按回车。如果直接回车,系统将取默认值LD50。回车后瞬即得到分析结果。,一、生物测定,分析结果解释 毒力回归方程方差分析F 值及其显著水平:数量型数据毒力回归方程诊断采用方差分析方法进行,这是数量型资料和计数资料在生物测定分析进行模型诊断方面的差异。当F 值的显著水平小于等于0.05 时,表明了所求的毒力回归曲线是合适的;反之则表明所建立的模型不合适。,对多种药剂进行机值分析,DPS系统采用致死剂量比率测定方法来检验两种药剂在致死剂量方面的差异:当致死剂量比率的95%置信区间包含1,则两种药剂的某致死剂量之间的差异不显著。,一、生物测定,时间-剂量-死亡率模型分析对于包含供试品剂量和受试生物在试验期间死亡(反应)率的生测数据分析,一般用概率分析的方法,即将累计死亡率进行概率值转换后分别对剂量或时间作线性回归分析,通过回归参数的估计而建立直线回归模型,从而估计剂量效应(如LD50)或时间效应(如LT50)。但这样的分析方法导致时间与剂量的效应相互分开,无法使所建模型充分体现实验数据的完整性。因此,有必要将时间和剂量的效应统一到同一个模型中来。时间-剂量-死亡率(time-dose-mortality,缩为TDM)模型就是这样的模型,按其数学结构又称互补重对数模型(complementary log-log model),简称CLL 模型。,一、生物测定,时间-剂量-死亡率模型分析如:用乙酰甲胺磷的5 个浓度处理西红柿上某害虫。处理后试虫死亡过程缓慢,故适合用TDM 模型分析数据。分析前,先将数据编辑定义。其数据编辑和存放格式为:数据块第一列为供试药剂的浓度,以后各列为用药后不同时间的试虫存活数。然后执行“专业统计生物测定时间剂量死亡率模型”功能项,一、生物测定,输出结果包括:模型系数的协方差矩阵;所求系数即各参数的估计值、参数标准误、t 测验值、显著水平;模型拟合值、残差、标准残差。,结果表列中有些行显示“数据不合理,未进行处理”的字样,这主要因为在最高剂量下试虫在整个实验观察完成前的数个时间区间已经全部死亡,即累计死亡率在前一个时间区间已达100%,此后各时间区间的条件死亡率在数学上无法计算(0/0)。每当这种情况出现时,DPS系统自动将该数据视为无效,但截至前一时间区间的拟合仍然有效,并且不影响其余各剂量数据的继续拟合。,结果中,如果皮尔逊卡方检验能通过,即其显著水平大于等于0.05,则模型的拟合效果很好。而实际上,一般皮尔逊卡方检验不能通过(显著水平小于0.05),这表明模型异质性的假设成立。但Nowierski 等提出用Hosmer 和Lemeshow 改进的方法进行拟合度测验,如Hosmer-Lemeshow 检验的卡方值的显著水平大于等于0.05,则可认为数据拟合是成功的。,新引入、新育成的品种或品系,在大面积推广之前,都需要经过区域试验,来鉴定其产量水平和适应性,为其推广和合理利用提供依据。区域试验中需要研究的主要效应有:品种效应,即品种的产量或品质效应,因区域试验中供试品种是一定的,故品种效应是固定型效应;地区效应,即地区之间土壤类型、耕作制度、生产水平和管理方法等可以预见的环境差异对品种的影响效应,一般亦属固定型效应;年际效应,即不同年份的温度、雨量、偶然性灾害等难以预知的随机性环境差异对品种的影响效应,一般属随机型效应;品种地区的互作效应,即研究品种对于可预知的环境差异是否具有特殊的适应性,若品种与地区互作效应显著,说明品种对地区有特殊适应性,反之则说明适应性广泛,故该互作效应一般亦属固定型效应;品种年份的互作效应,反映品种对难以预测的环境差异是否有特殊适应性,一般属随机型效应;品种地点年份的互作效应,反映品种与地点的互作效应是否随难以预知的环境变化而改变,因此该效应属于随机型效应。,二、品种区域试验,二、品种区域试验,评定一个品种的应用价值,主要考虑以下三个效应值:品种效应;品种地区点的互作效应及方差;品种年份的互作效应及方差。品种效应显著而互作效应小的品种是具有广泛适应性的丰产型品种,适于大面积推广;而互作效应显著的品种具有特殊适应性(如对环境条件有特殊要求),只能在特定地区推广才能发挥增产作用。,(一)一年多点试验稳定性分析,例如,对5个品种5个地点的品种区域试验结果进行稳定性分析,得到的结果如图。分析时按图中的阴影部分编辑并用鼠标选中待分析的数据。然后执行“专业统计品种区域试验 品种稳定性分析”功能,这时系统会要求你输入地点数、品种数(这里分别是5、5)。输入后系统立即给出George C.C.Tai 模型的品种稳定性分析图。,(一)一年多点试验稳定性分析,i用以量测第i 个品种对环境效应的线性响应,而i是表示以误差均方为单位的线性回归离差。此图表示与的分布图。图中两条正交轴分别以、值表示,如果i=0为真,那么将有95的 落在双曲线内。第一、二条垂直线是0=1时90置信区间的上、下限,若途中还有其余垂直线则是0 1时的置信上限。这些直线把、区分成不同的稳定性区域。从图中各个品种分布位置可以看出,供试品种3 表现最稳定,其次是品种1 和品种4;而品种2 的稳定性最差。,(一)一年多点试验稳定性分析,结束图形分析,返回到编辑状态,则可得到几种方法的稳定性分析结果。分析结果的第一部分是各个试验点误差均方的同质性检验。一般要求是卡方值较小,概率p 值大于0.05。本例中的p=0.7717,表明各个试验点的误差均方是同质的,可以进行进一步分析。随后,系统给出了各个试点、品种的均值,并给出了各个试点参试品种的方差分析结果和几个试点的联合方差分析结果。从这里可以初步分析各个试点各个品种的表现情况,以及他们的综合表现情况。,(二)一年多点区域试验的统计分析,例如,在4 个地点进行6 个品种的区域品种比较试验,每个地点2 个区组,获得一组试验资料。现对该试验资料进行一年多点试验的方差分析,分析前先按下图方式输入、编辑数据:,(二)一年多点区域试验的统计分析,或者,按如下格式编辑定义数据块。定义数据块后,选择“专业统计品种区域试验一年多点”分析项,即可得到分析结果:,(二)一年多点区域试验的统计分析,(三)多年多点品种区域试验的统计分析,品种区域试验常常需要在多个地点连续进行数年,以便为品种的评定和应用提供更广泛的信息,尤其是品种对不同年份随机变化的气候条件适应性的信息。按地点、品种、区组顺序输入试验数据并按规定格式编辑和定义数据块,系统执行运算后,将输出计算结果。输出结果包括双向列表、方差分析表、f 统计量、多重比较和稳定性分析结果以及最后的综合评价。,(三)多年多点品种区域试验的统计分析,如有5 个玉米品种在4 个地点连续进行了3 年试验,每次试验设2 个区组。试验数据按图格式输入并编辑定义成数据块,注意地点、品种、年份、重复的排列格式。进入专业统计菜单,选择“品比试验多年多点”项,按提示输入各参数后回车执行运算,分析结束时输出如下结果:,(三)多年多点品种区域试验的统计分析,(三)多年多点品种区域试验的统计分析,(四)品种区域试验AMMI 模型分析,作物品种区域试验旨在鉴定品种的丰产性、稳定性和适应性。参加区试的品种在不同地点的产量往往表现不一致。这表明品种的基因型和环境互作(ge)效应的存在。以往对这种互作效应大多采用线性模型进行分析,但线性模型一般仅能解释很少一部分交互作用的变化。近年来一种更为有效的加性主效应乘积交互作用(AMMI)模型已开始被用于多年多点的区域试验资料的分析。该模型与方差分析模型、线性回归模型相比,应用范围更广且更有效。AMMI 模型的分析结果可以用直观简洁的图形表达和解释。AMMI 分析不仅可以对品种进行更可靠的稳定性分析,而且可以鉴别一些具有特殊品种基因型和环境(ge)互作效应的基因型,为针对某一特殊环境的特殊适应性的品种的育种提供有价值的信息。该模型的主要特点是将方差分析和主成分分析有机地结合在一起。,(四)品种区域试验AMMI 模型分析,DPS平台的数据格式及其编辑数据存放格式要求以行代表环境(地点),以列代表基因型(品种),按试验地点的顺序,输完一个地点的数据后再输下一个。若一个品比试验有e 个地点、g 个品种、r 个区组(重复),其资料整理排列顺序如下表。,(四)品种区域试验AMMI 模型分析,(四)品种区域试验AMMI 模型分析,应用示例假设对3 个品种在3 个地点、4 次重复的品种比较试验中获得的资料,进行AMMI 模型分析。按右图格式输入数据并编辑定义成数据块。选择专业统计品比试验有重复AMMI 模型分析项,系统给出AMMI 模型分析图形界面,其中包括双标图分析(图1)、品种适应性分析(图2)和各品种AMMI 排序分析(图3)。,(四)品种区域试验AMMI 模型分析,图1,解释AMMI1双标图的原则:在水平方向,品种和地点的分布范围表明相应的主效应。在垂直方向,如果以 IPCA1=0 作一条水平线,则品种与同在此水平线一侧的地点有正的互作,与另一侧的地点的互作则为负。靠近水平线的品种为较为稳定的品种。所以,高产稳产的品种对应最右边且靠近水平线的品种图标。,图1 AMMI 双标图其纵、横轴都是平均产量、离差、IPCA1(主成分分析)、IPCA2 和IPCA3,用户可以指定任意两个变量,作出双标图。双标图有助于揭示品种和环境之间的相互关系。AMMI 双标图是以品种和地点的主效应值或平均产量为x 坐标,y 坐标为品种和地点的IPCA1 值所作的图形。这一双标图同时表达了品种的丰产性和GE 交互作用的信息。,(四)品种区域试验AMMI 模型分析,图2,图2 AMMI 品种适应图忽略地点主效应,用品种主效应和IPCA1 值估计品种的产量。这里不需要考虑地点效应是因为它只是将产量直线沿着产量坐标一块移上或移下,而我们只对每一地点所处最高的直线感兴趣。这样,每一品种对应一条直线,在同一图上画出所有品种对应的直线,并在x 轴内侧上标出的是参试地点代码,则处于最上端的折线对应的品种即为有最佳适应性的品种。本例中,从产量水平角度来看,在参试地点环境范围内,V1 和V3 两个品种表现较佳。,(四)品种区域试验AMMI 模型分析,图3,图3 AMMI 排序图以品种的平均产量为x 轴,以IPCA1为y 轴。当指定某一品种后,作出通过该点的两条曲线,这时通过它们的空间位置可以分析其品种特性:即指定品种特性优于那些落在它左边的品种,如该图表示品种V1 好于V2。,(四)品种区域试验AMMI 模型分析,应用示例图形分析完成后,获得如下输出结果:平均产量两向列表(列表示品种,行表示地点);离差两向列表(列表示品种,行表示地点);各种方差分析表:品种试验方差分析表,品比试验结果线性回归分析模型方差分析表,品比试验结果AMMI分析;品种和环境各个变量的平均值、离差、主成分值及特征向量;AMMI模型拟合两向列表(列表示品种,行表示地点环境)。,(四)品种区域试验AMMI 模型分析,无区组品比试验的AMMI 模型分析当参与区试的品种没有设置区组时,品比试验的AMMI 模型分析步骤如下:数据编辑格式:以行代表环境(地点),以列代表基因型(品种),按试验地点的顺序,输完一个地点的数据后再输下一个地点的数据,在一个地点中依次输入各品种的数据。定义数据块,(四)品种区域试验AMMI 模型分析,无区组品比试验的AMMI 模型分析当参与区试的品种没有设置区组时,品比试验的AMMI 模型分析步骤如下:进入专业统计菜单,选择“品种比较试验无重复AMMI 模型分析”功能项,按系统提示输入试验点数(E)、试验品种数(G),然后运行并输出分析结果分析结果包括各方差分析表、品种和地点的两向列表、各个阶次AMMI 模型预测估计值等。,王宏富(1962-),男,山西晋城人,教授,硕士生导师,作物栽培与耕作学系主任。中国耕作制度研究会理事,山西省质量技术监督局农业标准专家组成员,山西省作物学会理事。1984年毕业于山西农业大学,后留校任教,主要从事作物化控与逆境生理、农田杂草与防除、计算机在农业中的应用、农业结构调整等方面的教学与研究工作,为博士、硕士和本专科生主讲旱地农业专题、高级耕作学、农业传播技术与应用、农学概论、计算机在农业中的应用、杂草学、水土保持农学、无公害农产品生产技术等课程。主持和参加国家“948”项目、教育部项目、省攻关项目、省自然基金项目、省开发项目与教学项目等多项,获省级研究成果一等奖1项、二等奖4项、三等奖1项;国家级出版社出版专著1部、21世纪教材1部(副主编)、国家统编教材1部(副主编)、十一五教材1部(副主编)、参编十一五教材1部,在国内外专业刊物上发表了学术论文30余篇。,