欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第九章 数值变量的统计分析下课件.ppt

    • 资源ID:1876568       资源大小:2.22MB        全文页数:150页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第九章 数值变量的统计分析下课件.ppt

    第二节 正态分布参考值范围的估计 一、 正态分布的概念和特征,(一)概念:正态曲线呈对称钟形,均数所在处最高,两侧逐渐下降,两端在无穷处与横轴无限接近。,二、标准正态分布(u 变换)将每个 x 值转变成 u 值使均数为 0( =0 ),标准差为 1( =1 ),则 正态分布 N ( , ) 标准正态分布 N( 0 ,1 ) (u分布),(二)正态分布的特征 1、正态曲线在横轴上方,且均数所在处最高; 2、正态分布以均数为中心,左右对称; 3、正态分布有两个参数 N( ), 4、正态分布的面积分布有一定的规律性.,正态分布的图形由两个参数决定: 位置参数 (总体均数) 变异度参数 (总体标准差),1、 越大,曲线沿横轴向右移动;反之 越小,则向左移动。 2、 越大,数据越分散,曲线越“ 矮胖” ; 越小,表示数据越集中,曲线越“ 瘦高”。,(4) 正态曲线下面积分布规律 a.正态曲线与横轴间的面积为 1 或 100%b.以均数为中心,正态曲线下对区间面积相等。c.在 范围内的面积占 68.27% 在 范围内的面积占 95% 在 范围内的面积占 99%,在 范围内的面积占 68.27%在 范围内的面积占 95%在 范围内的面积占 99%,在正态曲线下面积分布有一定规律,其分布可通过其密度函数积分求得:为了免去计算的麻烦,统计学家已编制出标准正态分布曲线下的面积(表9-8,P299),应用时应注意:(1)如u已知,可直接查表。(2)如u未知,先按 求出u值,再查表。(3)表中只列出负值,如果u为正值,可按负值查表。,练习1:标准正态曲线下(-1.76,0)的面积占总面积的百分数。练习2:标准正态曲线下(0,1.20)的面积占总面积的百分数。练习3:标准正态曲线下(-1.76,1.20)的面积占总面积的百分数。练习4:试估计成年男子尿酸浓度在300 以下的比例。,练习4:试估计成年男子尿酸浓度在300 以下的比例。(1)先求出u值:(2)查表得: (-1.50)=0.0668,三、参考值范围的估计医学参考值范围:大部分正常人的形态、功能、代谢产物的生理、生化、指标常数。,制定参考值范围的基本步骤: 1、从正常人的总体中抽样,且样本量要足够(通常n100),抽样遵循随机化原则; 2、控制测量误差 3、判定是否需要分组确定参考值范围。,4、决定取单侧还是双侧。该指标过大过小均为异常 双侧该指标仅过大或过小为异常 单侧5、选定合适的百分界限(常用95%),5、选定合适的百分界限(常用95%),6、根据资料的分布类型选定适当的方法进行参考值范围的估计。 正态分布资料 正态分布法 对数正态分布资料 对数正态分布法 偏态分布资料 百分位数法,为可信度:如制定95%参考值范围:则=0.05 制定99%参考值范围:则=0.01U可通过查表求得如:双侧的U0.05=1.960 , U0.01=2.576 单侧的U0.05=1.645 , U0.01=2.326,例9-11 利用表9-1的资料求95%的参考值范围,例9-12 利用表9-7的资料计算7岁男童血铅95%的参考值范围,练习:公共汽车的车门高度是根据正常成年男子的身高来制定的,如正常成年男子的身高均数为170cm,标准差为10cm,今欲要求有99%的成年男子上车时不会碰到头,车门高度应为多高。,第三节数值变量资料的统计推断,学习要点:,1.掌握均数的抽样误差与标准误的概念;2.了解t分布的概念与特征;3.熟悉总体均数的区间估计;4.熟悉假设检验的基本原理和步骤;5.掌握t检验和u检验的方法;6.了解两类错误和假设检验的注意事项。,一、均数的抽样误差与标准误,一、均数的抽样误差统计推断(statistical inference) 用样本的信息推论总体的特征。 参数估计统计推断 假设检验,14岁女生 (身高),120人,均数的抽样误差-由于抽样造成的样本均数与总体均数、样本均数之间的差异。,样本1,样本2,样本k,总体均数,根据中心极限定理:,1 .从正态总体中抽样,抽取样本含量为n的样本,样本均数 服从正态分布。即使是从偏态总体中抽样,在样本含量足够(n50)大时, 也近似正态分布。2.从均数为 ,标准差为 的正态或偏态总体中抽样样本例数为n的样本,新样本组成的数据中,样本均数为 ,标准差,标准误:样本均数的标准差。,反映各均数间的离散程度。,标准误 的意义: 描述抽样误差的大小, 越小, 说明抽样误差越小,样本均数越接近总体均数,用 代表 的可靠性越高。,标准误的计算(P300)均数的标准误,以某地14岁健康女生身高的标准差5.30cm及每个样本包含的例数10代入公式9-18,求得,应用时,用样本标准差 来代替总体标准差 ,则标准误的估计值为:?减少抽样误差的有效途径,均数标准误的用途:可用来衡量样本均数的可靠性。与样本均数结合,可用于估计总体均数的置信区间;可用于进行均数的假设检验。,S 与 的区别与联系:1、区别2、联系标准误和标准差成正比,和样本含量的开方成反比。,二、 t 分布u 变换(将正态分布转化为标准正态分布) t 变换,全国14岁女生(身高),(t 分布),(u 分布),t 分布特征: (1) 单峰分布,以0为中心左右对称。 (2) t 分布是一簇曲线,其形状受的影响。,t 分布与标准正态分布(u 分布)区别: * t 分布曲线峰部较矮,尾部稍翘。 * n(自由度 )越大,t 分布与u 分布 越接近;当 时, t 分布=u 分布。,t界值表:(表9-9 P302),t界值表的特征: 自由度相同时 越大,概率P越小; 双侧概率P为单侧概率P的两倍。,自由度为 ,概率为 (检验水准)时, t 的界值记为 。,t 界值表的查法: =? 通常取0.05或0.01,( t 越大,概率 P 越小),2.262,3.250,1.96,2.58,当n50,为大样本( t 分布= u 分布),可用 来代替,三、 总体均数的置信区间估计 统计描述统计分析 参数估计-用样本指标估 统计推断 计总体指标 假设检验,点估计-用 估计参数估计 区间估计-按一定的概率估计总体均 数落在某个范围,这个范围称之为: 总体均数的置信区间 CI ,为开区间用()表示。如(140.2,144.3),说明总体均数在140.2144.3之间,但不包含上限(144.3)及下限(140.2)两个值。,总体均数置信区间(可信区间)的计算2)小样本或 未知-按 t 分布,总体均数置信区间(可信区间)的计算2)小样本或 未知-按 t 分布 95%置信区间 99%置信区间,总体均数置信区间(可信区间)的计算1) 已知 95%置信区间 99%置信区间,总体均数置信区间(可信区间)的计算3)大样本-按u 分布 95%置信区间 99%置信区间,例9-13 随机抽取某地健康男子20人,测得该样本的收缩压均数为118.4mmHg,标准差S为10.8mmHg,试估计该地男子收缩压总体均数的95%置信区间。,此为小样本,应按 t 分布。收缩压过高过低均为异常,故取双侧。95%置信区间: 代入数据 () 即(113.3,123.5),置信区间的两个要素:,1.准确度:反映在的大小上。2.精确度:反映在区间的长度上。在样本含量一定的情况下二者是矛盾的。常用的95%置信区间。,均数置信区间与参考值范围的区别 95%置信区间: 从 至 范围有95%的可能性包含了总体均数。95%正常值范围: 一组观察值中,有95%个体(频数)的观察值在 至 范围内。,四、假设检验的基本思想和步骤,(一)假设检验的基本思想利用反证法的思想,例9-14 某地抽样调查了280名健康成年男性的血红蛋白含量,其均数为136.0g/L,标准差为6.0g/L。已知正常成年男性血红蛋白的均数为140.0g/L。试问能否认为该地抽样调查的280名成年男性的血红蛋白含量与正常成年男性的血红蛋白含量的均数不同?,差异的原因: (2)由于抽样误差造成的.(实际上 ,但由于抽样误差 不能很好代表 )(1)该地成年男性的血红蛋白含量与正常成年男性的血红蛋白含量的均数不同( ),0 =140.0g/L,n=280,=136.0g/L S=6.0g/L,已知总体,未知总体,(二)假设检验的基本步骤,1、建立假设,确定检验水准 H0:(无效假设),= 0,H1:(备择假设)0检验水准的意义及确定,2、选定检验方法,计算检验统计量3、确定P值,作出推断结论P值:在H0成立的情况下,获得比现有统计量更极端的概率。,(推断的结论统计结论专业结论),P0.05,按 检验水准,不拒绝H0,差异无统计学 意义(差异无显著性),还不能认为不同或不等。 P0.05 ,按 检验水准,拒绝H0,接受H1, 差异有统计学意义(差异有显著性) ,可以认为不同或不等,谁高谁低。 P0.01,按 检验水准,拒绝H0,接受H1, 差异有高度统计学意义(差异有高度显著性) ,可以认为不同或不等,谁高谁低。,140g/L,假设检验的目的就是判断差异的原因: 求出由抽样误差造成此差异的可能性(概率P)有多大 !若 P 较大(P0.05),认为是由于抽样误差造成的。 原因(1),实际上 若 P 较小(P0.05),认为不是由于抽样误差造成的。 原因(2),实际上 ,单、双侧检验的选择: 1、根据专业知识 事先不知道会出现什么结果 双侧 事先知道只能出现某种结果 单侧 2、问题的提法 P289例9-14 双侧 P382第8题 单侧*通常用双侧(除非有充足的理由选用单侧之外, 一般选用保守的双侧较稳妥),确定P 值: (用求出的t 值与查表查出的t 值比较) 查t 值表:,( t 越大,P 越小),(1) 求出t=1.833,P0.05,(2) 求出t=4.18,P0.01,(3) 求出t=2.96,0.01P0.05 (简写为P0.05),(4) 求出t=3.25,P=0.01,0.05,0.01,3.250,2.262,P0.05,P0.01,P0.05,假设检验的思路是:首先对未知或不完全知道的总体提出一个假设,然后借助一定的分布,观察实测样本情况是否属于小概率事件。一般把概率P0.05的事件称为小概率事件,小概率事件在一次观察中可以认为是不会发生的,如实测样本情况属于小概率事件,则认为原先的假设是错的,拒绝这个假设;如实测样本情况不属于小概率事件,则不拒绝 原来的假设。当然,小概率事件在一次观察中还是可能发生的,若我们恰好碰上,则假设检验的结论就是错误的,不过因为小概率事件发生的概率小,所以犯这种错误的概率也小。,第四节 t 检验和 u 检验,t 检验应用条件: 当n100时,要求样本取自正态分布的总体,总体标准差未知; 两小样本均数比较时,要求两样本总体方差相等( 12= 22)。,一、样本均数与总体均数比较的t检验,(即:样本均数代表的未知总体均数和 已知总体均数0的比较),例9-15 已知某小样本中含CaCO3的真值是20.7mg/L。现用某法重复测定该小样本15次,CaCO3含量(mg/L)分别为:20.99,20.41,20.62, 20.75,20.10,20.00,20.80,20.91,22.60,22.30,20.99,20.41,20.50, 23.00,22.60。问该法测得的均数与真值有无差别?,(1)建立假设、确定检验水准,H0:= 0 即该法测得的均数与真值无差别H1: 0 即该法测得的均数与真值有差别,(2)选定检验方法,计算检验统计量,n=25100,故选用t检验。已知 =21.13,(3)确定P值,作出推断结论 查 t 界值表 为单侧检验,P,t,0.05,0.01,2.977,2.145,P0.05,1.70,P0.05,按 检验水准,不拒绝H0,无统计学意义。尚不能认为该法测得的均数与真值不同。,二、配对设计的均数比较,常见的配对设计主要有以下情形:自身比较:同一受试对象处理前后。同一受试对象分别接受两种不同的处理。 将条件近似的观察对象两两配成对子,对子 中的两个个体分别给予不同的处理。,配对t检验的基本原理: 假设两种处理的效应相同,即1= 2 ,则1-2=0,即可看成是差值的样本均数 所代表的未知总体均数d 与已知总体均数0=0的比较,此时,我们可套用前述t检验的公式。,例9-16 应用某药治疗8例高血压患者,观察患者治疗前后舒张压变化情况,如表9-10,问该药是否对高血压患者治疗前后舒张压变化有影响?,表9-10 用某药治疗高血压患者前后舒张压变化情况,H0: 该药对舒张压无影响。 H1: 该药对舒张压有影响。,P,t,0.05,0.01,2.365,P0.01,4.02,3.499,确定P值,判断结果 自由度n-18-17,查表9-9t界值表,t0.05,72.365,今4.022.365,故P0.05,故按0.05水准,拒绝H0,接受H1,认为差异有高度显著性,可以认为该药有降低舒张压的作用。,三、两个样本均数比较,大样本(n50)-u检验小样本-正态分布资料 t 检验 偏态分布资料 秩和检验,1、两个大样本均数的比较,例9-17 某地随机抽取正常男性新生儿175名,测得血中甘油三酯浓度的均数为0.425mmol/L,标准差为0.254mmol/L;随机抽取正常女性新生儿167名,测得甘油三酯浓度的均数为0.438mmol/L,标准差为0.292mmol/L,问男、女新生儿的甘油三酯浓度有无差别?,建立假设,确定检验水准 H0:12 H1:12 0.05选择检验方法,计算检验统计量u值,(3)查u 界值表(t 界值表中自由度为 的一行 ),u=0.4380.05,按 =0.05水准,不拒绝H0,差异无统计学意义;尚不能认为正常男女新生儿血中甘油三酯浓度均数不同。,2、两个小样本均数的比较,例9-18 两组雄性大鼠分别饲以高蛋白和低蛋白饲料,观察每只大鼠在实验第28天到84天之间所增加的体重,见表9-11 。问用两种不同饲料喂养大鼠后,体重的增加有无差别?,表9-11 用两种不同蛋白质含量饲料喂养大鼠后体重增加的克数,建立假设,确定检验水准H0:12H1:120.05选择检验方法,计算检验统计量t值,确定P 值,判断结果 查表9-9t界值表,t0.05,172.110,今1.8912.110,故P0.05,故按0.05水准,不拒绝H0,尚不能认为两种饲料喂养大鼠后体重的增加是不同的。,P,P=?,t=1.891,P=0.05,t,P=0.01,t=2.110,t=2.898,四、假设检验应注意的问题,1、假设检验应有严格的抽样设计2、要注意选用的假设检验方法的应用条件3、正确区分差别有无统计意义与有无专业上的实际意义4、结论不能绝对化5、假设检验的单侧检验与双侧检验的选择,注意:两型错类和检验效能,型错类:“弃真值”拒绝实际上成立的H0型错类:“存伪值”接受实际上不成立的H0型错类的大小为, 型错类的大小一般较难计算,当n固定时,越大越小,反之亦然。检验效能():若两总体确有差异,有的把握得出差异有统计学意义的结论,型错误和型错误,a,b,减少(增加)I型错误,将会增加(减少)II型错误增大n 同时降低a 与 b,a 与 b 间的关系,思考题:,1、两样本比较作 t 检验,差别有显著性时,P 值越小说明A 两样本均数差别越大B 两总体均数差别越大C 两总体均数差别越小D 越有理由认为两样本均数不同E 越有理由认为两总体均数不同,2、在两样本比较作 t 检验中,无效假设是:A 两样本均数不等B 两样本均数相等C 两总体均数不等D 两总体均数相等E 样本均数等于总体均数,计算题:,1、一药厂为了解生产某药(同一批次)之有效成分含量是否符合国家规定的标准,随机抽取了该药10片,得均数为103.0mg,标准差为2.22mg。试估计该批药剂的有效成分的平均含量,2、通过大量资料得知某地20岁男子平均身高为1.68米,今随机测量当地16名20岁男子,得其平均身高为1.72米,标准差为0.14米。问当地现在20岁男子是否比以往高?3、将钩端螺旋体病人的血清随机分为两组,分别用标准株和水生株作凝溶试验,测得数据如下,问两组的平均效价是否相同?,4、比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料,分别用脂肪酸水解法和哥特里-罗紫法测定,结果见表。问两法测定结果是否不同?,第五节方差分析 (ANOVA),目的要求:1.掌握方差分析的用途、应用条件、基本思想;2.熟悉完全随机设计多个样本均数比较方差分析;3.了解随机区组设计多个样本均数比较方差分析;4.熟悉多个样本均数间的两两比较的检验。,方差分析,方差分析(Analysis of Variance)简写为ANOVA,是由英国统计学家Fisher提出,也叫F检验。,两个均数的比较t检验,u检验多个均数的比较,1.检验次数增多,Why?,2.易犯一类错误,如要进行 5个样本做两两比较, 次比较,如果 ,那么每次不犯一类错误的可能性是(1-0.05)1=0.95,10次不犯一类错误的可能性是(1-0.05)10=0.59,犯一类错误的可能性是1-0.59=0.410.05,显然使犯一类错误的可能性增加了.,方差分析的应用:(1)用于两个或多个样本均数的比较(2)两个或多个研究因素的交互作用(3)回归方程的线性假设检验(4)方差齐性检验,方差分析的应用条件: 1.各样本是相互独立的随机样本 2.各样本都来自正态总体 3.各总体方差相等。,一、方差分析的基本思想,把全部观察值之间的变异总变异,按设计的要求分为两个或多个部分,每一部分有一定意义,其中至少有一部分表示各组均数间的变异,另一部分表示误差。然后再计算变异间的比值F。若F 值接近1,可认为处理因素无作用;若F 值远大于1,且大于或等于F 界值表中的某界值时,可认为处理因素有作用。,复习:方差,差值 -4 -2 0 2 4,总体方差,样本方差,例9-19 用四种不同的饲料喂养大白鼠,每组4只,然后测其肝重占体重的比值(肝体比值%)(见下表)。试比较四组均数间有无差异。,表9-14 四组资料的肝重占体重比值(%)的测定结果,一、方差分析的基本思想,从以上资料可看出,四个组的16个数据各不相同,这种变异称为总变异,反映了个体变异和测量误差(随机误差)和处理因素的共同作用,可以分解成两部分:即,(1)组间变异:四组肝体比值均数各不相等(此变异反映了处理因素的作用,以及随机误差的作用 ),(2)组内变异:各组内部大鼠的肝体比值各不相等(此变异主要反映的是随机误差的作用),各部分变异的计算:,总变异(全部数据大小不等)用总离均差平方和 来表示。,表9-14 四组资料的肝重占体重比值(%)的测定结果,组间变异(由于所接受的处理因素不同而致各组间大小不等)用组间离均差平方和 来表示。,表9-14 四组资料的肝重占体重比值(%)的测定结果,组内变异(同一处理组内部试验数据大小不等)用组内离均差平方和 来表示。,三个变异之间的关系:,其中:,变异度除与离均差平方和的大小有关外,还与其自由度有关,由于各部分自由度不相等,因此各部分离均差平方和不能直接比较,须除以相应的自由度,该比值称均方差,简称均方(MS)。 。,方差分析的基本思想: 组内变异 组间变异,总变异,(各组内部数值大小不等)它反映了的肝体比值随机误差。,(各组间样本均数大小不等)它反映了饲料对体比值的影响,也包括了随机误差。,处理因素的影响,F= =,组间变异,组内变异,饲料对肝脏系数影响所致的变异+随机误差引起的变异,随机误差引起的变异,假如 饲料对肝脏系数无影响(即处理因素不起作用),则在理论上,F=1。由于抽样误差的影响,F值往往并不恰好等于1,而是近于1。反之,若饲料对肝脏系数有影响,组间变异就会增大,F值将明显大于1。要大到多少才有统计学意义呢?可查F界值表,得P值,按P值的大小作出推断结论。,处理因素所致的变异,可见,方差分析的基本思想就是把全部观察值之间的变异总变异,按设计的要求分为两个或多个部分,每一部分有一定意义,其中至少有一部分表示各组均数间的变异,另一部分表示误差。然后再计算变异间的比值F。若F 值接近1,可认为处理因素无作用;若F 值远大于1,且大于或等于F 界值表中的某界值时,可认为处理因素有作用。,二、完全随机设计的方差分析,(一)完全随机设计 完全随机设计是采用完全随机化的分组方法,将全部试验对象分配到 k个处理组,通过比较各组均数之间差别有无统计学意义,以推断处理因素的效应。,表9-13 单因素方差分析的计算公式(P297),表中:C , Nni , k为处理组数。,(二)变异分解,1.建立假设,确定检验水准 H0:四组大白鼠肝体比值相等。 H1:四组大白鼠肝体比值不等或不全相等。 2.选定检验方法,计算统计量 F 值,(三)分析步骤,3.确定P 值,判断结果 查 F 界值表,得 F 0.05(3,12)=3.49, F 0.01(3,12)=5.95, 本例F=10.24,故P0.01 按 水准,拒绝H0,接受H1,有统计学意义;可以认为经四种不同饲料喂养后大白鼠肝体比值的均数不同或不全相同。,注意:如果P0.05,拒绝H0,差异有统计学意义,并不表明任何两组之间均有差别,要了解哪两组间有差别,哪两组间没差别,需进一步作两两比较。,三、随机区组设计资料的方差分析,(一) 随机区组设计 随机区组设计,又称配伍组设计,是配对设计的扩展。 具体做法是:先按条件相同或相近的研究对象配成区组(block),再将各区组内的研究对象随机分配到不同的处理组,比较各组均数之间差别有无统计学意义,以推断处理因素的效应。,例9-20 在抗癌药物筛选试验中,拟用20只小白鼠按体重相近者归为一个区组,一共五个区组,每个区组各有四只小白鼠。分别观察四种药物对小白鼠移植性肉瘤(S180)的抑瘤效果,结果见表9-17。问四种药物的抑瘤效果有无差别?,表9-17 四种药物抑瘤效果(瘤重,克),P299,该设计的特点:(1)该设计包含两个因素,一个是处理因素,一个是区组因素(two-way ANOVA);(2)各区组及处理组的受试对象数相等,(区组的例数就是处理组数,处理组的例数就是区组数)各处理组的受试对象生物学特性较均衡,可减少试验误差,提高假设检验的效率。,随机区组设计的方差分析除推断k个处理的差别有无统计学意义外,还可比较b区组间的差别有无统计学意义。,所有20只小白鼠的瘤重均不同:总变异每种药物5只小白鼠的瘤重均数不同:处理组间的变异每个区组4只小白鼠的瘤重均数不同:区组间的变异 各种变异之间的关系是:,(二)变异分解,(1)总变异:反映全部试验数据间大小不等的状况,(2)处理组间变异:A、 B、 C、D四种药物组间的均数大小不等,(3)区组间变异:5个区组间测量值的均数大小不等,(4)误差变异:反映随机误差产生的变异,,表9-16 随机区组设计方差分析的计算公式,P298,表中:C , Nni , k为处理组数。,例9-20 在抗癌药物筛选试验中,拟用20只小白鼠按体重相近者归为一个区组,一共五个区组,每个区组各有四只小白鼠。分别观察四种药物对小白鼠移植性肉瘤(S180)的抑瘤效果,结果见表9-17。问四种药物的抑瘤效果有无差别?,(三)分析步骤(结合例9-20),1.建立假设,确定检验水准 药物间:H0:四种药物的抑瘤作用相同,即1234H1:四种药物的抑瘤作用不全相同,即i(i=14)不全相同区组间:H0:五个区组的总体均数相同H1:五个区组的总体均数不全相同0.05,表9-17 四种药物抑瘤效果(瘤重,克),2.计算统计量,处理组的小计,各区组的小计,见下表,本例,,表9-18 例9-20的方差分析表,P300,3.确定P 值,判断结果 以处理为1,误差为2,查表9-12 F界值表,得F0.05 (3,12)=3.49,F0.01 (3,12)=5.95 。本例F =7.53,7.535.95,故P0.01。 因此按0.05的水准拒绝H0,接受H1,可认为四种药物的抑瘤作用不全相同,即四个总体均数中至少有两个不同。,区组间: 以区组为1,误差为2,查表9-12 F界值表,得F0.05 (4,12)=3.26,F0.01 (4,12)=5.41 。本例F =1.54,1.543.26,故P0.05。按=0.05的水准不拒绝H0,表明还不能认为五个区组的总体均数不全相同。,经过方差分析,若拒绝了检验假设H0,只能说明多个总体均数不等或不全相等。若要了解哪两者均数之间有差别,哪两者均数之间无差别,应在方差分析的基础上进行多个样本均数的两两比较。常用的方法:Student-Newman-Keuls法(SNK法)亦称q 检验。,四、多个样本均数间两两比较的q检验,计算公式:,例9-21 对例9-19资料作两两比较。,1、建立假设,确定检验水准 H0:任意两个对比组大白鼠肝体比值相等。 H1:任意两个对比组大白鼠肝体比值不相等。,2.选定检验方法,计算统计量q值,确定P值。 将四个均数按从大到小的顺序排列,并编上组次: 组次 1 2 3 4 均数 3.3200 3.0975 2.6850 2.4025 组别 D C B A,3.判断结果 按 水准,除A与B、C与D饲料间大白鼠肝体比值差别无统计学意义外,其余的任何两种饲料间大白鼠肝体比值间的差别均有统计学意义,可认为喂C、D号饲料的大白鼠肝/体比值较喂A、B号的高。,方差分析小结,1.方差分析是进行两个或多个样本均数比较的一种统计分析方法;2.要求数据满足随机独立、正态、方差齐3.单因素方差分析、两因素方差分析4.两两比较,思考题:,1、完全随机设计方差分析的实例中()A 组间SS不会小于组内SSB 组间MS不会小于组内MSC F值不会小于1D F值不会是负值E F值不会是正数,思考题:,2、完全随机设计方差分析中的组间均方是表示()的统计量A 抽样误差大小B 处理因素的效应作用大小C 处理因素效应和随机误差两者综合影响的结果D N个数据的离散程度E 随机因素的效应大小,思考题:,3、完全随机设计方差分析中,有()A MS组内MS误差B MS组间MS误差C MS组内=MS误差D MS组间=MS误差E MS组内MS误差,Thank you,

    注意事项

    本文(第九章 数值变量的统计分析下课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开