自学考试生物统计复习第5章t检验.ppt
第五章 t 检验(样本平均数的显著性检验),统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断,它主要包括假设检验和参数估计二个内容。,第一节:假设检验概述 1、显著性检验定义:假 设 检 验(显著性 检验):先对总体提出假设(建立二事件),再在原假设(事件)成立条件下,据样本统计量求其概率,判断假设是否成立过程,包括t检验、F检验和2检验等。因为P(H0)+P(HA)=1,通过样本研究其所代表的总体。例如,设长白猪经产母猪产仔数的总体平均数为,大白猪经产母猪产仔数的总体平均数为,试 验研究的目的,就是要给、是否相同 做出推断。由于总体平均数、未知,在进行显著性检验时只能以样本平均数、作为检验对象,更确切地说,是以(-)作为检验对象。,2、显著性检验目的、对象,试验观测值由两部分组成,即=+总体平均数 反映了总体特征,表示误差。若 样本含量 为n,则 可 得 到 n 个 观 测值:,。于是样本平均数,3、显著性检验指导思想,说明样本平均数并非总体平均数,它还包含试验误差的成分。对于接受不同处理的两个样本来说,则有:=+,=+这说明两个样本平均数之差(-)也包括了两部分:一部分是两个总体平均数的差(-),叫试 验 的 处 理 效 应;另一部分是试验误差(-)。,(t检验指导思想),即样本平均数的差(-)包含有试验误差和试验的表面效应。因此,仅凭(-)就对总体平均数、是否相同 下结论是不可靠的。对(-)进行显著性检验就是要分析:试验的表面效应(-)主要由处理效应(-)引起的,还 是 主要 由试验误差所造成。,思考题,1、试验的观察值可分为哪两部分?用公式又如何表示?2、显著性检验对象可分为哪两部分?用公式又如何表示?,统计量-t值-概率-显著性判断 0.05 接受H0,不显著。0.05 接受HA,显著。0.01 接受HA,极显著。,统计量概率计算,总体:正态分布-标准正态分布-查表求概率样本:样本平均数-t值-求概率根据概率是0.05、0.05 或0.01作出判断。分别表示差异不显著、显著和极显著(因此统计推断是以概率为基础)。,例:,某品种鸡4周龄标准体重是0.625kg,现饲养该品种一批,4周龄随机抽取50只,测得平均体重0.584kg,标准差0.135kg,试分析这批鸡体重与标准体重有无显著差异。各处理差=0.625-0.584=0.041 引起原因可能是处理效应或试验误差 t=2.147,P(H0)=0.037 表示:u=0.625的概率是0.037,相反u0.625的概率是0.963。,第二节、显著性检验的基本原理 一、显著性检验的基本步骤1、建立假设(检验目的),显著性检验步骤,建立假设:H0:U1=U1;HA:U1 U2求统计量:如t 值判断:据所求概率与显著水平比较作出统计推断,无效假设:备择假设:以上二假设为对立事件,有:P(H0)+P(HA)=1,=,H0:两总体观察值无显著差异;HA:两总体观察值有显著差异。,错误假设,H0:两样本均数无差异;HA:两样本均数有差异。或:H0:两样本均数有显著差异;HA:两样本均数无显著差异。,2、在无效假设成立的前提下,构造合适的统计量,并据统计量的抽样分布,计算无效假设成立概率。,3、根据“小概率事件实际不可能性原理”否定或接受无效假设,并作出结论。若事件的概率很小,例如P(H0)0.05,0.01(实际不可能事件),表示原假设成立的可能性较小,则否定H0,接受HA。,二、显著水平与两种类型的错误 用来否定或接受无效假设的概率 叫 显 著 水 平,记作。在生物学研究中常取=0.05或=0.01。,t检验显著性判断标准,若|t|0.05,不能否定H0。若t0.05|t|t0.01,表示差异显著,H0成立的概率在0.01 0.05,否定H0.若|t|t0.01,表示差异极显著,H0成立概率0.01,即 0.01,否定H0.,t检验判断标准示意图,根据“小概率事件实际不可能性原理”否定或接受无效假设,故接受或否定无效假设,都没有绝对100%的把握。型错误:H0成立,但否定了它,就是把非真实差异错判为真实差异,即 为 真,却接 受。(以真为假)只有否定H0时才可能犯型错误,但犯型错误概率不会超过。,型错误:H0不成立,却接受了它,就是把真实差异错判为非真实差异,即 为真,却接受。(以假为真)接受H0时可能犯型错误。,说明:,注:统计分析所作结论不是完全正确的,差异显著表示所作结论有95%把握,同时也有5%下 错结论风险,差异极显著表示所作结论有99%把握,同时也有1%下错结论风险。,思考题,1、什么条件下可能犯型错误,其与显著水平又有何关系。2、什么条件下可能犯型错误。3、统计推断的结论是否绝对正确,为什么。,复习题,什么叫标准误(差)?什么是显著水平?实际中如何判断?t检验包括哪些基本步骤?,显著性检验,产 品,质量检查方法,每个体(X);某个体(Xi);样本(x1、x2、-、xn),平 均 数,例,某品种鸡的平均蛋重30克,现随机抽取10枚蛋重量如下:(单位:克)30、32、31、30、31 31、31、31、30、32试分析样本所在总体均数与蛋重30克有无显著差异。,解:1、提出无效假设与备择假设 H0:=30;HA:30 2、计算 t 值 经计算得:=30.90,S=0.74,=0.23,所以=(30.9-30)/0.23=3.91 df=n-1=10-1=9,3、查临界t值,作出统计推断 因为 t0.05(9)=2.262,t0.01(9)=3.25,否定H0:=30,接受HA:30,表示这批蛋重与30克有极显著差异。,三、双侧检验与单侧检验,双侧检验:利用两尾概率进行的检验叫 双侧检验 单侧检验:利用一尾概率进行的检验叫单侧检验,单、双侧检验的适用条件:无效假设 与备择假设.此时,备择假设中包括了 或 两种可能。若检验目的不考虑谁大谁小(无方向性)则采用双侧检验。考虑谁大谁小(有方向性)采用单侧检验。,单、双侧检验的区别,假检:H0:U1=U2;HA:U1 U2(双侧检验)H0:U1=U2;HA:U1U2或U1U2(单侧检验)临界值:t为单侧检验的临界t值。显然,单侧检验的t=双侧检验的t2。,若对同一资料进行双侧检验也进行单侧检验,所得的结论不一定相同。双侧检验显著,单侧检验一定显著;但单侧检验显著,双侧检验未必显著。,例,按规定肉鸡平均体重3kg方可出售,现从鸡群中随机抽取16只,平均体重为2.8公斤,标准差为0.2公斤,问该批鸡可否出售。,解:1、提出无效假设与备择假设 H0:=3,HA:3 2、计算 t 值 经计算得:=2.8,S=0.2,=0.05,所以=(3-2.8)/0.05=4 df=n-1=16-1=15,3、查临界t值,作出统计推断 因为 t0.05*2(15)=1.753,t0.01*2(15)=2.49,否定H0:=3,接受HA:3,表示这批鸡还不能出售。,“差异显著”指结论有95%把握,但同时有5%下错结论风险。“差异极显著”指结论有99%把握,但同时有1%下错结论风险。“差异不显著”也不能理解为试验结果间没有差异,因为 一是本质上有差异,但被试验误差所掩盖;二是可能确无本质上差异。,结论不能绝对化。统计推断的结论不是绝对正确的,因为否定H0时可能犯型错误,接受H0时可能犯型错误。,复习题,1、对同一资料作统计分析,以下哪个显著水平犯型误差概率最大 A0.02 B0.01 C0.10 D0.052、在自由度等于下列哪种情况下t分布基本与标准正态分布相同 A30 B 30 C100,D3、若随机事件概率很小,如小于_、_则称为小概率事件。4、假设检验中否定H0可能犯_错误,但犯这类错误概率不超过_5、若检验二种药物对仔猪促生长效果有无显著效果,则选用t检验时建立假设为H0:_;HA:_。,第三节 样本均数与总体均数显著性检验,1、t检验适用条件;2、t检验类型;3、样本均数与总体均数差异显著性检验;4、作用(应用)-抽样检查;统计质量管理;推断结论。,一、t检验适用条件;,计量资料或次数资料(df=);处理数(组数)2.,二、t检验类型;,样本均数与总体均数显著性检验;两样本均数的显著性检验;百分数资料显著性检验(df=)。,检验步骤:1、假设:2、计算t值 3、判断:由 查附表3得临界值t0.05t0.01。与计算所得的t值的绝对值比较,并做出结论。,【例5.1】母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为 116、115、113、112、114、117、115、116、114、113(天),试分析样本均数与总体平均数114天有无显著差异?根据题意,本例应进行双侧t检验。1、提出无效假设与备择假设,,2、计算t值 经计算得:=114.5,S=1.581 所以=1.00,3、查临界t值,作出统计推断 由=9,查t值表得t0.05(9)=2.262,因为|t|0.05,则接受H0,表明样本平均数与总体平均数差异不显著,即该样本取自母猪怀孕期为114天的总体。,【例5.2】按规定某种饲料中维生素C不得少于246g/T,现从产品中随机抽测12个样品,测得维生素C含量如下:255、260、262、248、244、245、250、238、246、248、258、270g/T,问此产品是否符合规定要求?(统计量-t值-概率-判断),按题意,此例应采用单侧检验。1、提出无效假设与备择假设 H0:=246,HA:246 2、计算 t 值 经计算得:=114.5,S=1.581,所以=2.281,3、查临界t值,作出统计推断 因为单侧=双侧=1.796,t=2.281 单侧t0.05(11),246,可认为该批饲料维生素C含量符合规定。,练习,某品种鸡的平均蛋重30克,现随机抽取10枚蛋重量如下:(单位:克)30、32、31、30、31 31、31、31、30、32试分析该样本所属总体均值是否有显著增加。(平均数-t值-概率-显著性),第四节 两个样本平均数的差异 显著性检验,检验两样本平均数差异显著性是为了解两样本所属总体的平均数是否相同,可分为两种情况:非配对设计和配对设计。,一、非配对设计(成组设计)两样本平均数差异显著性检;非配对设计将试验动物完全随机地分成两组,每组随机施加一个处理。二个样本相互独立,其含量不一定相等。,表5-2 非配对设计资料的一般形式,非配对设计两样本平均数差异显著性检验的基本步骤如下:(一)提出无效假设与备择假设,(二)计算t值 计算公式为:(5-3),合并自由度,其中:注:合并方差=SS/df=(SS1+SS2)/(df1+df2),合并方差,(三)根据df=(n1-1)+(n2-1),查临界值:t0.05、t0.01,将 计算所得 t 值的绝对值与其比较,作出统计推断,【例5.3】,某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg时的背膘厚度,测定结果如表5-3所示。试分析该两品种后备种猪90kg时的背膘厚度有无显著差异?,表5-3 长白与蓝塘后备种猪背膘厚度 1、提出无效假设与备择假设,2、计算t值 此例n1=12、n2=11,经计算得:=1.202、=0.0998、,、分别为两样本离均差平方和。=0.0465,=(12-1)+(11-1)=21,3、查临界t值,作出统计推断 当df=21时,查临界值得:t0.01(21)=2.831,|t|2.831,0.01,表明两品种后备种猪90kg背膘厚度差异极显著,即长白后备种猪的背膘厚度极显著地低于蓝塘后备种猪的背膘厚度。,练习,测定某品种鱼公、母体长(cm)如下:公:n=35 平均值=25.56 S1=3.65 母:n=47 平均值=23.23 S2=2.49 试分析公、母鱼体长有无显著性差异。,例2:,已知两品种母猪各10头,其产仔数如下:A:11,11,9,12,10,13,13,8,10,13 B:8,11,12,10,9,8,8,9,10,7试求其t值及概率(t=2.43;p=0.026),二、配对设计两样本平均数的差异显著性检验配对目的:为了消除试验材料不一致对试验结 果的影响。配对要求:对内条件一致,对间允许有差异。配对方式:自身配对,同源配对。配对设计定义:先将试验动物两两配对,再将配 成对子的动物随机地分配到各处理组。,自身配对 指同一试验单位在二个不同时间、空间上分别接受前后两次处理,用其前后两次的观测值进行自身对照比较。同源配对 指将来源相同、性质相同的两个个体配成一对,然后对配对的两个体随机地实施不同处理。,表5-5 配对设计试验资料的一般形式,差数样本,(一)提出无效假设与备择假设,其中 为两样本配对数据差值d总体平均数,它等于两样本所属总体平均数 与 之差,即=-。所设无效假设、备择假设相当于,。(二)计算t值 计算公式为(5-6),(三)查临界t值,作出统计推断 根据df=n-1查临界t值:t0.02(n-1)和t0.01(n-1),将计算所得t值的绝对值与其比较,作出推断。,【例5.5】用家兔10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温,见表5-6。设体温服从正态分布,问注射前后体温有无显著差异?表5-6 10只家兔注射前后的体温,差数样本:平均值=-0.73,标准差=0.45,标准误=0.14,1、提出无效假设与备择假设;2、计算t值 经过计算得 故 且,3、查临界t值,作出统计推断 由df=9,查t值表得:t0.01(9)=3.250,因为|t|t0.01(9),0.01,表明家兔注射该批注射液前后体温差异极显著,注射该批注射液可使体温极显著升高。,练习,配对与非配对设计有何主要区别?配对与非配对设计各有何主要特点?,复习题,非配对与配对设计有何主要区别?什么条件下适用t检验?非配对与配对设计求t值有何差异?生产实际中t检验有何主要作用?,计算题,随机抽测10头大白与长白经产母猪的产仔数如下:(单位:头)长白:11、11、9、12、10、13、13、8、10、13大白:8、11、12、10、9、8、8、9、10、7试求两样本的合并标准误值。,正常人的脉搏平均为72次/分,现测得9名慢性铅中毒患者脉搏为54、67、68、78、70、66、67、70、65次/分,试分析慢性铅中毒患者脉搏与正常人有无显著差异,为了比较国产与进口的超声波膘厚测定仪,对14头活体肥猪进行了测定(单位:mm),资料如下,试求其t值及概率?,第五节 百分数资料差异显著性检验,百分数资料如成活率、死亡率、孵化率、感染率、阳性率等服从二项分布。若自由度无限大时(df=)可用 t 检验法;因t值与标准正态分布u值相等,故又称u检验。,绝对数:相对数:两个绝对数比值,如变异系数,成活率等。,一、样本百分数与总体百分数差异显著性检验 1、检验目的:样本百分数 是否 来自总体百分数为p0的二项总体。,若np或nq30时,应对u进行连续性矫正。检验的基本步骤是:(一)提出无效假设与备择假设,(二)计算u值或uc值的计算公式为:,(np或nq30),P48页 当试验结果以事件A发生的频率kn表示时(4-21)也称为总体百分数标准误,当 p 未 知时,常以样本百分数 来估计。此时(4-21)式改写为:=称为样本百分数标准误。,(三)将 计 算 所 得 的 u或uc的绝对值与1.96、2.58(双侧检验)比较,作出统计推断.单侧检验的临界值是:1.64;2.24,若(或)0.05,表明样本百分数与总体百分数差异不显著;若 2.58,0.01 0.05,表明样本百分数与总体百分数PO差异显著;若,表明样本百分数 与 总体百分数PO差异极显著。,【例5.7】某地区的乳牛隐性乳房炎一般为30%,现对某牛场 500 头乳牛进行检测,结果有175头乳牛凝集反应阳性,问该牛场的隐性乳房炎是否与往年相同?此例总体百分数PO=30%,样 本 百 分 数=175/500=35%,因为=15030,不需作连续性矫正。1、提出无效假设与备择假设,,2、计算u值 因为 于是 3、作出统计推断 因为1.96u2.58,0.01p0.05,表明样本百分数=35%与总体百分数PO=30%差异显著,这里表现为该奶牛场的隐性乳房炎显著高于往年。,练习,某产品的次品率5%可判为合格,现随机抽取150件产品发现有12件次品,问该产品是否合格。,二、两个样本百分数差异显著性检验(可用X2检验代替 P146页)两样本的平均率,填空,已知A地610人有肝炎65人,B地740人有肝炎89人,则两地肝炎平均发病率为_%.,t检验:样本平均数-t值-概率参数估计:双侧概率-t值-平均数(0.01 0.05)(查表)(估计总体均数),第六节 总体参数的区间估计,参数估计是用样本统计量来估计总体参数,有 点估计 和区间估计。将样本统计量直接作为总体相应参数的估计值叫点估计,如样本平均数=总体平均数。点估计只给出了值的大小,没有考虑试验误差的影响,也没有指出估计的可靠程度。,区间估计是在一定概率保证下指出总体参数的可能范围,所给出的可能范围叫 置 信 区 间,给出的概率保证称为 置 信 度 或 置 信概 率(1-)。t检验:平均数-t值-概率(统计分析)区间估计:概率t值-平均数,为什么区间估计优于点估计?,考虑试验误差影响;指出估计的可靠程度(概率)。,一、正态总体平均数的置信区间,置信半径(R):t0.05(df)*Sx或t0.01(df)*Sx 它也等于允许误差(-)或最小显著差数(LSD)。,常用的置信度为95%和99%,故总体平均数的95%和99%的置信区间如下:(5-14)(5-15),【例5.9】某品种猪10头仔猪的初生重为1.5、1.2、1.3、1.4、1.8、0.9、1.0、1.1、1.6、1.2(kg),求该品种猪仔猪初生重总体平均数的置信区间。,经计算得,由,查 t 值 表得,因此95%置信半径为 95%置信下限为 95%置信上限为,所以该品种仔猪初生重总体平均数的95%置信区间为 又因为99%置信半径为 99%置信下限为99%置信上限为,故该品种仔猪初生重总体平均数的99%置信区间为,练习(选择题):,已知9头猪的血红蛋白含量平均数为11.56,标准差为1.35,则其总体均数u的95%置信区间为(t0.05=2.306)A.10.52-12.60,B.8.45-14.67,C.9.68-10.26,D.9.67-12.65。,二、二项总体百分数的置信区间,当,时,总 体 的95%、99%置信区间为:(5-16)(5-17)其中,为样本百分数,为样本百分数标准误,的计算公式为:(5-18),【例5.10】调查某地1500头奶牛,患结核病的有150头,求该地区奶牛结核病患病率的95%、99%置信区间。由于1000,1%,采用正态分布近似法求置信区间。因为,所以该地区奶牛结核病患病率的95%、99%置信区间为:即,区间估计与显著性检验一致性,若检验对象(-)小于允许误差时差异不显著;相反显著或极显著。,例,按规定肉鸡平均体重3kg方可出售,现从鸡群中随机抽取16只,样本的标准差为0.2公斤,问(1)允许误差是多少可以出售;(2)可出售的样本平均数最小应取何值?,解:,置信半径(R):t0.05(df)*Sx或t0.01(df)*Sx 它也等于允许误差(-)或最小显著差数(LSD)。LSD=2.131*0.2/4=0.10655 3-0.10655=2.9 kg即平均体重最小达2.9kg方可出售。,练习,1、抽测10头母猪的怀孕期分别为 116、115、113、112、114、117、115、116、114、113(天),试求其总体均数的置信区间。2、简述P()=0.95 与 的区别。,P(-1.96x+1.96)=0.95,3、某种蛋孵化率为90%,现100枚种蛋孵化雏鸡80只,试分析这批种蛋孵化率与90%有无显著性差异,并求其率95%的置信区间。,2、,解:(1)假设:H0:P=0.9;HA:P0.9(2)求Uc值:SP=0.03 P=80/100=0.8 Uc=(P0-P)-0.5/N)/SP=3.17(3)判断:因U值大于3.17,故其差异极显著。(4)SP=0.04 R=1.96*0.04=0.08 0.8-0.08P 0.8+0.08 0.72 P 0.88,作业,P77页第10题和第12题.,