年生物统计学(第4章).ppt
《年生物统计学(第4章).ppt》由会员分享,可在线阅读,更多相关《年生物统计学(第4章).ppt(44页珍藏版)》请在三一办公上搜索。
1、第四章:统计推断,一节 抽样误差一、均数的抽样误差与标准误在第一章、第四节、五、中我们学习了总体与样本、抽样的概念。抽样研究的目的就是要样本的资料来推断总体的水平,这叫统计推断(Statistical inference)。是抽样研究,就存在抽样误差,抽样误差是由于样本中每个观察值的不同和差别所致,是抽样研究中不可避免的。关键是在统计推断中如何计算抽样误差,并如何在统计推断的结果中表达抽样误差的影响。,怎样计算抽样的误差呢?由于存在抽样误差,样本均数一般不会正好等于总体的均数,而且所得的各个样本均数之间也不会正好相等。,如果将对各个样本的均数(可看成新的观察值!)求标准差(称为标准误,以便与个
2、体观察值的标准差相区别),则这个新的统计量-标准误,就可以衡量抽样误差的大小:标准误越大,反映抽样误差越大;反之亦然。标准误的定义如下:总体平均数的标准误(参数)为:式中:为总体标准差,N为均数 的个数,n为某抽样样本的含量。样本平均数的标准误(统计数)为:后者是计算标准误的实用公式标准误(抽样误差)的大小与总体的标准差成正比;与样本含量的平方根成反比。,进一步研究样本平均数的分布还可以有新的发现:(见43页)数学上可以证明:样本均数的均数等于总体均数,即:样本均数的方差等于总体方差除以样本容量,即:(3.31)(3.32)如果从正态总体N(,2)进行抽样,其样本均数的总体也服从正态分布,但是
3、构成这个新正态总体的参数为:不论被抽样的总体为何种分布(例如:二项分布、几何级数分布、偏态分布),但只要能计算出均数和方差,且为大样本(n30),其均数的分布就服从正态分布。这一条被称为“中心极限定理”。(43页),进一步研究样本平均数的分布还可以有新的发现:(见43页)数学上可以证明:样本均数的均数等于总体均数,即:样本均数的方差等于总体方差除以样本容量,即:(3.31)(3.32)如果从正态总体N(,2)进行抽样,其样本均数的总体也服从正态分布,但是构成这个新正态总体的参数为:不论被抽样的总体为何种分布(例如:二项分布、几何级数分布、偏态分布),但只要能计算出均数和方差,且为大样本(n30
4、),其均数的分布就服从正态分布。这一条被称为“中心极限定理”。(43页),第三节 假设检验的原理和方法,一、假设检验(Hypothesis test)的概念假设检验又称为显著性检验(Significance test),其意义可用下例来说明。54页例题4.1:某渔场按常规方法所育鲢鱼苗一月龄的平均体长为7.25 cm,标准差为1.58 cm,为了提高鱼苗的质量,现采用一种新方法进行育苗,一月龄时随机抽取100尾进行测量,测得其平均体长为7.65 cm,试问新的育苗方法有无显著差异?显然,这两个均数的不等有两种可能:由于抽样误差所致;由于新方法的效应所致。如何作出判断,统计学上是通过假设检验来进
5、行的。,假设检验的理论依据有两方面:事件的概率分布;小概率原理。小概率原理指的是:如果统计推断的结果表明“事件(无效假说)”发生概率p很小,例如 p0.05,则我们将这种事件称为“小概率事件”,并可以近似认为:“在这次实验中该事件不会发生”,从而否定“无效假说”,进而认为处理与效应之间“存在因果联系”;反之,如果“事件(无效假说)”发生概率超过p0.05(我们将这种事件称为“非小概率事件”),则近似认为:“在这次实验中该事件还有可能发生”,进而认为处理与效应之间“因果联系”的依据不足。,假设检验的理论依据有两方面:事件的概率分布;小概率原理。小概率原理指的是:如果统计推断的结果表明“事件(无效
6、假说)”发生概率p很小,例如 p0.05,则我们将这种事件称为“小概率事件”,并可以近似认为:“在这次实验中该事件不会发生”,从而否定“无效假说”,进而认为处理与效应之间“存在因果联系”;反之,如果“事件(无效假说)”发生概率超过p0.05(我们将这种事件称为“非小概率事件”),则近似认为:“在这次实验中该事件还有可能发生”,进而认为处理与效应之间“因果联系”的依据不足。,“小概率原理”另外的说法,可以想象如果一个事件(例如“无效假说”)的发生概率很小,那么在只进行一次实验情况下,我们可以说这个事件(无效假说)是“不会发生的”。从一般常识就可以知道,这句话在大多数情况下是正确的,但是它一定有犯
7、错误的时候,因为发生的概率再小也是有可能发生的,如同彩票中奖一样,这就是小概率原理。,假设检验首先要对样本所代表的总体提出假设,有两种统计假设:一种是“检验假设”(Hypothesis under test),或称“无效假设”(Null hypothesis),符号为H0。如本例,假设:新育苗方法与常规方法所育鱼苗一月龄体长相同(即,假设所比较的均数来自同一总体,两个均数的差异仅仅是由于抽样误差所致),无效假设是直接用于检验的假设,是对样本总体来源提出的假设,通常要加上文字进行表达。表达的格式为:假设H0:=0,即新育苗方法与常规方法所育鱼苗一月龄体长相同。另一种是“备择假设”(Alterna
8、tive hypothesis)符号为HA。如本例,假设:新育苗方法与常规方法所育鱼苗一月龄体长不相同(即,假设所比较的均数不是来自同一总体,两者均数的差异不是由于抽样误差所致,而是由于“效应”所致),表达格式为:对HA:0,二、假设检验的一般步骤 提出假设,在进行了无效假设和备择假设之后,要确定一个否定H0的概率标准,这个概率标准称为“显著水平”,记作,是人为规定的小概率界限(根据“小概率事件原理”)。生物统计学中常:取显著水平=0.05 和/或 取显著水平=0.01。选择和计算统计量(检验计算)根据资料性质的不同和不同的分析目的,应当选用不同的统计量,如u、t、F、2等等。例如本例:为大样
9、本(n30)、计量资料,目的在于判断样本均数(7.65 cm)与总体均数(7.25 cm)的差别来源,可选择u值为统计量,并采用相应的u检验的方法计算统计量。根据55/37页公式(3.34):检验计算:,二、假设检验的一般步骤 确定概率的显著水平(取显著水平),算出统计量之后,通常须查找相应的工具表来确定P值。有关的工具表都是按照各种统计量的特殊分布规律编制出来的。如本例查316页附表2 正态离差(u)值表来确定P值。推断:根据316页附表2,=0.05时,u0.05=1.96,2.5321.96,p0.05差异无显著性(NS)小概率事件:P0.05差异有显著性(*)非常小概率事件:P0.01
10、差异有高度显著性(*),确定概率范围并推断是否接受假设(推断),第四节 计量资料样本平均数的假设检验,一、大样本(n30)平均数的假设检验 u 检验,均数的标准正态分布图形,方法提要,根据 u 值表:=0.05时,u0.05=1.96:uu0.05,pu0.01,p0.01,1总体方差已知时的检验(例4.1):2总体方差未知时的检验:两个样本平均数比较的u检验(例4.4),单个样本平均数的u检验,第四节 计量资料样本平均数的假设检验,二、小样本(n30)平均数的假设检验 t 检验,(一)t 分布(t-distribution),1.t 分布 的来源 t 分布是英国Gosset 1908年以笔名
11、“Student”所发表的论文提出的,因此称为学生氏 t 分布,简称t分布。t 分布是用来描述正态资料在小样本条件(n30)下的频数分布规律的数学模型。例如:当抽取的样本尾150尾鲢鱼时(或n30),鱼塘鱼的频数分布可以用正态分布模型来计算,结果与实际情况吻合;如果我们仅抽取了 1 尾鲢鱼,我们则无法计算鱼塘鱼的频数分布(因为无分布模型可言);如果抽取鲢鱼数目介于230尾,计算条件比 1 尾鲢鱼好,但比30尾条件差(用正态分布计算,结果与实际情况不太吻合,误差较大),则可以用 t 分布描述,即 t 分布模型是正态资料从“无分布模型”向“正态分布模型”过渡的一种“过渡性分布模型”,这时用 t 分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学

链接地址:https://www.31ppt.com/p-4760726.html