欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    生物统计学复习.ppt

    • 资源ID:5368751       资源大小:514KB        全文页数:48页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    生物统计学复习.ppt

    生物统计学总复习,2015-06-29,一、什么是统计学Statistics?,统计学是收集、分析、表述和解释统计数据的科学。统计学是关于数据的科学。资料的收集就是取得统计数据。数据整理是将数据分组、归纳和汇总并将其用图表的形式表达出来。数据分析是通过统计方法研究数据,并结合实际背景阐述实际问题的特征的过程。数据解释是对分析结果进行说明。统计学分为描述统计学和推断统计学。,描述统计与推断统计的关系,几个基本概念,总体(population)、个体(individual)与样本(sample)总体(N):一个统计问题所研究对象的全体有限总体:一个班级学生的身高无限总体:临床试验中来推断某一药品疗效高、某一棉田棉铃虫的头数个体:组成总体的每一基本单元样本(n):从总体中抽取的部分个体,用于对总体进行推断(n30,小样本;n30,大样本),通过某事物的一部分(样本),来估计事物的全部(总体)特征,几个基本概念(续),几个基本概念(续),变量(variable)与观测值(observation)变量(变数):相同性质的事物表现差异性的某种特征,其表现随个体而异身高、体重、叶绿素含量、叶片形状随机变量:变量取值的变化是不可预测的变量通常记为:x,y,z,观测值:对变量进行测量或观察所获得的数值观测值也称为:变量值(value of variables)、资料/数据(data),二、均值和方差,:第i个观察值或变数 n:观察值或变数的个数:求和符号(sigma),计算公式:,标准差和方差,总体方差和总体标准差,样本方差和样本标准差,三、概率与概率分布,概率分布-几个概念,概率函数(probability function)随机变量取某一特定值的概率函数(离散型随机变量)二项分布(对立事件)和泊松分布(出现概率较小,样本容量大)概率密度函数(probability density function)随机变量取某一特定值的密度函数(连续型随机变量)概率分布函数(probability distribution function)随机变量取值小于或等于某特定值的概率,离散型随机变量的概率分布,概率分布图,概率分布函数累积函数,密度函数,连续型随机变量的密度函数及概率分布函数,x=某一特定值时,P=0,13,若n,二项分布连接线表现为一个光滑的曲线。这一曲线称之为正态分布曲线或正态概率曲线。其概率密度函数为:,记做:N(,2),14,由于正态曲线受和的制约,曲线随这两个参数的变化而改变。构造一个新变数,这个变数要消去和的影响。假定新变数用u来表示,则:,标准正态分布的概率密度函数,u变换,标准正态分布,u服从均数为0、标准差为1的正态分布,16,如果从容量为N的总体抽样(放回),若每次抽取容量为n的样本,那么一共可以得到Nn个样本。每个样本可以计算一个平均数,如果将这些平均数集合起来便构成一个新总体。由于每次随机抽样所得的平均数可能会存在差异,所以由平均数构成的新总体也应该有其分布,这种分布称为平均数的抽样分布。,样本均值的抽样分布,1、样本平均数的期望值 由于不同的样本可得到不同的样本均值,因此,考察样本均值的期望就显得非常重要。用 表示样本均值的期望值,表示总体均值,可证明在简单随机抽样中。,2.样本平均数的标准差,称为标准误。,t分布,当总体标准差未知时,且样本数小于30时,以样本标准差S代替所得到的统计量 记为t。在计算时,由于采用S来代替,使得t 变量不再服从标准正态分布,而是服从t分布,服从自由度为n-1的t分布,2、t分布密度曲线以纵轴为对称轴,左右对称,且在t0时,分布密度函数取得最大值3、与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平.df越小这种趋势越明显.df越大,t分布越趋近于标准正态分布.当n 30时,t分布与标准正态分布的区别很小;n 100时,t分布基本与标准正态分布相同;n时,t分布与标准正态分布完全一致,正态分布曲线与t分布曲线的比较,t分布的特征1、t分布受自由度df=n-1的制约,每一个自由度都有一条t分布密度曲线,分布,设从一正态总体 中随机抽取样本容量为n,m的两个独立样本,其样本的方差为,则定义 两者的比值为F:,服从自由度为n-1,m-1的F分布,F分布特征1)F分布的平均数1,F的取值区间为0,+)2)F分布曲线的形状仅决定于df1和df2.在df1l或2时,F分布曲线呈严重倾斜的反向J型,当df1=3时转为左偏曲线(在平均值的左边),不同自由度下的F分布曲线,四、统计推断,统计推断,由一个样本或一糸列样本所得的结果来推断总体的特征,假设检验,参数估计,原理:概率很小的事件在一次抽样试验中实际是几乎不可能发生的。,=0.05/0.01,假设检验(Hypothesis),如何进行检验:,样本平均数,总体均数,推断,样本,随机抽样,总体,1、提出假设,对立,无效假设/零假设/检验假设,备择假设/对应假设,0,0,误差效应,处理效应,H0,HA,2、确定显著水平,0.05,显著水平*,极显著水平*,能否定H0的人为规定的概率标准称为显著水平,记作。,统计学中,一般认为概率小于0.05或0.01的事件为小概率事件,所以在小概率原理基础上建立的假设检验也常取=0.05和=0.01两个显著水平。,P,0.01,0.05,3、选定检验方法,计算检验统计量,确定概率值,P(u 1.581)=20.0571=0.1142,根据研究设计的类型和统计推断的目的选择使用不同的检验方法。本例:服从N(x,x2)分布。,例:,4、作出推断结论:是否接受假设,P,P,小概率原理,接受H0否定HA,否定H0接受HA,可能正确,可能错误,u 0.05=1.64u 0.01=2.33,单尾检验分位数,双尾检验分位数,u 0.05=1.96u 0.01=2.58,查表时,单尾概率乘以2等于双尾概率,大样本平均数的假设检验 u检验,小样本平均数的假设检验 t检验,单样本,双样本,样本平均数的假设检验,1、总体方差2已知,无论n是否大于30都可采用u检验法。,2、总体方差2未知,但n30时,可用样本方差s2来代替 总体方差2,仍用u检验法。,3、总体方差2未知,且n30时,可用样本方差s2来代替 总体方差2,采用df=n-1的t检验法。,应用情景:,试验设计,成组数据平均数的比较,成对数据平均数的比较,分到两个组中的数据,没有关系,相互独立。,两个样本平均数的假设检验,将性质相同的两个样本(供试单位)配偶成对,每一对除随机地给予不同处理外,其他试验条件应尽量一致,排除实验单位不一致对实验结果的影响。,1、两个总体方差12 和22已知,或12 和22未知,但两个样本都是大样本,即n130且n230时,用u检验法。,2、两个总体方差12 和22未知,且两个样本都是小样本,即n130且n230时,用t检验法。,成组数据平均数的比较-应用情景,成对数据平均数的比较,略,所谓方差的同质性,就是指各个总体的方差是相同的。,方差的同质性检验就是要从各样本的方差来推断其总体方差是否相同,方差的同质性检验,五、方差分析,t 检验可以判断两组数据平均数间的差异显著性,对多个处理进行平均数差异显著性检验时,采用t检验法的缺点:,方差:又叫均方,是标准差的平方,是表示变异的量。,确定各种原因在总变异中所占的重要程度。,处理效应,试验误差,相差不大,说明试验处理对指标影响不大。,相差较大,即处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。,xij=+i+ij,(i=1,2,3,k;j=1,2,3,n),总体平均数,i 处理效应,ij 试验误差,xij 是在第 i 次处理下的第 j 次观测值,多重比较(multiple comparisons),要明确不同处理平均数两两间差异的显著性,每个处理的平均数都要与其他的处理进行比较,这种差异显著性的检验就叫多重比较。,即:统计上把多个平均数两两间的相互比较称为多重比较。,概念,五、多重比较,多重比较方法较多(multiple comparisons),不同离子对木聚糖酶活性的影响(mg/ml),0.000.250.500.751.001.25,0.000.060.120.180.240.30,0.000.400.801.201.602.00,0.000.400.600.801.001.20,Na+,K+,Cu2+,Mn2+,实验指标,因素,*对多因素试验而言,处理就是指水平与水平的组合,定义:是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。,二因素都是固定因素,二因素均为随机因素,一个因素是固定因素,一个因素是随机因素,二因素方差分析,三种模型在计算上类似,但在对待检验及结果解释时有所不同。,主效应和互作,主效应(main effect):各试验因素的相对独立作用(不同饲料的增重差异,不同品种玉米产量不同),互作、交互(interaction):某一因素在另一因素的不同水平上所产生的效应不同。,方差分析的基本假定,正态性,可加性,方差同质性,二因素方差分析,相关变量,因果关系,平行关系,回归分析(regression analysis),相关分析(correlation analysis),一个变量的变化受到另一个变量或几个变量的制约,两个以上变量之间共同受到另外因素的影响,(x,y),实际值与估计值之差,剩余或残差。,估计值与均值之差,它与回归系数的大小有关。,因变量 y的平方和,总平方和,SST或SS总,回归平方和 U/SSR,离回归平方和 Q/SSE,变异分解,两个变量是否存在线性关系,采用F检验法进行。也以采用t检验法进行(需分别检验a、b值)。,若x与y间不存在直线关系,则总体回归系数=0;若x与y间存在直线关系,则总体回归系数0.,F值较大时,说明方程的变异主要有回归平方和(U)造成,方程成立。,t检验法,F检验法,直线回归的适应范围一般以自变量的取值为限。,直线回归注意问题,在自变量范围内求出的估计值,一般称为内插(interpolation);超过自变量取值范围所计算出的估计值,称为外延(extrapolation)。,若无充分理由证明超过自变量取值范围还是直线,应该避免外延。,决定系数coefficient of determination,变量x引起y变异的回归平方和占y总变异平方和的比率,

    注意事项

    本文(生物统计学复习.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开