生物统计学复习.ppt
《生物统计学复习.ppt》由会员分享,可在线阅读,更多相关《生物统计学复习.ppt(48页珍藏版)》请在三一办公上搜索。
1、生物统计学总复习,2015-06-29,一、什么是统计学Statistics?,统计学是收集、分析、表述和解释统计数据的科学。统计学是关于数据的科学。资料的收集就是取得统计数据。数据整理是将数据分组、归纳和汇总并将其用图表的形式表达出来。数据分析是通过统计方法研究数据,并结合实际背景阐述实际问题的特征的过程。数据解释是对分析结果进行说明。统计学分为描述统计学和推断统计学。,描述统计与推断统计的关系,几个基本概念,总体(population)、个体(individual)与样本(sample)总体(N):一个统计问题所研究对象的全体有限总体:一个班级学生的身高无限总体:临床试验中来推断某一药品疗
2、效高、某一棉田棉铃虫的头数个体:组成总体的每一基本单元样本(n):从总体中抽取的部分个体,用于对总体进行推断(n30,小样本;n30,大样本),通过某事物的一部分(样本),来估计事物的全部(总体)特征,几个基本概念(续),几个基本概念(续),变量(variable)与观测值(observation)变量(变数):相同性质的事物表现差异性的某种特征,其表现随个体而异身高、体重、叶绿素含量、叶片形状随机变量:变量取值的变化是不可预测的变量通常记为:x,y,z,观测值:对变量进行测量或观察所获得的数值观测值也称为:变量值(value of variables)、资料/数据(data),二、均值和方差
3、,:第i个观察值或变数 n:观察值或变数的个数:求和符号(sigma),计算公式:,标准差和方差,总体方差和总体标准差,样本方差和样本标准差,三、概率与概率分布,概率分布-几个概念,概率函数(probability function)随机变量取某一特定值的概率函数(离散型随机变量)二项分布(对立事件)和泊松分布(出现概率较小,样本容量大)概率密度函数(probability density function)随机变量取某一特定值的密度函数(连续型随机变量)概率分布函数(probability distribution function)随机变量取值小于或等于某特定值的概率,离散型随机变量的概率
4、分布,概率分布图,概率分布函数累积函数,密度函数,连续型随机变量的密度函数及概率分布函数,x=某一特定值时,P=0,13,若n,二项分布连接线表现为一个光滑的曲线。这一曲线称之为正态分布曲线或正态概率曲线。其概率密度函数为:,记做:N(,2),14,由于正态曲线受和的制约,曲线随这两个参数的变化而改变。构造一个新变数,这个变数要消去和的影响。假定新变数用u来表示,则:,标准正态分布的概率密度函数,u变换,标准正态分布,u服从均数为0、标准差为1的正态分布,16,如果从容量为N的总体抽样(放回),若每次抽取容量为n的样本,那么一共可以得到Nn个样本。每个样本可以计算一个平均数,如果将这些平均数集
5、合起来便构成一个新总体。由于每次随机抽样所得的平均数可能会存在差异,所以由平均数构成的新总体也应该有其分布,这种分布称为平均数的抽样分布。,样本均值的抽样分布,1、样本平均数的期望值 由于不同的样本可得到不同的样本均值,因此,考察样本均值的期望就显得非常重要。用 表示样本均值的期望值,表示总体均值,可证明在简单随机抽样中。,2.样本平均数的标准差,称为标准误。,t分布,当总体标准差未知时,且样本数小于30时,以样本标准差S代替所得到的统计量 记为t。在计算时,由于采用S来代替,使得t 变量不再服从标准正态分布,而是服从t分布,服从自由度为n-1的t分布,2、t分布密度曲线以纵轴为对称轴,左右对
6、称,且在t0时,分布密度函数取得最大值3、与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平.df越小这种趋势越明显.df越大,t分布越趋近于标准正态分布.当n 30时,t分布与标准正态分布的区别很小;n 100时,t分布基本与标准正态分布相同;n时,t分布与标准正态分布完全一致,正态分布曲线与t分布曲线的比较,t分布的特征1、t分布受自由度df=n-1的制约,每一个自由度都有一条t分布密度曲线,分布,设从一正态总体 中随机抽取样本容量为n,m的两个独立样本,其样本的方差为,则定义 两者的比值为F:,服从自由度为n-1,m-1的F分布,F分布特征1)F分布的平均数1,F的取值区间为0,
7、+)2)F分布曲线的形状仅决定于df1和df2.在df1l或2时,F分布曲线呈严重倾斜的反向J型,当df1=3时转为左偏曲线(在平均值的左边),不同自由度下的F分布曲线,四、统计推断,统计推断,由一个样本或一糸列样本所得的结果来推断总体的特征,假设检验,参数估计,原理:概率很小的事件在一次抽样试验中实际是几乎不可能发生的。,=0.05/0.01,假设检验(Hypothesis),如何进行检验:,样本平均数,总体均数,推断,样本,随机抽样,总体,1、提出假设,对立,无效假设/零假设/检验假设,备择假设/对应假设,0,0,误差效应,处理效应,H0,HA,2、确定显著水平,0.05,显著水平*,极显
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 复习
链接地址:https://www.31ppt.com/p-5368751.html