生物统计学考试总结(第1至7章)汇总.doc
《生物统计学考试总结(第1至7章)汇总.doc》由会员分享,可在线阅读,更多相关《生物统计学考试总结(第1至7章)汇总.doc(16页珍藏版)》请在三一办公上搜索。
1、生物统计学考试总结第一章生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。内容:试验设计:试验设计的基本原则、试验设计方案的制定和常用试验设计的方法统计分析:数据资料的搜集、整理和特征数的计算、统计推断、方差分析、回归和相关分析、协方差分析等生物统计学的作用:1. 提供整理、描述数据资料的科学方法并确定其特征2. 判断试验结果的可靠性3. 提供由样本推断总体的方法4. 试验设计的原则相关概念:1.总体:研究对象的全体,是具有相同性质的个体所组成的集合2.个体:组成总体的基本单元3.样本:由总体中
2、抽出的若干个体所构成的集合 n30 大样本; n30 小样本4.参数:描述总体特征的数量5.统计数:描述样本特征的数量由于总体一般很大,有时候甚至不可能取得,所以总体参数一般不可能计算出来,而采用样本统计数来估计总体的参数6.效应:由因素而引起试验差异的作用 7. 互作:两个或两个以上处理因素间的相互作用产生的效应生物统计学的研究包括了两个过程:1. 从总体抽取样本的过程抽样过程2. 从样本的统计数到总体参数的过程统计推断过程第二章1算术平均数:是所有观察值的和除以观察的个数 平均数(AVERAGE)特性:(1)样本中各观测值与平均数之差离均差的总和等于零(2)样本中各观测值与其平均数之差平方
3、的总和,比各观测值与任一数值离均差的平方和小,即离均差平方和最小 2中位数:将试验或调查资料中所有观测依从大小顺序排列,居于中间位置的观测值称为中位数,以Md表示3众数:在一个样本的所有观察值中,发生频率最大的一个值称为样本的众数,以Mo表示4几何平均数:资料中有n个观测值,其乘积开n次方所得的数值,以G表示。5.极差(全距):样本数据资料中最大观测值与最小观测值的差值Rmaxx1,x2,xn mixx1,x2,xn 6样本方差: 总体方差:用n1代替n作,可以避免偏小估计,从而实现样本方差对总体方差的无偏估计在统计上,自由度(df n1 )是指样本内独立而能自由变动的观测值的个数在计算其他统
4、计数时,如果受到k个条件的限制,则其自由度为nk7样本标准差: 总体标准差:(1)标准差的大小,受多个观测值的影响,如果观测值与观测值间差异大,标准差就大(2)在计算标准差的时候,如果对各个观测值加上或者减去一个常数a,其标准差不变;如果乘以或除以一个常数a,则标准差扩大或者缩小a倍STDEV: 基于给定样本的标准偏差STDEVP:基于给定样本总体的标准偏差8变异系数(CV):样本标准差除以样本的平均数,得到百分比(1)变异系数是样本变量的相对变量,是不带单位的纯数(2)用变异系数可以比较不同样本相对变异程度的大小第三章概率的计算法则:(1)乘法定理:如果A和B为独立事件,则事件A和B同时发生
5、的概率等于各自事件的概率的乘积(2)加法定理:互斥事件A和B的和的概率等于事件A和事件B的概率之和加法定理推理1: 如果A1、A2、An为n个互斥事件,则其和事件的概率为: P(A1A2An)=P(A1)+P(A2)P(An)加法定理:如果A和B是任何两件事件,则概率分布:(1)离散型随机变量的概率分布变量(x) x1 x2 x3 xn概率(P) p1 p2 p3 pnP(x=xi)=pi (i=1,2, n)离散随机变量的方差(2)连续型随机变量的概率分布连续型随机变量的概率分布1. 连续型随机变量可以取某一区间或整个实数轴上的任意一个值2. 它取任何一个特定的值的概率都等于03. 不能列出
6、每一个值及其相应的概率4. 通常研究它取某一区间值的概率5. 用数学函数的形式和分布函数的形式来描述概率密度函数:(1)设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条件(2) ,f(x)不是概率几种常见的概率分布:(适用范围,尾函数,自由度)1. 二项分布的概率函数 记作B(n,p)或者B(n,)(1)每次试验只有两个对立结果,分布记为A与 ,它们出现的概率分布为p与q(q1-p)(2)试验具有重复性和独立性二项式分布的概率累积函数:若随机变量x服从二项式分布,则有二项分布的总体平均数为二项分布的总体标准差为:二项成数(百分数)分布的平均数:二项成数(百分数)分
7、布的标准差:B(n, p)BINOMDISTxnumber_s实验成功次数ntrials独立实验次数pprobability_s一次实验中成功的概率cumulativeTrue: False:例:假设年龄6064岁的100名男性在1986年注射了一种新的流感疫苗而在第二年内死亡5人,这正常嘛?(注:1986年,6064岁的男性老人第二年的死亡率约为0.02)解:要知道100个男性的样本死亡5人是不是“异常”事件,这种估计的一个准则是寻找至少5人死亡的概率。注:通常是把概率值为0.05或者更小的概率事件识别为异常(稀有事件)。由于至少5人死亡的概率是0.05,可见100人中至少死亡5人是稍微有点
8、异常,但不是很异常。 如果至少死亡10人,那么概率是3.44*10-5,这就很不正常,因而,在没有其他证据显示此疫苗有效前,应考虑停止使用。3. 正态分布(高斯分布)为总体平均数, 为总体标准差正态分布的特征1. 当 时,f(x)有最大值2. 当 的绝对值相等的时候,f(x)值也相等3. 当 的绝对值越大,f(x)值就越小,但永远不等于04. 正态分布曲线完全由函数 和 来决定5. 正态分布曲线在 处各有一个拐点6. 正态分布求和为0NORMDISTxiX函数值的区间点Mean算术平均值Standard_dev标准差cumulativeTrue: 累积False:概率密度函数值 标准正态分布:
9、NORMSDISTxiZ标准正态分布的区间点 NORMSINVuprobability正态分布概率,介于01之间,含0,14 t分布:是小样本分布,小样本分布一般是指n t) = probability,即P(|X| t) = P(X t) 2)单尾 t 值可通过用两倍概率替换概率而求得 eg:如果概率为 0.05 而自由度为 10 , 双尾值由 TINV(0.05,10) 计算得到2.28139; 而同样概率和自由度的单尾值由 TINV(2*0.05,10) 计算得到 1.812462。 5.卡方分布 P456.F分布1、概率抽样:根据已知的概率选取样本简单随机抽样:完全随机地抽选样本分层抽
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 考试 总结 汇总
链接地址:https://www.31ppt.com/p-4047846.html