第二章统计是定义.ppt
《第二章统计是定义.ppt》由会员分享,可在线阅读,更多相关《第二章统计是定义.ppt(58页珍藏版)》请在三一办公上搜索。
1、生物统计学,BIOSTATISTIC,统计的定义,用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。,统计应用引例,我国东部和西部的概念是一个比较笼统的概念。如何能够根据需要,选择一些指标来把各省,或各市县甚至村进行分类呢?一个从来没有研究过红楼梦的统计学家如何根据比较写作习惯得出红楼梦从哪一章节开始就不是曹雪芹的手笔了呢?,生物统计学的概念,生物统计学(biostatistics):是用数理统计(mathematical statistics)的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。,如何理解下面说法?,“明天降水概率为4
2、0%”“支持率为95的置信区间为(25%,30%)”“甲药物比乙药物的疗效显著”“判断某动物属于杂食偏草食动物”“该结果统计意义显著”“身高与体重有显著的相关性”,统计的一个重要但又往往不易为人所理解的特点是统计从来不绝对地说“是”或者“不是”。统计只能够说可能,而且往往提供某事可能发生的概率。统计只说可能性是实际世界的真实体现。真实世界充满了不确定性。,总体(population):具有相同性质的个体所组成的集合称为总体,或述为研究对象的全体。个体(individual):组成总体的基本单元称为个体。,总体、个体与样本,样本(sample):从总体中抽取的若干个体所构成的集合称为样本。它作为
3、总体的代表,是用来估计总体一般特性的。组成样本的每个个体叫样本单元(sample unit),样本中个体的数目称为样本容量(sample size),也叫样本含量,用字母n来表示,在生物学研究中,n30的样本叫大样本,n30的样本叫小样本。,总体与样本的关系样本是总体的缩影,统计分析的任务就是由样本推断总体,因此任何试验都存在抽样问题。为使样本正确地反映总体,抽样时必须采用随机的方法,即随机抽样。,参数和统计数参数:描述总体特征的数量叫参数。一般用希腊字母表示。参数是恒定不变的常量,常用希腊字母表示。如总体平均数,总体标准差。参数是反映事物的总体规律性的数值,科学研究的目的就在于求得对总体参数
4、的了解。统计数:描述样本特征的数量叫统计数。一般用拉丁字母表示。统计数是估计值,根据样本不同而不同,常用小写拉丁字母表示,如样本平均数(x)、样本标准差(s)。,效应与互作主效应(main effect):试验因素相对独立的作用称为主效应,简称主效或效应(effection)。互作效应(interaction effect):两个或两个以上处理因素间相互作用所产生的效应,简称互作或连应(interaction),误差的分类:随机误差(random error):由于试验中许多无法控制的偶然因素所造成的观测值偏离真值的差异。完全是偶然的,找不出确切原因引起的误差,也称偶然性误差(accident
5、al error)。特点:不可避免,无法控制。可通过增加抽样或试验次数降低随机误差系统误差(systematic error):有一定原因引起的误差,也称偏差(bias)。特点:有一些相对固定的因素引起。在某种程度上可以控制,需要精细试验,错误(mistake),是指在试验过程中,人为因素所引起的差错。如:测量仪器校正不准 药品配制比例不当 称量不准确、数据抄错、计算错误注意:降低随机误差 避免系统误差 杜绝错误,准确性(accuracy):指在调查或试验中某一试验指标或性状的观测值与真值接近的程度,也称准确度精确性(precision):指调查或试验中同一试验指标或性状的重复观测值彼此接近程
6、度的大小。特点:准确性不等于精确性,准确性反映测定值与真值符合程度的大小,而精确性反映多次测定值的变异程度,准确性与精确性,目的与要求,目的:根据生物统计学的基本原理和方法,能正确设计科学试验,正确处理试验结果,从中得出较为客观的结论,从而解决在生产与科研实践中诸多单纯依靠生物学知识所不能解决的问题。要求:能掌握生物统计学的基本原理和方法,合理地设计试验和总结试验结果,对试验所获得的数据能够熟练地进行数理统计分析。教学的重点在于:各项统计分析方法的理论依据和适用范围。,第 二章 试验资料的整理与特征数计算,2.1统计数据的搜集与整理 数据的不齐性:1、变异性是自然界存在的客观规律(生物体的变异
7、性主要由遗传因素、环境因素和发育差异造成)。2、生物学研究的对象都是很大的群体,不可能研究全部对象,只能通过研究其中的一部分,来推断全部对象。,2.1.1 数据类型,一、数据类型定(数)量变量(数量性状资料):可测量或计数的变量,可用具体数值与特定计量单位表达的数据称为定量变量。离散型数据(又称离散型变量):由记录不同类别个体的数目所得到的数据,又称计数数据。如脉搏计数、血细胞计数、电泳谱带数、动物死亡个数、孵化个数等。各个观察值只能以整数表示连续型数据(又称连续型变量):是用连续性的数值大小反映某项特征的变量,又称度量数据。如试验中测得的植物的株高,动物体的体长、重量,某化学物质的吸光度等。
8、各个观测值不一定是整数,定性变量(质量性状资料):指能观察到而不能直接测量的变量。这类性状本身不能直接用数值表示。名义变量:如:性别(男女)、血型(A、B、AB、O)、反应阴性与阳性等有序(等级)分类变量:通过相对的优劣差异等级、大小差异等级分类所定义的测量尺度。如,疗效(显效、有效、好转、无效)、动物偏草食程度(完全草食性、杂食性偏草食性、杂食性偏肉食性、完全肉食性)等、植物感病程度,定性变量(质量性状资料)为便于统计分析,需先把质量性状资料数量化,方法如下:统计次数法(frequency counting):于一定总体内,根据某一质量性状的类别统计其次数或频数,以次数或频数来作为该质量性状
9、的数据评分法(point system):用数字级别表示某现象在表现程度上的差别,生物统计学的用途,生物统计学是运用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门科学,是一门应用数学。在生物学研究中具有重要的作用:对试验设计有重要的指导作用提供数据整理分析的方法提供由样本推论总体的方法提供分析变异因素的方法帮助分析现象之间的关系直观的图表展示,有助于理解和接受,2.1.2 试验资料的搜集,试验资料的来源有两个:一是调查,二是试验。统计学对原始资料都要求完整和准确调查(survey)普查:是指对研究对象的每一个个体都进行测量或度量的一种全面调查要求:在一定时间或范围内进行,目
10、的是摸清研究对象的基本情况。不常用抽样调查(sampling survey):根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。,抽样是从总体中获得样本的过程。,随机抽样(random sample):是指总体中的每一个个体都有同等的机会被抽取组成样本。从有限总体中抽样,可分为放回式抽样和非放回式抽样放回式抽样:从总体中抽出一个个体,记下特征后放回总体中,再做第二次抽样;非放回式抽样:从总体中抽出个体后,不再放回。对于无限总体来说,放回式抽样和非放回式抽样实际上是没有区别的。,抽样,2.1.2 试验资料的搜集,随机抽样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 统计 定义
链接地址:https://www.31ppt.com/p-5048210.html