SPSS课程PPT(生物统计学基本知识).ppt
《SPSS课程PPT(生物统计学基本知识).ppt》由会员分享,可在线阅读,更多相关《SPSS课程PPT(生物统计学基本知识).ppt(221页珍藏版)》请在三一办公上搜索。
1、生 物 统 计 与 实 验 设 计 I,Biological Statistics And Experimental Designs I,2,课程内容:,生物统计与试验设计I 所涵盖内容(学科基础,预备课程)生物统计学基础(统计的眼光看问题)统计学基本概念 统计推断参数估计、假设检验 统计分析方法及应用(统计的方法解决问题)方差分析、回归分析、试验设计等等生物统计与试验设计II 所涵盖内容(方法合成,软件应用)协方差分析 统计软件分析及应用(SPSS),3,课程简介,学科基础课 40/2学分,第一章 生物统计学基本知识 第二章 置信区间估计第三章 假设检验第四章 方差分析第五章 回归分析第六章
2、 基本试验设计及其统计分析,考核方式:课堂开卷(需使用计算器),4,基本参考书,1 李春喜、姜丽娜、邵云、王文林,生物统计学(第三版),科学出版社,2006 2 伯纳德.罗斯纳著,孙尚拱译,生物统计学基础(原书第五版),科学出版社,2004,5,第一章 生物统计学基本知识,1、明确统计在做什么事情、将用什么样的方式去做。2、生物统计与统计学的关系,其涉及哪些内容,6,从什么是统计谈起,7,日常生活中,我们常听到很多关于“统计”的词汇.例如:国家统计局公布,2004年全国GDP增长9%;国家气象局预报,明天北京天气阴,降水概率40%;2003年,北京市人平寿命77.93岁,婴儿死亡率为5.56,
3、儿童计划免疫接种率98%.这些主要健康指标已接近或超过中等发达国家的水平.北京日报.京报网,2003年11月20,8,统计是人类思维的一个归纳过程 站在一个路口,看到每过去20辆小轿车时,也有100辆自行车通过而且平均每10个轿车载有12个人于是,你认为小汽车和自行车在这个路口的运载能力为24:100这是一个典型的统计思维过程,9,感受统计(之一),统计在战争中的例子:二战时期,德国的潜艇非常猖狂,而盟国的雷达还不够先进,给英国的运输船队造成巨大的损失,英国人通过多次统计观察,发现有德国潜艇的上方,会聚集大量的海鸟。朝鲜战场上,美国人对志愿军感觉很奇怪,他们的一个军事专家,通过统计发现,志愿军
4、的进攻大约是七天一个周期,打七天,志愿军肯定会跑,或者叫转移。,10,感受统计(之二),撑死的人比饿死的人多!据统计,肥胖并发脑血栓和心衰的发病率比正常体重者高一倍,患冠心病者多25倍,高血压发病率多26倍,合并糖尿病者高4倍,合并胆石症者高46倍。美国生命保险协会的统计调查结果显示,超重25和35的肥胖症者的死亡率比正常人高28和50,表明肥胖程度和死亡率呈正相关。美国每年因肥胖伴有冠心病、高血压、高血脂、糖尿病和脑血管意外而死亡的人数大约有30万人。,11,感受统计(之三),媒体的数字化倾向 统计视线里的社会和经济 文革时期媒体种类数量少得可怜不说,且在有限的报导中空话、大话和假话连篇,较
5、典型和常见的情况就是不敢用数字来实打实地说话。随着改革开放特别是市场经济体制的确立,使得媒体开始“青睐”起数字来。但凡打开任何一张报纸的任何一个版面的任何一条消息,无不或多或少的“充斥”着统计数字。媒体的这种数字化倾向表现出在社会、经济和生活中用数字解说相应问题的现实状况。,12,众所周知,红楼梦一书共120回,一般认为前80回为曹雪芹所写,后40回为高鹗所续,长期以来对这个问题一直有争议。能否从数学上做出论证?1985、1986复旦大学李贤平教授带领他的学生作了这项有意义的工作,他们创造性想法是将120回看成是120个样本,然后确定与情节无关的虚词作为变量(所以要抛开情节,是因为在一般情况下
6、,同一情节大家描述的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的),计算出每一回里变量出现的次数,用多元分析中的聚类分析法进行分类,果然将120回分成两类即前80回为一类,后40回为一类,很形象地证实了不是出自同一人的手笔。,后40回出自谁的手笔,13,后40回出自谁的手笔,之后,又进一步分析前80回是否为曹雪芹所写?这时又找了一本曹雪芹的其它著作,做了类似计算,结果证实了用词手法完全相同,断定为曹雪芹一人手笔。而后40回是否为高鹗写的呢?论证结果推翻了后40回是高鹗一个人所写。这个论证在红学界轰动很大,他们用多元统计分析方法支持了红学界观点,使红学界大为赞叹。,14,统计
7、的误用,对同样数据为何会有不同反响数据和信息有本质区别有些统计的误用者是无意的,但有些人却是为达到某种目的故意地隐藏不利资料而突出有利部分,所以统计可以变为制谎者的“工具”和政治家的“手段”。统计“谎言”的一种常见现象较多出现在小样本的观察结果上。,15,Case study该案例的所有内容均来自网络,课程不做任何评论,仅作为思考素材,http:/,16,http:/,17,http:/,http:/,29,1、什么是统计?,统计的原义合计、汇总计算。统计对大量现象数量方面进行的调查研究活动。即指人们为了说明所研究现象的某种数量特征和规律性而对有关数据进行搜集、整理和分析研究。,一、统计学的产
8、生和发展,30,什么是统计学?,统计学的英语单词是statistics,来源于state,即指政府,官方所要求的信息。统计学是研究随机现象规律性的方法学。统计学是一门关于如何收集、分析、解释和表达数据的科学。-Websters International Dictionary,31,2、统计的三种涵义,统计工作统计实践活动,是人们为了说明所研究对象的某种数量特征和数量规律性,而对该现象的数据进行收集、整理与分析的活动。,统计资料即统计数据,是通过统计工作所获得的能够说明现象总体某种特征的数据,是统计实践活动的成果。,统计学即统计科学,是一门研究收集数据、表现数据、分析数据、解释数据,从而认识数
9、量规律的方法论科学。,32,统计学是:“关于收集和分析数据的科学与艺术(art)”。,3、另一种定义 来自不列颠百科全书的定义,艺术性体现在:1)、数据有随机性(带偶然误差)。2)、应用时有人的判断和主动性(“艺术”),不是死套公式。,33,4、统计实践活动的产生和发展,有文字记载的统计实践活动,如埃及建造金字塔时期,中国大禹治水时期。资本主义生产方式出现以前,统计主要限于人口/土地/财产等;随着资本主义生产方式的推进,统计飞速发展统计内容扩展,专门统计机构成立;20世纪50年代以后,统计又得到了迅速发展。,34,5、统计学的产生,国势学派(记述学派)(德)海门尔康令;阿亨瓦尔1749年提出“
10、统计学”。有统计学之名,无统计学之实。政治算术学派威廉配第,约翰.格朗特 用数字描述经济现象和人口状况;虽无统计学之名,但有统计学之实。数理统计学派凯特勒(比利时)。引入概率论,开创近代统计学。使统计学产生了质的飞跃 统计方法成为通用方法;重心从描述统计转移到推断统计 社会统计学派恩斯特.恩格尔;梅尔。从实质论逐渐转向(社会现象数量研究的)方法论,与数理统计学派从对立逐渐转向融合。,35,6、统计学的发展进程,1统计学的初创阶段(17世纪中叶19世纪末)。描述统计和概率论的基本内容和框架逐渐形成。2以推断统计为中心的现代统计学的形成阶段,(20世纪上半叶)。概率论体系日臻完善,推断统计迅速发展
11、,逐渐构筑起了以推断统计为中心的现代统计学的基本框架。3统计理论方法与应用全面发展的新阶段(20世纪50年代起)。统计学研究的新领域层出不穷,开拓了许多新分支和新方法;统计的应用领域也不断扩展;计算机为统计理论和方法的不断完善和深化提供了不可缺少的工具。,36,统计学可以应用于几乎所有的领域:,精算,农业,动物学,人类学,考古学,审计学,晶体学,人口统计学,牙医学,生态学,经济计量学,教育学,选举预测和策划,工程,流行病学,金融,水产渔业研究,遗传学,地理学,地质学,历史研究,人类遗传学,水文学,工业,法律,语言学,文学,劳动力计划,管理科学,市场营销学,医学诊断,气象学,军事科学,核材料安全
12、管理,眼科学,制药学,物理学,政治学,心理学,心理物理学,质量控制,宗教研究,社会学,调查抽样,分类学,气象改善,博彩等。,37,一句话,要记住:统计学(statistics)是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。,38,根据研究领域和研究对象,统计学又分为:数理统计、经济统计、生物统计、医学统计、卫生统计在上述学科已经有其特有的方法和特点;如生物统计(biostatistics)、经济计量学(econometrics)以及目前很热门的生物信息(bioinformation)和数据挖掘(Data Mining)的方法主体都是统计。,39,1.采用统计学方法,发现不确定
13、现象背后隐藏的规律。变异(variation)是社会和生物医学中的普遍现象。变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。,为什么要学统计学?,40,最大值=6.18,最小值=3.29,极差=2.89 算术均数=4.72,标准差=0.57。,41,二、统计学的研究对象与研究方法,1、统计学的研究对象群体现象的数量方面,即现象总体的数量特征和数量关系。数量性 统计研究现象的数量特征(从数量上来认识事物的性质和规律性).在质与量的辨证统一中研究;不同于纯数量的研究。总体性 研究大量个别事物构成的现象整体的数据。现象的数量规律性只有在总体层面上才能体现出来;研究目的在于
14、说明总体特征,但常常从观察个体数量特征入手,分析时也要注意一般与个别的结合.,42,1)大量观察法 指对总体中的全部或足够多数的单位进行调查观察和综合研究。其数理依据是大数定律从数量关系上揭示了现象的偶然性与必然性的关系。实质上是统计研究的重要思想方法和原则,而不是一种具体的应用方法。2)分组法根据研究目的和现象的性质特点,按照一定的标志将总体分为若干部分的一种研究方法。其应用贯穿于整个统计工作的全过程。,2、统计学的研究方法,43,3)综合指标法指运用各种综合指标来反映和研究现象总体的数量特征和数量关系。数字(即指标数字)是统计的语言。综合指标法既是描述统计的中心,也是推断统计的基础。4)统
15、计模型法根据一定的理论和假定条件,用数学模型去模拟现象之间相互关系、现象变化趋势等的一种研究方法。统计模型包括三个要素变量、数学关系式和模型参数。统计模型的参数由实际观察的数据来估计。,44,5)归纳推断法 从个别到一般、从具体事实到抽象概括的推理方法,称为归纳法。以一定的可信程度,根据样本数据来判断总体数量特征的归纳推理方法称为统计推断法。,45,三、统计学的分类,1、描述统计与推断统计描述统计研究如何对客观现象的数量特征进行计量、观察、概括和表述。用表和图表示,计算特征量(如平均值)等,所论不超出已有数据。推断统计(统计推断)据数据所提供信息对数据所来自的总体(母体)的性质作推断,推断会有
16、错误、误差,用概率论的术语和方法来描述和论证。误差的产生源于数据有误差。怎样尽可能减少推断的错误和误差,是统计推断的中心问题。,46,目的描述数据特征找出数据的基本规律内容确定要研究的数量特征设计统计指标(说明这些数量特征的)搜集数据整理数据计算并显示指标数据,x=30 s2=105,2、描述统计,47,目的对总体特征作出推断。内容参数估计假设检验相关回归分析,3、推断统计,48,4、描述统计与推断统计的关系,反映客观现象的数据,描述统计(统计数据的搜集、整理、显示和分析等),统计学探索现象数量规律性的过程,49,1)理论统计学是关于数据的搜集、整理和分析的最基本原理、原则和方法。适用于各种现
17、象数量特征的分析研究。它是应用统计学共同的理论基础。所谓统计学是一门通用方法论科学,就是指理论统计学而言。2)应用统计学运用于某一特定领域的统计理论和方法。例如:生物统计学、医药统计学、气象统计学、科技统计学、经济统计学(宏观经济统计学、企业经济统计学、金融统计学、保险统计学、价格统计学、对外贸易统计学),5、理论统计学与应用统计学,50,统计学的应用领域,51,1、统计学与数学 联系:一方面,统计学要用到数学知识,统计的数量分析要符合数学原理;另一方面,统计方法和数学方法一样,并不能独立地直接研究和探索现象的规律,而是为各学科提供研究和探索客观规律的数量分析方法。,四、统计学与其他学科的关系
18、,52,区别主要在于:(1)数学研究的是抽象的数量规律性,而统计学研究的是具体的、实实在在的数量规律性。数学研究的是没有量纲或单位的数,而统计学研究的是有具体实物内容或计量单位的数据。(2)数学研究使用的是纯粹的演绎,而统计学是演绎与归纳相结合,且占主导地位的是归纳。,53,2、统计学与哲学 哲学是关于自然、社会和思维发展的普遍规律的科学,包括辨证唯物主义和历史唯物主义,它不仅是正确的世界观,也是科学的方法论。统计学作为一门探索客观事物数量规律性的方法论科学,必然要以哲学作为它的方法论基础。,3、统计学与其他学科的关系 统计方法可以帮助其他学科探索内在的数量规律性,而这种数量规律性的解释(和由
19、数量规律性进而研究各学科内在的规律)只能由各学科的研究完成。,54,生物统计学的概念及主要内容,生物统计学(Biostatistics)是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。属于生物数学的范畴。,55,二、主要内容,生 的物 基统 本计 内学 容,试 验 设 计,统 计 分 析,基本原则方案制定常用试验设计方法,资料的搜集和整理数据特征数的计算统计推断方差分析回归和相关分析协方差分析主成分分析聚类分析,对比设计随机区组设计裂区设计拉丁方设计正交设计,56,生物统计学的基本作用:,提供整理和描述数据资
20、料的科学方法,确定某些性状和特征的数量特征。,运用显著检验,判断试验结果的可靠性或可行性。,提供由样本推断总体的方法。,提供试验设计的一些重要原则。,57,常用统计学术语,一、总体与样本,具有相同性质或属性的个体所组成的集合称为总体(population),它是指研究对象的全体;组成总体的基本单元称为个体(individual);从总体中抽出若干个体所构成的集合称为样本(sample);总体又分为有限总体和无限总体:含有有限个个体的总体称为有限总体(finitude popuoation);包含有极多或无限多个体的总体称为无限总体(infinitude popuoation).,58,构成样本
21、的每个个体称为样本单位;样本中所包含的个体数目叫样本容量或样本大小(sample size),样本容量常记为n。一般在生物学研究中,通常把n30的样本叫小样本,n 30的样本叫大样本。对于小样本和大样本,在一些统计数的计算和分析检验上是不一样的。研究的目的是要了解总体,然而能观测到的却是样本,通过样本来推断总体是统计分析的基本特点。,59,二、变量与常量,变量,或变数,指相同性质的事物间表现差异性或差异特征的数据。常数,表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。,60,变量,定性变量,定量变量,连续变量,非连续变量,只有整数出现,可以有任何小数出现,61,为了表
22、示总体和样本的数量特征,需要计算出几个特征数,包括平均数和变异数(极差、方差、标准差等)。描述总体特征的数量称为参数(parameter),也称参量。常用希腊字母表示参数,例如用表示总体平均数,用表示总体标准差;描述样本特征的数量称为统计数(staistic),也称统计量。常用拉丁字母表示统计数,例如用 表 示样本平均数,用S表示样本标准差。,三、参数与统计数,推断inference,62,基本统计参数一、平均数 算术平均数 几何平均数,63,二、变异数 极差 极差又称全距,它是样本变量中最大值和最小值之差,一般用R表示。方差(Variance)样本方差 总体方差,64,标准差(standar
23、d deviation)样本标准差 总体标准差变异系数 Variation coefficient 变异系数是样本变量的相对变异量,是不带单位的纯数。用变异系数可以比较不同样本相对变异程度的大小。,65,四、效应与互作,通过施加试验处理,引起试验差异的作用称为效应。效应是一个相对量,而非绝对量,表现为施加处理前后的差异。效应有正效应与负效应之分。,互作,又叫连应,是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效应(协同作用)与负效应(拮抗作用)之分。,66,五、随机误差与错误,变异,效应,误差,随机误差机误(Random error),系统误差错误(Systematic error
24、),67,随机误差,也叫 抽样误差(sampling error)。这是由于试验中无法控制的内在和外在的偶然因素所造成。如试验动物的初始条件、饲养条件、管理措施等尽管在试验中力求一致,但也不可能达到绝对一致,所以随机误差带有偶然性质,在试验中,即使十分小心也是不可避免的。如果通过良好的试验设计、正确的试验操作,增加抽样或试验次数,随机误差可能减小,但不可能完全消灭。统计上的试验误差一般都指随机误差。随机误差越小,试验精确性越高。,68,系统误差,也叫片面误差(lopsided error)。这是由于试验条件控制不一致、测量仪器不准、试剂配制不当、试验人员粗心大意使称量、观测、记载、抄录、计算中
25、出现错误等人为因素而引起的。系统误差影响试验的准确性。只要以认真负责的态度和细心的工作作风是完全可以避免的。,69,六 准确度与可靠度,准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(常用指标:如灵敏度、特异度)。可靠度(reliabiliy)也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响(常用指标:一致百分率、Kappa值)。,70,71,样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f 次,则事件A出现的频率为f/n。概率:随机事件发生
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 课程 PPT 生物 统计学 基本知识

链接地址:https://www.31ppt.com/p-2878144.html