MedicalStatistics医学统计学.ppt
Medical Statistics 医学统计学,童新元 中国人民解放军总医院 2005年10月12日,供临床医学硕士研究生教学用,面对复杂的医学问题怎样处理?,“当人类科学探索者在问题的丛林中遇到难以逾越的障碍时,唯有统计工具可为其开辟一条前进的通道”。-英国著名遗传学家Galton(1822-1911),为何开设医学统计课?,讲课的内容,统计学学科发展概论医学统计学课程按排医学统计学学习方法医学统计学基础知识,一、统计学概论 漫谈”统计”,(1)什么是统计?,日常生活中,我们常听到很多关于“统计”的词汇.例如:国家统计局公布,2004年全国GDP增长9%;国家气象局预报,明天北京天气阴,降水概率40%;,报刊统计信息文摘,2003年,北京市人平寿命77.93岁,婴儿死亡率为5.56,儿童计划免疫接种率98%.这些主要健康指标已接近或超过中等发达国家的水平.北京日报.京报网,2003年11月20,常遇见的统计问题,癌症病人不做手术或做术后能生存多久?新药的用量、用法如何,疗效怎样判定?吸烟对人类的危害到底多大?我考取医学研究生的机会多大?考试合格的可能性多大?,典型统计案例1,时间2004年11月2日,总统大选中的统计学-从2004年美国总统大选谈“统计”,总统大选记事,2004年总统角逐已作为一场耗时最长、花钱最多的总统选战而载入历史。,时间:从9月30日至11月2日费用:50亿美元,谁会当总统?,主要候选人:共和党布什,民主党克里和独立候选人 纳德尔,谁当总统:由选民投票决定.参加投票选民1.2亿,在投票前很多人和集团想知道,谁会当总统,以便支持谁.,民调:许多公司在选举开始前进行调查,“民调”有多准?,在美国总统大选中,决定民调可靠程度的关键是抽样调查的人数和对象。,在美国一个可靠的全国性调查将对1000名至3000名可能投票的选民进行调查.,抽样误差不超过3%。,2004年美国总统大选,CNN的选民信息是采取科学的统计抽样方法,深入全国每一个县(州)取得。尽量保证统计模型与真实情况吻合。,2004年美国总统大选:三人角逐 2004年10月31日,选举最后结果,候选人选举人票百分比布什286票53%克里252票47%,大选中四种主要人物,候选人总统与副总统合格选民参加投票新闻记者文字描写与推测统计学家数据管理与分析,大选及民调中的统计学问题,一、统计设计总体与样本、样本的大小怎样抽样、抽样误差二、数据管理和质量控制如何搜集数据、整理数据、系统误差、过失误差、质量控制方法三、数据分析数据描述(投票率)、统计推断、决策(大选的有效性、谁胜谁负),现代社会中,大到国家重大政策的制定,小到人们的日常生活,几乎都离不开统计学提供的信息。,统计学的知识已渗透到自然科学、社会科学以及人类生活的各个领域。,(2)三类现象,自然界和人类社会活动中,普遍存在三类现象。确定性现象:在相同的条件下出现相同的结果,称为确定性现象或必然现象。如自由落体。随机性现象:在相同的条件下出现不同的结果,但结果是确定的,称为随机性现象。如掷硬币。模糊性现象:在相同的条件下出现不确定的结果,称为模糊性现象。如美人与丑人。,不同现象与研究方法,现象研究方法确定性现象经典数学随机性现象概率统计学模糊性现象模糊数学,(3)什么是统计学?,统计学的英语单词是statistics,来源于state,即指政府,官方所要求的信息。统计学是研究随机现象规律性的方法学。统计学是一门关于如何收集、分析、解释和表达数据的科学。-Websters International Dictionary,统计学是“对令人困惑费解的问题做出数字设想的艺术。”-美国David Freedman 统计学是一门处理数据中变异性的科学和艺术。-John M.Last A Dictionary of Epidemiology,(4)常见的统计学试验,奥运会比赛中,各项球运动谁先开球,体操、跳水运动员出场的顺序怎样决定的?,经典统计试验:掷硬币、抽签、骰子,为什么采用这样“统计试验”方式决定呢?,“公正、公平、公开”,自由经济或市场经济社会倡导的三公原则其内部蕴藏着统计学的思想。体育彩票、球足彩票、福利彩票、抽奖等博彩活动中,都运用了统计学的知识。“由赌局引的一门学问,居然会为人类知最重要的研究对象,这实在令人非常惊奇。”-法国数学家Laplace(1745-1827),在现实生活中,经常会遇到各种不确定性的问题,人们常常凭直觉和经验来处理问题。直觉,经验对于人们的审美生活、观察研究很重要。,(5)直觉 经验与统计,直觉与统计,1.某商场调查100名顾客,询问她们对A,B,C三种化妆品的喜好,结果如下:有2/3的顾客喜欢A而不喜欢B,有2/3的顾客喜欢B而不喜欢C.问是否喜欢A而不喜欢选C的最多?,A)对 B)不对,这个问题来源于著名的阿诺悖论,肯尼思.阿诺由此证明,一个十全十美的民主选举系统是不可能实现的,1972年获诺贝尔经济学奖.,直觉与统计,2.一家有两个小孩,问:已知一个是女孩,另一个也女孩的可能性多大?,A)1/2 B)1/3 C)1/4 D 1/5,直觉与统计,3.一个班有100同学,问至少有两个同学生日相同的可能性多大?,A)5%B)50%C)95%D)99%,直觉虽重要,但有时直觉会产生错觉。直觉 经验规律 进行科学研究活动时,需要直觉来发现问题,产生灵感,但必须采用科学的方法进行实验,经过严格的验证后,才能得出事物内在的客观规律。,(6)统计学的应用,统计学的理论是随着人类社会生产的需要而产生,同时也随着人类社会生产的发展而更新,特别是近二十年来,统计学的理论方法和应用方面得到迅速的发展。统计学与各个专业结合形成数十个学科分支,如人口统计学、心理统计学、遗传统计学、社会统计学、经济统计学、卫生统计学、医学统计学、生物统计学等。,第2节,医学统计学是统计学与医学结合形成的一门学科,是统计学在医学中的应用。卫生部定为医学专业硕士研究生必修课。生物统计学是统计与生物医学结合形成的一门学科.,(7)统计学的重要性,1983年12月8日第六届全国人民代表大会常务委员会第三次会议通过了中华人民共和国统计法。对发挥统计信息、咨询、监督的作用提供了重要的法律保障,对发展我国统计事业具有重要意义和作用。1998年9月国家教育部颁布的普通高等学校本科专业目录和专业介绍将统计学列为理学类一级学科。,2001年,中国国家教育部为推进基础教育改革而推出新课程标准,将统计学纳入新的小学数学课程。要求小学生要“经历运用数据描述信息、作出推理的过程,发展统计观念”。法国政府已将统计学列入二十一世纪影响法国社会发展的十个重大领域之一。,据调查,新英格兰医学杂志(New England J.Medical)、美国医学杂志(JAMA)、英国医学杂志(BritishJ.Medical)和Lancett等著名医学杂志发表的文章中,有70%应用了统计学,而且杂志有统计学的常务编审。一些著名医科大学和医院中,要求硕士和博士毕业论文的开题报告有统计方面的思考和统计学家参加,毕业论文答辩前要求请统计学家进行审阅。,“统计学是现代医学大厦的一个重要支柱”。-美国医学会杂志(JAMA)主编,(8)医学统计学发展简史,19世纪初,现代科学思想和科学方法在医学研究中的应用初见端倪。代表性人物:法国医生P.C.A.Louis。典型统计案例2 代表性研究:“放血”疗法治疗肺炎的效果,1835年,Louis对当时流行的“放血”疗法治疗肺炎的效果进行了比较.发现“放血”的疗效不象预期的那么好。而且早期“放血”和晚期“放血”组比较,患者的诊断、病情、病程、年龄等方面的差异很大,比较平均治愈时间意义不大。因为晚期“放血”组的平均治愈时间长,但该组患者病情重、病程长、年龄大。,Louis的研究虽然没有彻底否定“放血”疗法,使在西方延续了2000余年的“放血”疗法一直持续到20世纪初。但他对医学研究的方法学作出了很大贡献:用数字的方法表示疾病的特征和预后;提出了临床疗效对比的前瞻性原则;提出抽样误差和混杂(confounding)概念。其中前瞻性研究和减少混杂,分别成为当今临床试验和流行病学研究的基本研究方法。,世界第一部医学统计学教科书,在著名法国数字家S.D.Poisson(1781-1840)的学生J.Gavarret的协助下,Louis的数字方法发展为“概率框架”,Gavarret于1840年在巴黎出版了世界第一部医学统计学教科书。,现代生物统计的产生,20世纪20年代,英国统计学家R.A.Fisher爵士(1890-1962)在伦敦附近的Rothamsted农业实验站,创立了实验设计方法和统计分析技术,奠定现代生物统计的基础。1948年,英国发表了评价链霉素治疗肺结核疗效的随机对照临床试验报告,第一次采用生物统计方法进行临床干预试验。,我国第一部医学统计的教科书,生物统计方法在我国医学界的传播与运用也始于20世纪初。1945年,郭祖超教授(19121999)编著的医学与生物统计方法,是我国第一部医学统计方法的教科书。现在医学统计的教科书很多,但适合临床医学的比较少。,二、医学统计学课程按排与要求,课程名:医学统计学硕士研究生必修课授课单位:解放军总医院医学统计教研室授课教员:童新元、张高魁医学统计教研室简介:承担任务:教学:硕士必修课 硕士选修课 博士必修课 以及统计学思想的普及和统计培训工作咨询:医学及科研工作者的统计咨询科研:医学统计学专业的研究地点:301医院门诊楼740电话:937716,授课课时:共33次课 128学时 其中:大课讲授18次课(72学时)上机12次课(48学时)复习1次课(4学时)考试2次课(8学时)授课学分:3学分授课时间:2005年10月12日至2006年1月19日授课地点:科学文化中心实习地点:计算机中心三层实习教室,(1)教师授课说明,大课讲授:18次课72学时 统计方法+典型统计案例,目的:讲授医学统计学的基本理论“三基”:“基本概念、基本原理和方法”培养统计思维与逻辑思维的能力培养讨论、跨学科交流协作的精神,(2)计算机上机实习说明,共12次课(48学时)分4批进行每个同学上机6次,每次1.5小时分批由老师与班长商定上机严格按批按座位进行。,目的:统计理论与实验相结合 为科研和毕业论文提供分析工具,(3)考试说明,考试分两部分笔试考试:闭卷50分 上机考试:开卷50分,目的:检验医学统计学掌握的程度 检验医学统计学的教学效果,2004级硕士医学统计学成绩情况,2004级硕士医学统计学成绩讲评,考试70分以上合格,85分以上方能提前转博;优秀率37%,合格率96%;7人不极格(4%),下一年重学一次进行补考.其中4人因有两门不及格退学.,(4)教学期间要求,遵守军队和医院的规章制度,遵守课堂纪律。特别提示如下:严禁上课接打手机;严禁计算机实习时做与统计无关的其它事;严禁迟到和早退,有事须向授课教师报告。教学过程中若发现问题,请及时同教研室联系联系电话:937716,三、医学统计学学习方法,发现不少医务工作者曾多次学习统计学课程,但仍然对统计学知识理解很模糊。有的学员统计知识学习成绩很好,但是遇到很简单的实际问题也不会解决。,怎样学好医学统计学,思想观念+学习方法+学习时间,(1)思想观念,统计学不神秘,不可怕,不难学好,统计学既很有用,也很有趣。热爱是最好的老师.,历史上很多非统计专业人员,通过对统计学的学习和研究,在专业和统计学取得有很深的造诣。物理学家爱因斯坦学习和研究统计,将统计学思想应用于他的物理学和哲学研究中。生物学家达尔文学习和研究统计,进化论方面的工作在本质而言是属于生物统计学。护理学的奠基人 Nightingale学习和研究统计,出版世界上第一部医院统计的专著医院统计与医院规划。,(2)学习方法,2)重视典型案例的系统学习,重点掌握“三基”:“基本概念、基本原理和方法”不需要记公式和公式推导,3)重视理论与实践(上机实习)相结合,(3)学习时间,必须花足够的时间认真学习.建议授课与自学时间比例 1:3.,四 统计学基础知识,(1)统计学的基本内容,一、试验设计 二、数据管理和质量控制 三、数据分析,(2)同质和变异,同质(homogeneity)就是性质相同,它是进行统计分析的前提.变异 研究对象之间的差异.,(3)总体、个体与样本,总体(population)是根据研究目的性质相同的所有观察单位集合.个体(individual)是总体中的基本观察单位(observation unit),可以是一个人、一个动物、一个家庭、一个地区、一份样品等,样本(sample)是从总体中随机抽取的部分观察单位的集合。,(4)统计量和参数,统计量(statistic)是反映样本特征的数量参数(parameter)是反映总体特征的数量.,(5)频率和概率,频率的定义 在n次相同试验中,事件A发生的次数占试验总数的比例,称为事件A发生的频率(frequency),记为f。频率的大小反映了事件A发生的频繁程度,频率大,则事件A发生就频繁,这意味着A在一次试验中发生的可能性就大。,概率(probability)是随机事件发生可能性大小的度量,简记为P。试求,掷一个硬币出现正面的概率为多少?掷一个骰子出现小于5的概率为多少?,概率的计算,掷一个硬币出现正面的概率为1/2掷一个骰子出现小于5的概率为4/6实际应用中,很多事件的概率P是很难得到的,如某癌症的发病率;,频率与概率的关系,抛掷硬币的试验,试验结果如下表,试验者 抛掷次数(n)出现正面次数(k)频率(k/n)Tongxy 5 4 0.80 10 3 0.30 20 7 0.35 30 11 0.37 40 16 0.40 50 21 0.42 100 52 0.52,历史上许多名家做过抛掷硬币的试验,抛掷硬币试验结果如表,试验者 抛掷次数(n)出现正面次数(k)频率(k/n)De Morgan 2,048 1,061 0.518 Buffon 4,040 2,048 0.5069 Pearson 12,000 6,019 0.5016 Pearson 24,000 12,012 0.5005,大量实事表明,并可以证明 若当试验次数n充分大以后,频率k/n稳定地在概率P的附近摆动。,实际工作中,可用频率作为概率的近似值:P(A)f(A)=k/n.,频率与概率的关系,(6)随机变量及其概率分布,随机变量 出现变异性的量称为随机变量,简称为变量。例如,用X表示掷硬币出现的结果,1表示出现正面,0表示出现反面。X称为随机变量.1,0称为变量X的取值。,抛掷硬币的试验,试验结果的概率分布,变量X:0 1 概率P(x)0.5 0.5,概率分布 一个随机变量的所有取值与其出现概率的排列称为变量的概率分布例如,,抛掷两个骰子的试验,试验结果的概率分布,概率P(x)X:,思考题:抛掷两个骰子的随机试验中,试问:)其和可能的结果有多少种?)哪种可能性最小,哪种可能性最大?3)列出试验结果的概率分布表,统计课堂教学形式,提倡独立思考与自由讨论,交流,信息交流,1、教师信息发布,网址:。共公邮箱,秘码stat.网址:共公邮箱,秘码stat.2、问题咨询发给:statdept,两个信箱。3、网上讨论 奇思论坛生物医学与统计栏进行统计学交流和讨论。,谢谢,