研究生医学统计学绪论-资料收集和整理_课件.ppt
《研究生医学统计学绪论-资料收集和整理_课件.ppt》由会员分享,可在线阅读,更多相关《研究生医学统计学绪论-资料收集和整理_课件.ppt(88页珍藏版)》请在三一办公上搜索。
1、医用统计方法Medical Statistics,张建军汕大医学院预防医学教研室Tel:0754-88900445Email:,第一节 绪论 北京某医院某大夫使用“乌贝散”(乌贼骨3钱,白芨3钱,川贝3钱,甘草3钱,共研细末过120目筛,冲服)治疗胃溃疡病出血107例,有效101例,有效率为94.4%,别的医院,其他大夫使用“乌贝散”来治疗胃溃疡病出血,其有效率也一定是94.4%吗?,求 置信区间,北京某医院有位老大夫,用“冠心灵”治疗冠心病,其对照组用西药,观察结果如下表:表1-1 冠心灵与单纯西药疗效对比 显 效 有 效 无 效 合计 单纯西药 9 25 6 40 冠 心 灵 19 18
2、5 42,冠心灵是否比单纯西药有效?,假设检验(test of significance),俗称要算值。,统计有三大特性,用三句话予以简单的概括:实用性:除了实情,数据能证明一切。丰富性:方法多样,发展之中。公平性:我们相信上帝,其它人请用数据说话。,一、统计学的重要性Importance,定义:统计学(Statistics)是研究数据搜集、整理与分析的科学,是认识社会和自然现象数量特征的重要工具。医用统计学(Medical Statistics):运用概率论和数理统计的原理,方法,结合医学实际,研究数字资料的搜集,整理,分析,推断的一门学科。,数学,统计学,医学,数理统计学,医用统计学,医用
3、数学,医学统计学是交叉学科,统计学的应用意义(Application):,Vaccinated groupInfection rate20%,Unvaccinated groupInfection rate10%,e.g.Evaluation on a new vaccine,How can we conclude?,1.Really effective?or By chance?Methods are needed to differentiate these two situations.2.Any bias in vaccinated people?e.g.age,nutrition,o
4、r social class.A suitable design can exclude the bias.,统计学发展迅速,统计学离不开计算工具的进步:计算机,软件的发展;SPSS(Statistics Package for Social Science)-Statistical Product and Service Solutions,SAS,Stata,PEMS(Package for Encyclopedia of Medical Statistics),二、统计学研究的对象objects,1、有变异(variation)的事物变异来源各种各样;是客观存在的;统计必须在一定数量的观
5、察基础上进行。随机事件(Random event):一次试验结果不确定,在一定数量重复条件下呈现出规律性。2、同质(homogeneity)的事物 研究的事物性质基本相同;避免将风马牛不相及的事物作统计分析;(3 mules+2 donkeys)/5=?,1、总体(population):是根据研究目的确定的、同质的全部研究对象中所有观察单位某种变量值的集合。同质基础:时间、空间、条件等(1)有限总体(finite population):有限观察单位(2)无限总体(infinite population):很多为无限总体。,三、几个基本概念basic concepts,如研究某地2003年健
6、康成年男性的身高(cm),则该地2003年全部健康成年男子的身高构成一个总体。该总体只包括有限个观察单位,称为有限总体。有时总体是设想的,是抽象的。例如:研究用某药治疗冠心病患者的疗效,其总体的同质基础是同用该药治疗的冠心病患者,而总体为设想用该药治疗的所有冠心病患者的治疗结果,这里没有确定的时间和空间范围的限制,因而观察单位数无限,称为无限总体。,2、样本根据随机化原则从总体中抽取的一定数量(sample size)的个体,称为样本(sample),用样本信息来推断总体特征。从总体中抽取部分个体的过程称为抽样(sampling)。抽样必须遵循随机化原则,即要使总体中每一个体有同等的机会被抽取
7、,这样的样本对总体有较好的代表性,能根据其统计量推断总体特征。(随机化,足够样本含量使样本具有代表性),样本的可靠性:总体确定后,使样本中的每个观察单位确属预先确定的同质总体。如:正确诊断,正确分期;规定动物的种属、原始体重,控制非实验因素等;抽样的必要性:无限总体;有限总体:人力、财力、不可能性、不必要性(高血压病人等)。,3、同质同质(homogeneity)是指影响被研究指标的非实验因素相同。有些影响因素往往是难以控制的、甚至是未知的,如遗传、营养、心理等。实际中只有相对的同质,即影响被研究指标较大的、可以控制的主要因素尽可能相同。如研究儿童的身高,则要求影响身高这一指标较大的、易控制的
8、因素如性别、年龄、民族、地区要相同,而不能控制的因素,如遗传、营养等影响因素可以略去。,4、变异(variation,variablility)同质基础上的各观察单位(亦称为个体)之间的差异为变异。如同性别、同年龄、同民族、同地区儿童的身高有高有低,称为身高的变异。统计学是研究变异的科学。没有变异就不需要统计学。在医学研究中,这种变异表现在人与人之间的差异。虽然有时我们感兴趣的是变异本身,但更多时候我们试图找出隐藏在变异背后的规律性。,5、参数(parameter)和统计量(statistic)总体的统计指标称为参数。如:总体均数(),总体发病率,总体死亡率,等,样本的统计指标称为统计量如:样
9、本均数(x),样本发病率,样本死亡率,等,统计学上用不同的符号表示。,6、误差(error)观察值与实际值的差异,成为误差。分为:过失误差;系统误差;随机测量误差;随机抽样误差;(1)过失误差(mistaken error):过失所致的误差(不认真,错误判断,记录等原因);(2)系统误差(systematic error):仪器未校准所致的误差(统一偏高,或偏低);这两类误差可以避免。,(3)随机测量误差(random measurement error):不同观察者或同一观察者多次观察值的不相同。这种误差不可避免。那么,抽样误差又怎样呢?,(4)抽样误差(sampling error):总体
10、中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,因而样本均数(或率)往往不等于总体均数(或率),表现为多次抽样的样本均数或率不同。这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。由于生物的个体变异是客观存在的,因而抽样误差是不可避免的,但抽样误差有一定的规律性。,7、概率(probability)几率,或然率 概率是反映某一事件发生的可能性大小的量,常用符号P表示。The probability of an event is the events long run relative frequency(相对频率)in repeat
11、ed trials under similar conditions.It can be any value from 0 to 1.绝对事件(absolute event):概率等于1或0。随机事件(random event):概率在0和1之间。,Probability(概率),Event A,occurs B times in C trials,the ratio B/C is called the probability of A.P(A)=B/C,P0.05和P0.01分别表示事件发生的可能性等于或小于0.05和0.01。习惯上把P0.05或0.01的事件称为小概率事件,表示某事件发生
12、的可能性很小。“小概率事件一次抽样不可能发生”小概率事件定理,P=1,P=0,P=0.5,Random Event,Absolute Event,Absolute Event,8、变量及变量值变量(variable):观察对象的特征或指标。对变量进行取值所采用的工具或标准成为测量尺度(scale)。测量的结果称为变量值(value of variable)或观察值(observed value,measurements)。如健康成年男性的血压值:某个人是观察单位,血压是变量,千帕是测量尺度,千帕数值为观察值。也可以将变量定性:性别,职业,等。,Sample100,Sampling,Parame
13、ters,Statistics,Population50000With relatively same features(homogeneity)but still varied among all(variation),Observed unit with Probability,Representative(random,size),Inference,9、随机化(randomization)使总体中的每个个体有均等的机会成为样本观察单位的过程,称为随机化。医学研究从总体中抽出一定数量的样本进行研究,得出规律,推及总体。为使样本代表总体,必须缩小抽样误差。随机抽样旨在避免人的主观性,让机遇
14、起作用,以反映总体的客观情况。随机不是随便(free and easy,casual)或 随意(ad libitum)。常用:抽签法,随机数目表法,计算器随机数法;,单纯随机抽样(简单随机抽样),最简单、最基本的抽样方法从总体N个对象中,利用抽签或其他随机方法抽取n个总体中每个对象被抽到的概率相等,Simple random sampling,系统抽样(机械抽样),按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。将总体各个个体单位按某种标志排列、连续编号根据总体数N和确定的样本数n,计算抽样距离(N/n)用单纯随机方法在第一组中确定一个起始号从此起始点开始,每隔K(K=N/n)个单位抽
15、取一个作为研究对象,Systemic sampling,系统抽样示意图,分层抽样,将总体单位按某种特征分为若干次级(层),然后从每一层内单纯随机抽样组成一个样本。分类按比例分配(proportional allocation)分层随机抽样 各层内抽样比例相同最优分配(optimum allocation)分层随机抽样 各层抽样比例不同,内部变异小的层抽样比例小,内部变异大的层抽样比例大,Stratified sampling,整群抽样,将总体分成若干群组,抽取其中部分群组作为观察单位组成样本分类单纯整群抽样(Simple cluster sampling)被抽到的群组中的全部个体均作为调查对象
16、二阶段抽样(Two stages sampling)通过再次抽样后调查部分个体,Cluster sampling,四、正确运用统计学,1、统计学是工具杜绝统计无用,统计万能论点。拓宽医学研究思路统计学知识-指导课题设计-资料分析单因素-多因素-探讨病因-预后单纯比较均数-相关、回归,2、科研设计科学合理,提高效率运用实验设计的原则,从动物选择、分组、指标测定、结果分析等方面达到最优化。统计不能创造规律,只能在一定的限度内,弥补实验设计的不足。3、采集准确可靠的资料,对资料合理使用,尤其对多因素影响的疾病。,4、选择合适的统计方法进行分析,正确解释分析结果。统计结论是概率性的,在给出统计结论后,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 研究生 医学 统计学 绪论 资料 收集 整理 课件
链接地址:https://www.31ppt.com/p-4041748.html