卫生统计学 绪论课件.ppt
《卫生统计学 绪论课件.ppt》由会员分享,可在线阅读,更多相关《卫生统计学 绪论课件.ppt(100页珍藏版)》请在三一办公上搜索。
1、卫生统计学刘金辉宝坻区疾病预防控制中心,第一章 绪 论,统计学概念:统计学是处理数据中变异性的科学与 艺术,内容包括数据的收集 、 分析、 解释和表达,目的是求得可靠的结果。 以往教材中概念:是研究数据的收集、整 理、分析和推断的一门科学。,第一节 概述,根据研究领域和研究对象的不同,统计学又分为:数理统计、经济统计、生物统计、卫生统计、医学统计医学统计学(medical statistics):用统计学的原理和方法研究医学中的问题。卫生统计学(health statistics):与医学统计学基本相同,但更侧重于社会、人群的卫生问题。,采用统计学方法,发现不确定现象背后隐藏的规律。 变异是个
2、体间存在的差异,是绝对的,是社会和生物医学中的普遍现象。 变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。,为什么要学习统计学?,最大值=6.18, 最小值=3.29, 极差=2.89,2. 用统计学思维方式考虑有关医学研究中的问题 “阳性”结果是否是虚假联系? 某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效? “阴性”结果是否是样本含量不足? 有人曾对发表在Lancet, N Engl J Med,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇( 93%)可能是由于样本含量不足造成的假阴性。,3. 保证你的研究论文能通过统计学
3、审查 据国外6080年代对不同医学杂志发表论文的调查,有统计错误的论文的百分比最高达72%,最低也有20%。国内1984年对中华医学杂志、中华内科杂志、中华外科杂志、中华妇产科杂志、中华儿科杂志595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。某研究者1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用达55.7%。,4. 获得循证医学证据的主要手段“良好愿望的医学”(well-meaning medicine)转入“以证据为基础的医学” (evidence-based medicine,EBM)需要有统计学方法的支持
4、。 全世界的医学期刊每年大约刊登600万学术论文,但能作为可靠“证据”的论文并不多。,第二节 医学统计工作内容及资料类型,一、原始统计数据的来源:常规保存数据医院信息系统(HIS)、统计报表等2. 现场调查记录3. 实验记录4. 其他,一、研究设计二、搜集资料三、整理资料四、分析资料五、结果表达,二、统计工作的内容,设计的内容包括资料的收集、整理和分析全过程的设想和安排。常有:1.调查设计(survey design)对研究对象不施加任何干预,通常建立随机抽样(random sampling)方案。2.实验设计(experiment design)对研究对象施加干预,如动物实验研究、临床试验,
5、通常建立随机分组(random allocation)方案。,(一)、研究设计,实验设计的三个基本原则1. 随机化(randomization)2. 对照(control)3. 重复(replication),(二)、收集资料,收集资料要遵循完整、准确、及时三个原则。 卫生工作中统计资料主要来源于三个方面: 1.统计报表:由国家统一设计,要求医疗卫生机构 定期逐级上报。如传染病防治法。 2.经常性工作记录:如经常性卫生监测记录等。 3.专题调查和实验:我们常把前两个来源称经常性资料,后者称为一时性资料。,(三)、整理资料,目的是将搜集到的原始资料系统化、条理化,便于进一步计算与分析。编码,将数
6、据输入计算机纠错改错、补漏等,(四)、分析资料(data analysis),运用各种统计分析方法,结合专业知识,从经过整理的资料中,计算出各种指标,进行统计描述和统计推断, 反映数据的综合特征,阐明事物的内在联系与规律。1. 统计描述(descriptive statistics):指用统计指标、统计表、统计图等方法对资料的数量特征及分布规律进行测定和描述。2.统计推断(inferential statistics) : 指如何抽样,以及如何由样本信息推断总体特征问题。总体均数、总体率的可信区间及其假设检验两个总体均数、总体率差值的可信区间及其假设检验多个总体指标之间的假设检验。,(五)、结
7、果表达,使用的统计学方法使用的统计学软件(SAS、SPSS)假设检验的统计量、P值等结论,三、资料的类型: 只有认识了数据的特点,才 能正确地选用统计分析方法,基本概念:变量及变量值 研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值),全部变量值的集合也称为资料。,按变量值的性质可将资料分为: 计量资料 计数资料 等级分组资料,1.计量资料(定量资料、数值变量),定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。例如:体重与身高特点:表现为数值大小 有度量衡单位 多为连续性资料 (通过测量得到),定义:将全
8、体观测单位按照某种性质或特征 分组,然后再分别清点各组观察单位 的个数。特点:没有度量衡单位 多为间断性资料 (通过枚举或记数得来)可分为二项与多项定性资料,2. 定性资料(分类资料、分类变量),定义: 介于计量资料和计数资料之间的一种资 料,通过半定量方法测量得到。特点: 每一个观察单位没有确切值 各组之间有性质上的差别或程度上的不 同。示例: 检查尿蛋白,观察单位是每一份尿标本, 按结果等级不同可分为、 、等。,3. 等级分组资料(有序变量),1、定性数据 (二项与多项)分类数据 计数数据2、定量数据 计量数据 区间数据 数值数据3、等级资料 有序资料,定性与定量数据的别名,三类数据间的关
9、系,例:一组2040岁成年人的血压(变量),以12kPa为界分为正常与异常两组,统计每组例数,8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压,定量数据,等级数据,定性数据,三类数据的编码与计算(1),例:一组2040岁成年人的血压,以12kPa为界分为正常(0)与异常(1)两组,统计每组例数,8 低血压 4 1 8 正常血压 10 2 12 轻度高血压 13 3 15 中度高血压 16 4 17 重度高血压 18 5,定量数据,等级数据,定性数据,三类数据的编码与计算(2),1.定量数据:允许计算均数、标准差等(可采用t、F检验等,可当做有序或定性数据处理)2.
10、定性数据:编码是任意的,不能对编码执行均数标准差等计算,但可计算率或比(可采用卡方检验等) 调查14名男子的婚姻状况,3. 有序数据:允许基于顺序的计算,如计算中位数、百分位数(可当做定性数据处理),第三节 统计学中常用的几个基本概念,1、总体与样本2、抽样方法3、同质与变异4、误差5、频率与概率 6、参数与统计量,1.总体与样本(population & sample ),总体:根据研究目的确定的同质的、所有观察单位的某 种变量值的集合。 例:2009级陕西中医学院本科女生身高; 2007年陕西中医学院大学生的身高; 全国女大学生的身高(高血压病人; 肥胖病人),分类: 有限总体:理论上说,
11、观察单位的数量是 可知的、有限的。 无限总体:没有时间和地点的限制,观察 单位总数量是不可知的。 目标总体 研究总体,鉴于总体的巨大或不可知性,能否研究其中的一部分?,不可能或没有必要对全体中的每一个对象进行研究,样本,概念:从总体中随机抽取的、具有代表性的 部分研究对象,其实测值的集合。如何从总体中得到有代表性的一部分?得到多少合适呢?,2.随机抽样,为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到样本中)。,Target population(目标总体) Population sampled(抽样总体) Sample(样本)能不能成功的达到从样
12、本推断总体的目的,关键是抽样方法,样本的代表性和推断的技术,这些是统计学的核心内容。,概率(随机)抽样,等概率抽样,非等概率抽样,简单随机抽样,机械抽样,分层抽样,整群抽样,抽样方法:,简单随机抽样: 将全部调查单位进行编号,再用随机数字表或抽签等方法随机抽取部分观察单位组成样本。,机械抽样: 间隔抽样,将总的观察对象按某种顺序编号,从这些编号中按照一定的间隔抽取样本。,分层抽样: 按照某种性质或者特征将总体分为若干组别、类别或区域(层),再从每一种层中用随机的方法进行抽样,获得样本。,整群抽样: 将总体按照某些特征分成多个组,用随机的方法从这些组中抽取部分组作为研究对象。组中的全部观察这组成
13、样本。,3. 同质与变异,同质与变异: 研究对象具有的相同的状况或属性等共性称同质或同质性;对于同质的各观察单位,其某变量值之间的差异,称为变异。 同质事物个体间的差异来源于一些未加控制或无法控制的甚至不明原因的因素。,例如:研究某新药治疗胃溃疡的效果,所有研究对象都必须是确诊为胃溃疡的病人且病情相似,在这种同质的基础上观察治疗效果,有的人治愈,有的人未愈,这种差异就是变异。从本质上说,统计学就是研究变异的科学,4. 误 差,定义:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下三种: 系统误差 随机误差 抽样误差,系统误差:指数据搜集和测量过程中由于仪器不准确、标准不
14、规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。特点:具有累加性,随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。特点:随测量次数增加而减小。(随机测量误差,抽样误差)。,在消除了系统误差的前提下,由于非人为的偶然因素,对于同一样本多次测定结果不完全一样,结果有时偏大有时偏小,没有倾向性,这种误差叫随机测量误差。特点:没有倾向性,多次测量计算平均值可以减 小甚至消除随机测量误差。,随机测量误差,由于抽样原因造成的样本指标与总体指标之间的差别。特点:有抽样发生抽样误差就不可避免。 统计上可以计算并在一定范围内控制 抽样误差。,抽样误差,(1)改进抽样
15、方法,增加样本的代表性; 样本量 n 相等的情况下: 整群抽样单纯随机抽样系统抽样分层抽样(2) 增加样本量n ;(3)选择变异程度较小的研究指标。,减少抽样误差的方法:,频率:样本的实际发生率称为频率。设在相 同条件下,独立重复进行n次试验, 事件A出现m次,则事件A出现的频率 为f = m /n。概率:随机事件发生的可能性大小,用大写 的P 表示;取值0,1。,5、频率与概率,必然事件 P = 1随机事件 0 P 1不可能事件 P = 0 统计学上把P 0.05(5)或P 0.01(1)称为小概率事件(习惯) ,认为不大可能发生。,Certain,Impossible,0.5,0,1,通常
16、我们把经常遇到的事件分为三种类型:,频率与概率间的关系: 1. 样本频率总是围绕概率上下波动; 2. 样本含量n越大,波动幅度越小,频 率越接近概率。,6、 参数与统计量 (parameter and statistic),参数:总体的统计指标,如总体均数、总体标准差,分别用希腊字母记为、。固定的常数,推断inference,统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为 。 参数附近波动的随机变量 。,第二章 集中趋势的统计描述,主要内容,2.1 频数分布2.2 平均数,第一节 频数分布 表9-1 2002年某市150名正常成年男子的尿酸浓度(mol/L) 142.3 14
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生统计学 绪论课件 卫生 统计学 绪论 课件
链接地址:https://www.31ppt.com/p-1917785.html