医学统计学绪论.ppt
医学统计学绪论,什么是统计学,“统而计”汇总群体的数据,计算并发现其中的规律的一门学科。是一门处理数据中变异性的科学与艺术从变异、看似杂乱的数据中发现必然规律,什么是医学统计学,运用概率论和数理统计的原理和方法,结合医学实际来,研究医学数据资料的搜集、整理、分析与推断的一门学科。,医学统计学的基本概念,(一)同质和变异,1.同质(homogeneity):根据研究目的确定的观察单位性质相同同一个班级的学生中国人地球的生物同质相对性,根据研究的内容和尺度而定同质性群体是统计分析的基本单元,2.变异(variation):被观察个体(或单位)之间的差异被称作变异,亦称做个体变异。其一,个体与个体间的差别(真实差异);其二,同一个体重复测量值间的差别(测量差异);没有变异就没有统计学。,例1 调查2003年杭州市7岁男童的身高和体重同质:2003年杭州市、7岁男童变异:身高和体重各不相同例2 研究某降压药的疗效同质:高血压患者、用某药治疗变异:疗效各不相同,(二)变量和变量值,变量(variable):观察单位的某项特征或指标为变量年龄、性别、身高、体重等变量值(value of variable):变量的观察值或测定值,亦称数据(data),(三)总体与样本,1.总体(population):根据研究目的确定的同质观察单位的全体,具体而言是观察个体某一特征值的集合。分有限总体与无限总体。有限总体:研究单位数是有限的,有确定的时间、空间限制。如:调查杭州市2008年正常成年男性的红细胞数无限总体:研究单位数是无限的,没有时间、空间限制。如:高血压患者无时间、空间限制。,2.样本(sample):从总体中随机抽取的部分个体。从总体抽取部分个体的过程叫做抽样样本中所包含的个体数称为样本含量。,总体N=10000,样本n=20,举例 调查杭州市2008年正常成年男性的红细胞数,从中随机抽取20名进行测量。总体:杭州市所有正常成年男性红细胞数样本:20名男性的红细胞数,为什么要抽样?总体太庞大,工作量太大实际工作中总是从总体随机抽取一定含量的样本,目的是根据样本所提供的信息推断总体的特征。,13,参数(parameter):根据总体中全部个体值计算出来的描述总体特征的指标。参数一般用希腊字母表示,如总体均数、总体率等。(一般是未知的,固定的)统计量(statistic):根据样本中个体值计算出来的描述样本特征的指标。统计量用拉丁字母表示,如样本均数x、样本率p。,(四)参数与统计量,某市18岁男生身高N(167.7,5.32)的抽样示意图,举例:,推断inference,定义:实际观察值与真实值之差,样本指标(统计量)与总体指标(参数)之间的差别。分为:系统误差、随机测量误差和抽样误差三类。随机测量误差和抽样误差属于随机误差。,(五)误差,系统误差、随机测量误差和抽样误差的区别,频率(frequency):样本的实际发生率。设在相同条件下,独立重复进行n次试验,事件A出现m次,则事件A出现的比例f=m/n称为频率。如:抽样人群的发病率、患病率、病死率、治愈率都是频率。概率(probability):反应某一随机事件发生可能性的大小。用大写的P 表示;取值0,1。概率越接近于1,表示事件发生的可能性越大;越接近于0,表示可能性越小,(六)频率与概率,P 0.05(5)或P 0.01(1)称为小概率事件(习惯),统计学上认为不大可能发生。小概率事件则意味着决策的风险较小,可以作为决定的依据(举例:冒险群体、正常群体、保守群体)。,小概率事件,必然事件 P=1随机事件 0 P 1不可能事件 P=0,概率划分和小概率事件,医学统计资料的基本类型,(一)定量资料又称计量资料或数值变量资料,视为测定每个观测单位某项指标的大小而获得的数据,其变量值可以衡量高低水平,一般有度量单位分为离散型和连续型身高、体重、年龄、BMI指数,(二)定性资料又称计数资料或无序分类变量资料,是将观察单位按某种属性或类别分组计数、汇总各组观察单位数后得到的数据。阴性/阳性;男/女;A/B/O/AB二分类:两种定性变量值多分类:多种定性变量值,(三)等级资料又称半定量资料或有序分类资料是将观察单位按照某种属性的不同程度分为等级后分组计数,分类汇总各组观察单位数而得到的资料。变量值具有量化的等级性,无量纲疗效:无效/好转/显效/治愈/化验:-/+-/+/+/+,请说出以下数据的类型?,举例:测得5人的WBC(个/m3)数如下:3000 6000 5000 8000 12000 定量资料 若按正常3人,异常2人分组定性资料若按过低1人,正常3人,过高1人分组等级资料,注意:数据的转换通常会损失部分信息,数据可以转换,医学统计工作的基本内容,实验设计,搜集资料,整理资料,分析资料,(一)实验设计(design),最关键的步骤包括专业设计和统计设计专业设计主要考虑专业方面的需要,如:研究对象的选择,实验技术和方法的确定等。统计设计的内容包括资料搜集、整理和分析全过程总的设想和安排。,举例:研究浙中大研究生的吸烟行为,研究目的?确定研究对象,观察单位,变量值如何抽样,样本量?如何调查?调查表?如何分析?,(二)收集资料(data collection),统计资料主要来源:统计报告表:法定传染病报表,职业病报表,医院工作报表等这是国家规定的报表登记或报告卡(单):出生报告单和出生登记、死亡报告单和死亡登记卡。日常工作记录:门诊、住院病历、卫生检测记录、健康检查记录等。要做到登记的完整、准确。专题调查或实验统计年鉴和统计数据专辑搜集资料强调资料的完整、准确、及时。,(三)整理资料,资料整理(data sorting)目的是将搜集到的原始资料系统化、条理化,便于进一步计算统计指标和深入分析。资料整理前要对资料再次检查与核对,发现缺项或错项较多的调查表,须补查或剔除。审查无误后,设计分组。,(四)分析资料(data analysis),分析资料为根据研究设计的目的、要求、资料的类型和分布特征选择正确的统计方法进行统计分析。,常常从两个方面分析:一是描述性统计,即计算统计指标,如平均值、发病率等;统计图、统计表等方法,对资料的数量特征及其分布规律进行测定和描述。二是分析性统计,即推断总体的特征1.推断总体均数、总体率及其可信区间2.推断两个或几个总体指标之间是否相等或推断某个总体统计指标是否等于某个常数。,课程设置,简单讲解基础统计学1/2个课程多因素方差分析、重复测量方差分析多重线性回归、logistic回归、生存分析判别、聚类分析、主成分因子分析量表设计和分析,the End ofthe Chapter,