书签分享收藏举报版权申诉 / 222

立即下载加入VIP免费专享

当前位置：首页 > 生活休闲 > 在线阅读 > 医学统计学基础与科研分析思路.ppt

医学统计学基础与科研分析思路.ppt

上传人：牧羊曲112

文档编号：4956789

上传时间：2023-05-26

格式：PPT

页数：222

大小：1.20MB

《医学统计学基础与科研分析思路.ppt》由会员分享，可在线阅读，更多相关《医学统计学基础与科研分析思路.ppt（222页珍藏版）》请在三一办公上搜索。

1、卫生统计学基础知识与科研资料分析思路,内容,医学统计学基础知识实验设计科研资料的分析思路,第一部分医学统计学基础知识,内容,一、医学统计学的定义二、统计学中的基本概念三、统计工作的步骤四、常见的抽样分布五、描述性指标六、总体参数的估计七、假设检验,一、医学统计学的定义,统计学（statistics）是认识社会和自然界中随机现象的数量特征的一门科学。自然界中存在的各种现象可归纳为两类：必然现象在一定条件下必然发生的现象。（一定条件下其发生与否是确定的）随机现象在同一条件下进行实验，一次实验结果不确定，而在一定数量的重复试验后呈现统计规律性的现象。,industry,government,bu

2、siness,education,research,finance,health,the natural world,Statistics in.,医学统计学的定义,医学统计学(medical statistics)是运用概率论和数理统计学的原理与方法，研究医学和卫生学领域中随机现象有关数据的搜集、整理、分析与推断，进而阐明其客观规律的一门应用科学。,医学统计学的定义,二、统计学中的基本概念,同质与变异变量总体与样本抽样误差概率,同质与变异,-同质（homogeneity）影响研究指标较大的、可以控制的主要因素尽可能相同。-变异(variation)同质基础上的各观察值间的差异称为变异。变异

3、可理解为同质基础上的个体差异。,基本概念,变量,-变量(variable)搜集资料时，先要根据研究目的确定同质观察单位，再对每个观察单位的某项特征进行测量或观察，这种特征称为变量。-变量值(value of variable)变量的观察结果或测量值称为变量值，亦称为资料(data）-变量按其值的性质可分为不同类型。,基本概念,变量,-变量的类型数值变量(numerical variable)分类变量（categorical variable）-无序分类变量（unordered categorical variable）二项分类（binomial）、多项分类(multinomial)-有序分类变

4、量（ordinal categorical variable）,基本概念,变量,数值变量其变量值是定量的，表现为数值大小，多有度量单位。由数值变量的测定值构成的资料称为计量资料（measurement data）或数值变量资料（numerical variable data）。多数的数值变量为连续型变量，如身高、体重、血压；但有的数值变量的测定值只是正整数，如心率、白细胞计数等，在医学统计学中也视为连续型变量。,基本概念,变量,分类变量表现为互不相容的类别或属性，亦称定性变量。-无序分类变量的各类别或属性之间无程度（或顺序）上的差别；所得资料称为计数资料（enumeration data）

5、或无序分类变量资料（unordered categorical variable data）;又有二项分类和多项分类之分。-有序分类变量的各类别之间有程度（或顺序）的差别。所得资料称为等级资料（ranked data）或有序分类变量资料（ordinal categorical variable data）。,基本概念,变量,注意！变量类型不是一成不变的，可根据分析的需要进行转化。例，白细胞计数原属数值变量若按正常、异常分组，则为无序分类变量；若按过低（10000）分组，则为有序分类变量。分类变量也可数量化：有序分类变量可用0、1、2、3、4表示；无序分类变量可用哑变量（dummy varia

6、ble）表示。,基本概念,总体与样本,总体（population）根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体所包含的范围随研究目的的不同而变化。在医学科学研究中，研究对象可以是人、实验动物、微生物等；观察单位可以是一个地区、一个家庭、一个人、一只眼睛、一个细胞株、一个基因片段等。,基本概念,总体与样本,有限总体与无限总体在某特定的时间与空间范围内，同质研究对象的所有观察单位的某变量值的个数为有限的，称为有限总体(finite population)。总体是假设的，无时间和空间的限制，观察单位数是无限的，称为无限总体(infinite population)。,基本概念,

7、总体与样本,样本（sample）样本是按随机化原则从同质总体中抽取的部分观察单位其变量值的集合。样本须具有代表性。“代表性”的前提是来自同质总体、足够的观察单位数和随机抽样。样本中所含的观察单位个数称为样本含量 n。随机化原则通常是指总体中的每个个体都有同样的机会被抽到样本中；但不同的研究目的，所采用的抽样方法不同，如单纯随机抽样、系统抽样、整群抽样和分层抽样等。,基本概念,总体与样本,抽样研究的目的是用样本信息去推断总体特征。描述样本特征的指标称为统计量(statistics)；描述总体特征的指标称为参数(parameter),基本概念,抽样误差,抽样误差(sampling error)由于

8、个体变异的存在，抽样研究时，样本的统计量与总体参数往往不等；即使若干个样本是从同一总体中随机抽取的，各样本统计量也往往不等。这种因抽样研究所引起的各统计量之间以及统计量与参数之间的差异，称为抽样误差。抽样误差在抽样研究中是不可避免的，但只要遵循随机化原则抽样的话，抽样误差的大小是可以估计的。,基本概念,抽样误差,基本概念,概率,随机事件概率小概率事件,基本概念,概率,随机事件(random event)对随机现象进行实验或观察称为随机试验（random trial）。随机试验的各种可能结果的集合称为随机事件（random event），简称事件（event）。在一次随机试验中，某随机事件可能发

9、生，也可能不发生；但在一定数量的重复试验后，某随机事件的发生与否是有规律的。,基本概念,概率,概率(probability)是描述随机事件在一定条件下发生的可能性大小的一个度量，通常用P表示。对事件A，若有，则称A为必然事件；若，称A为不可能事件。随机事件A的概率为。,基本概念,概率,小概率事件（small probability event）若随机事件A的概率，则称随机事件A为小概率事件。其统计学意义是小概率事件在一次随机试验中认为不可能发生。“小概率”的标准是人为规定的。在医学统计学中，通常设；但对于可能引起严重后果的事件，如术中大出血等，可设，甚至更小。,基本概念,三、统计工作的步骤,

10、设计搜集资料整理资料分析资料,设计（design）,在保证科学性、可重复性和高效性的前提下，为验证研究假说而进行的周密安排。明确研究目的和研究假说，确定研究内容、观察对象与观察单位、样本含量和抽样方法，拟定研究方案、预期分析指标、误差控制措施、进度与费用。根据医学研究类型，有调查设计和实验设计之分。,统计工作的步骤,搜集资料（collection of data),遵循统计学原理原则：及时、准确、完整来源：统计报表经常性工作记录专题调查（或实验）资料储存：所搜集的原始记录，要妥善保存，并定期备份复制。,统计工作的步骤,整理之前的资料称为原始资料（raw data）目的：经科学分组与归纳，使

11、原始资料系统化、条理化，便于计算统计指标和分析。过程：准确性审查（逻辑审查与技术审查）和完整性审查；拟定整理表，按照“同质者合并，非同质者分开”的原则对资料进行质量分组，并在同质基础上根据数值大小进行数量分组；统计归纳。,整理资料（sorting data）,统计工作的步骤,分析资料（analysis of data）,目的计算有关指标，反映数据的综合特征，阐明事物的内在联系和规律。统计描述（descriptive statistics）用描述性指标、统计表与统计图等，对样本资料的数量特征及其分布规律进行描述。统计推断（inferential statistics）如何抽样？如何用样本信息推

12、断总体特征。统计分析时，要根据研究目的、设计类型、样本含量、资料类型及其分布特征选择恰当的统计指标和分析方法。,统计工作的步骤,四、常见的抽样分布,抽样分布,分布和,分布,N(0,1),标准正态分布,以固定样本含量n抽样,N(,2/n),X,t 分布,0,0,抽样分布,t 值的分布称为 t 分布,由于s 随 n 的增大渐稳定于，故越大，t 分布越逼近 u 分布。,抽样分布,抽样分布,抽样分布,t 分布的分位数(t 界值),/2,/2,1-,t/2,-t/2,阴影部分表示的概率,抽样分布,1-,t,t 分布的分位数(t 界值),阴影部分表示的概率,抽样分布,抽样分布,二项分布（binomi

13、al distribution）,二项分布的应用条件,试验中只有对立的两类结果，每一个观察单位只能发生两种对立结果之一(即两分类资料)；已知其中一类结果的发生率为，其对立结果的发生率为；在同一条件下，n 次试验是相互独立的，即各观察单位的观察结果相互独立。,抽样分布,抽样分布,Poisson分布,抽样分布,抽样分布,五、描述性指标,需根据研究目的、资料类型及其分布、样本含量选用恰当的描述性指标。数值变量资料的描述性指标分类变量资料的描述性指标,数值变量资料的描述性指标,集中趋势指标（central tendency）反映一组变量值的平均水平或中心位置。-均数、几何均数、中位数、调和均数和众数离

14、散趋势指标(dispersion tendency)反映一组变量值的变异（分散）程度。-全距、四分位数间距、方差、标准差、变异系数,描述性指标,集中趋势指标（数值变量）,均数(mean)适用于正态及近似正态分布的数值变量资料。符号：样本均数（）、总体均数（）计算公式：,直接法公式加权法公式,（用于小样本资料）,（用于频数表资料）,描述性指标,例随机抽取某地10名2030岁健康男性居民血清铁含量分别为：6.58，7.42，15.32，15.78，17.60，17.98，15.21，17.53，20.11，22.64。试求其平均血清铁含量。,例计算某地100名男大学生身高平均数,描述性指标,集

15、中趋势指标（数值变量）,几何均数(geometric mean)适用于对数正态分布资料或等比级数资料。符号：G 计算公式：,直接法（小样本资料）,加权法(频数表资料),描述性指标,集中趋势指标（数值变量）,例 9名麻疹易感儿接种麻疹疫苗一个月后，其血凝抑制抗体滴度为：1:4，1:8，1:16，1:32，1:64，1:128，1:256，1:512，1:1024。试求其平均滴度。,9名麻疹易感儿的平均抗体滴度为1:64。,描述性指标,集中趋势指标（数值变量）,例某地区50名麻疹易感儿童接种麻疹疫苗1个月后，测其血凝抑制抗体滴度，如表中（1）、（2）栏，求平均抗体滴度。,其血凝抗体滴度的平均滴度

16、为1:57。,描述性指标,中位数(median)适用于任何分布类型的数值变量资料，常用于偏态分布资料及频数分布一端或两端无确切数值的数值变量资料。,符号：M,计算公式：,加权法(频数表资料),描述性指标,集中趋势指标（数值变量）,例 5名成年男子的体重（kg）分别为 60、70、75、80、90，求中位数,例 6名成年男子的体重（kg）分别为 60，70，75，80，82，90，求中位数,=（X3+X4）/2=（75+80）/2=77.5（kg）,=75（kg）,描述性指标,集中趋势指标（数值变量）,例某疾病控制中心记录了199名沙门氏菌属食物中毒患者发病的潜伏期，并整理成表2-3中(1)、

17、（2）栏，试计算其平均发病潜伏期。,（h）,描述性指标,离散趋势指标（数值变量）,全距(range)亦称极差，适用于任何分布类型的资料。符号：R 计算公式：,描述性指标,四分位数间距(quartile range)适用资料类型同中位数。,符号：Q或QR,计算公式：,描述性指标,离散趋势指标（数值变量）,方差(variance)适用于正态和近似正态分布资料,计算公式：,描述性指标,离散趋势指标（数值变量）,标准差(standard deviation)适用于正态和近似正态分布资料,计算公式：,直接法（小样本资料）,加权法（小样本资料）,描述性指标,离散趋势指标（数值变量）,例求表2-1中1

18、00名18岁男大学生身高的标准差。,描述性指标,离散趋势指标（数值变量）,描述性指标,离散趋势指标（数值变量）,变异系数（coefficient of variation)适用于比较度量单位不同或均数相差悬殊的两组（或多组）资料的变异度。,符号：CV,计算公式：,描述性指标,离散趋势指标（数值变量）,分类变量资料的统计描述,相对数：两个有关数值之比称为相对数常用的相对数：构成比、率、相对比,描述性指标,构成比(proportion)，又称构成指标，它说明某事物(或现象)内部各组成部分所占的比重或分布，常以百分数表示。计算公式：注意：所有组成部分的构成比之和应等于100%；同一事物内部各组成部分

19、的构成比，计算时小数点后保留位数应相同。,描述性指标,分类变量资料,率(rate)，又称频率指标或强度指标，它说明某现象发生的频率或强度。计算公式：式中，K为比例基数，常用的K 有100%或1000、10000/万、100000/10万等。选择K的要点：根据习惯用法以便于比较，如治愈率、某病病死率、人工流产率等用百分率；出生率、婴儿死亡率等用千分率；恶性肿瘤死亡率用十万分率；使算得的率至少保留12位整数。,描述性指标,分类变量资料,相对比(relative ratio)，亦称比(ratio)，是A、B 2个有关指标之比，说明A为B的若干倍或百分之几。A、B两个指标可以是性质相同的，也可以是性

20、质不同的；两个指标可以是绝对数，也可以是相对数或平均数。计算公式为：,描述性指标,分类变量资料,A、B为同类指标时，相对比用以说明两事物的相对水平。常以百分数或倍数表示，如人口出生性别比、两病区病床数之比。流行病学中常用：相对危险度(RR)、比数比(OR)也为此类。A、B为不同类指标时，如人口密度(人/平方公里)、医生数/千人口、病床数/千人口、小鼠肝重与体重之比、变异系数等。相对比是相对数的最简单形式，常用于动态数列的分析。,描述性指标,分类变量资料,描述性指标,分类变量资料,应用相对数时应注意的问题计算相对数的分母不宜过小当分母观察例数足够多时，计算的相对数比较稳定，能够正确反映实际情况

21、；当分母观察例数很少（如少于30）时，易受偶然因素的影响，不宜计算相对数，可用绝对数表示。如必须计算率，应同时列出可信区间。,某文章报道“5 名患者,治愈3 人,治愈率为60%”。该结论恰当否？分析:该结论不恰当，当观察例数很少时,分子每改变一个单位对结果的影响很大,此时不宜计算相对数,直接用绝对数描述即可。,描述性指标,分类变量资料,分析时不能以构成比代替率构成比是说明某现象中各组成部分的比重或分布的指标，率则反映某现象发生的频率或强度的指标。应用时两者不能混淆。,描述性指标,分类变量资料,应用相对数的注意事项,描述性指标,观察单位数不等的几个率，不能直接相加求其平均率对观察单位数不等的

22、几个率求平均率时，要用各率的分子之和与分母之和来计算。,“用某疗法治疗肝炎,甲医院治疗150 人,治愈30 人,治愈率为20%;乙医院治疗100 人,治愈30 人,治愈率为30%。则两个医院平均治愈率为(20%+30%)/2=25%。”上述计算方法有无问题？分析:该作者平均率的计算方法有误。两个医院共治疗250 人,其中治愈60 人,则平均治愈率为60/250=24%。,应用相对数的注意事项,描述性指标,分类变量资料,比较相对数时应注意其可比性影响率和构成比的因素很多。两个或多个率(构成比)比较时，各组间除研究因素外，其它影响因素要基本相同，即各组间要具有可比性。注意：各组的研究对象要同质，

23、研究方法要相同，观察时间相等以及内外环境条件相近。所比较资料的内部构成要相同。同一地区不同时期资料的对比，应注意客观条件有无变化。,应用相对数的注意事项,描述性指标,分类变量资料,对样本率（或构成比）的比较应遵循随机抽样，并做假设检验遵循随机抽样的原则才能保证样本具有代表性，才能用该样本信息推断总体特征。抽样研究中，样本率或构成比也存在抽样误差，因此在比较两个或多个率(构成比)时，要做假设检验。,应用相对数的注意事项,描述性指标,分类变量资料,六、总体参数的估计,数值变量资料-总体均数的估计-总体几何均数的估计-总体中位数的估计分类变量资料-总体率的估计-总体平均数的估计,总体均数的估计点

24、值估计(point estimation)：用样本均数作为总体均数的点值估计。由于抽样误差的存在，往往不等于。区间估计(interval estimation)：按一定的概率100(1)%估计总体均数所在的范围，亦称可信区间(confidence interval,CI)。常取95%和99%的可信度，即95%CI和99%CI。,总体参数估计,数值变量资料,总体均数的区间估计,未知且n 小时，按 t 分布原理计算,总体均数(1-)100%的可信区间为：未知，但 n足够大时(n 100)，t 分布近似 u 分布，按正态分布的原理估计可信区间。总体均数(1-)100%的可信区间为：,总体参数

25、估计,数值变量资料,总体均数的区间估计,已知时，按正态分布的原理估计可信区间。总体均数(1-)100%的可信区间为：,总体参数估计,数值变量资料,由20名18岁男大学生身高均数资料得，cm，cm，试估计该地18岁男大学生身高总体均数的95%可信区间。n=20，且未知，双侧即该地18岁男大学生身高总体均数的95%可信区间为170.70173.80cm,总体参数估计,总体均数的区间估计,数值变量资料,总体几何均数的估计点值估计用样本几何均数作为总体几何均数的点值估计。区间估计,总体参数估计,数值变量资料,总体中位数的区间估计先求第50百分位数的上、下限：下限上限再按分别求和,总体参

26、数估计,数值变量资料,总体率的估计,点值估计：p 为的点值估计。由于抽样误差的存在，p 往往不等于，故通常用区间估计。区间估计：根据样本含量n的大小以及 p 是否远离0.5，可用查表法和正态近似法。,总体参数估计,分类变量资料,总体率的区间估计-查表法,当样本含量n较小，如，特别是 p 很接近于0或1(远离0.5)时，根据 n 和阳性数 X 查“百分率的可信区间”表。某医院眼科医生用某种方法矫正30名近视眼患者的视力，其中8人近期有效，求该法近期有效率的95%CI。注意：由于附表7中X值只列出了的部分，当时，应以查表，再从100中减去查得的数值即为所求可信区间。,总体参数估计,分类变量

27、资料,总体率的区间估计-正态近似法,当样本含量 n 足够大(如)，且样本率p和 1-p均不太小，一般 n p 与n(1-p)均大于5时，样本率 p 的抽样分布近似正态分布，可用正态近似法。总体率的可信区间可按下式进行估计：95CI为,总体参数估计,分类变量资料,在某镇按人口的1/20随机抽取520人，作汉坦病毒IgG抗体滴度实验，得肾综合症出血热隐性感染率为5.17，求该镇人群中肾综合症出血热隐性感染率的95%可信区间。本例 P=0.0517，该镇人群中肾综合症出血热隐性感染率的95%可信区间为3.27%7.07%。,总体参数估计,分类变量资料,总体率的区间估计-正态近似法,总体平均数的估计

28、,点值估计：以 X 作为为的点值估计。由于抽样误差的存在，X往往不等于，通常用区间估计。区间估计：根据样本平均数X是否大于50，可用查表法和正态近似法。,总体参数估计,分类变量资料,总体平均数区间估计-查表法,当样本阳性数时，用查Poisson分布的可信区间，可得总体平均数的95%或99%可信区间。例将一个面积为100cm2的培养皿置于病房中，1h后取出，培养24h，查得8个菌落，试估计该病房平均每100cm2细菌数的95CI。本例，查附表4，得的95%下限为3.4，上限为15.8，即该病房平均每100cm2细菌数的95可信区间为3.415.8。,总体参数估计,分类变量资料,总

29、体平均数区间估计-正态近似法,当样本阳性数时，可按正态近似法估计的可信区间：,总体参数估计,分类变量资料,总体平均数区间估计-正态近似法,用计数器测得某放射性物质2小时内发出的脉冲数为400个,据此估计该放射性物质平均每小时发出的脉冲数的95%可信区间。x=400，则平均每 2小时发出的脉冲数的95%CI为：平均每小时发出的脉冲数的95%CI为,总体参数估计,分类变量资料,七、假设检验,假设检验的基本思想与步骤假设检验的数值变量资料的假设检验-t 检验与u 检验-方差分析分类变量资料的假设检验-服从二项分布与poisson分布的假设检验-卡方检验秩和检验,由于个体变异的普遍存在，抽样研究时

30、，不可避免地存在着抽样误差。当根据样本资料求出样本统计量后，遇到样本统计量与某一总体参数不等，或两个（多个）样本统计量不等时，首先要考虑到抽样误差的问题，还要考虑到样本统计量可能不是来自该总体。即有两种可能性：一种可能：样本是从该总体（或同一总体）中随机抽取的，其差异仅仅是由抽样误差造成的；另一种可能：样本不是从该总体（或同一总体）中随机抽取的，而是有本质上的不同，单纯用抽样误差解释不了。,如何判断？需进行假设检验。,假设检验,假设检验的基本思想,假设检验,假设检验的基本思想,假设检验,假设检验的基本思想,2确定单、双侧检验根据研究目的或专业知识确定单侧检验(one-sided test)

31、或双侧检验(two-sided test)。单侧检验要注明,假设检验,假设检验的基本步骤,（一）建立假设和确定检验水准,（二）选定检验方法和计算统计量根据研究目的、设计类型、资料类型及其分布特征等选用适当的统计检验方法，并计算出相应的检验统计量。,假设检验,假设检验的基本步骤,假设检验,假设检验的基本步骤,假设检验,数值变量资料的假设检验,t 检验,假设检验,t 检验-数值变量,假设检验,t 检验-数值变量,单样本 t 检验（one sample t-test）,假设检验,t 检验-数值变量,单样本 t 检验,随机测得26名男性汽车司机的脉搏平均数为73.7次/分，标准差为8.8/分。据此能

32、否认为男性汽车司机的脉搏平均数高于一般男性脉搏数（72次/分）？,假设检验,t 检验-数值变量,单样本 t 检验,假设检验,t 检验-数值变量,配对t 检验（paired t-test for dependent samples）,t 检验-数值变量,配对t 检验,假设检验,t 检验-数值变量,配对t 检验,假设检验,假设检验,t 检验-数值变量,配对t 检验,t 检验-数值变量,配对t 检验,假设检验,两样本t 检验（two-sample/group t-test for independent samples）,假设检验,t 检验-数值变量,假设检验,t 检验-数值变量,两样本t 检验,u

33、检验,数值变量资料的假设检验,假设检验,假设检验,单样本u 检验（one sample u test）,u检验-数值变量,假设检验,两样本u 检验 two-sample u-test for independent samples,u检验-数值变量,用途：两个或多个样本均数间的比较分析两个或多个因素间的交互作用直线回归方程的假设检验多元线性回归方程的假设检验两个方差的齐性检验,假设检验,数值变量资料的假设检验,方差分析,应用条件：方差分析的应用条件基本同检验：各样本是相互独立的随机样本；各样本来自正态分布总体；各总体方差相等，即。,假设检验,方差分析-数值变量,假设检验,分类变量资料的假设检

34、验,假设检验,分类变量资料的假设检验,检验,假设检验,检验-分类变量,假设检验,检验-分类变量,假设检验,检验-分类变量,属非参数检验。常用的方法有：配对设计的符号秩和检验成组设计的两样本比较的秩和检验成组设计的多样本比较的秩和检验随机区组设计资料的秩和检验,假设检验,秩和检验,假设检验时应注意的事项,1.要有严密的抽样研究设计样本必须是从同质总体中随机抽取的；要保证组间的均衡性和资料的可比性，即对比组间除处理因素(如新药和常规药)外，非处理因素(如年龄、性别、病程、病情轻重等)应尽可能相同。2.正确选用检验方法应根据研究目的、设计类型、资料类型及其分布特征等选用适当的假设检验方法。,假设

35、检验,假设检验,假设检验时应注意的事项,第二部分实验设计,实验设计是科研计划的具体实施方案，是进行实验和统计分析的先决条件，是实验研究获得预期结果的重要保证。科学合理的实验设计方案，不仅要根据研究目的确定研究内容、技术路线和方法，而且要能保证用较少的人力、物力、财力及时间进行实验，最大限度地减少误差，获得可靠的结果。实验设计是专业设计和统计设计的有机结合。,内容,实验设计概述常用实验设计方法,实验设计的基本要素实验设计的基本原则,实验设计概述,实验研究的目的是阐明处理因素作用于受试对象的效应。实验设计的基本要素：处理因素、受试对象和实验效应。,实验设计概述,实验设计的基本要素,在实验过程中

36、，影响实验结果的因素是多方面的，根据研究目的可分为处理因素和非处理因素两类。处理因素是指研究者欲研究的因素，如：药物的种类、剂量、浓度、作用时间，某手术方法的改进等外部因素；有时也可以是年龄、性别。非处理因素是指对正确评价处理因素的作用有影响的因素，例如，病人的病情、病程等。在设计中应注意以下几点：,实验设计概述,实验设计的基本要素-处理因素,要分清处理因素和非处理因素根据研究目的明确何为处理因素，何为非处理因素。如冷水试验。要抓主要因素实验效应通常是多种因素作用的结果，由于人、财、物和时间所限，研究者不可能通过一次或几次实验把已知的所有因素都进行研究与分析，只能抓主要因素。处理因素必须标

37、准化处理因素标准化就是要保证处理因素在整个实验过程中始终如一，保持不变。在实验设计时，必须制定处理因素标准化的具体措施和方法。,实验设计概述,实验设计的基本要素-处理因素,受试对象选择的合适与否，也是实验研究是否成功的关键。医学研究的受试对象有人、动物（标本）。根据受试对象是动物还是人，选择受试对象时应注意以下几点：,实验设计概述,实验设计的基本要素-受试对象,动物的选择实验研究中，动物的选择比较灵活，但要根据研究目的选择动物病例的选择临床试验中，受试对象是病人。必须明确病例的纳入和排除标准，还要符合医学伦理学要求，以及病人要有知情权,实验设计概述,实验设计的基本要素-受试对象,实验效应

38、是通过某些观察指标定量或定性地反映实验结果。研究者应对欲研究的问题有较为全面的了解，以便选择恰当的观察指标来反映实验结果。选择观察指标的原则：客观性、关联性、灵敏性、特异性、精确性。指标的观察：对实验效应的观察应避免偏倚。,实验设计概述,实验设计的基本要素-实验效应,对照（control）随机（randomization）重复（replication）均衡（homogeneity）,实验设计概述,实验设计的基本原则,设立对照组的目的在于消除非处理因素对实验效应的影响，使处理因素的实验效应反映出来。设立对照时，实验组与对照组的非处理因素必须相同。其原理可用以下符号表达：,实验设计概述,实验设计的

39、基本原则-对照,实验设计概述,实验设计的基本原则-对照,常用的对照形式有以下几种空白对照对照组不施加任何处理因素。在临床试验中，一般不用空白对照。实验对照对照组不施加处理因素，但施加某种实验因素。标准对照不设立专门的对照组，用现有标准值或正常值作对照。,实验设计概述,实验设计的基本原则-对照,自身对照对照与实验在同一受试者身上进行，如用药前后、不同部位、同一标本的不同测定方法。一般情况下要求设立平行对照组。相互对照不单独设立对照组，而是两个或几个试验组相互对照。配对对照把条件相同的两个研究对象配成一对，分别给以不同的处理因素，对比两者之间的不同效应。配对对照常用于动物实验。,实验设

40、计概述,实验设计的基本原则-对照,历史对照以本人过去的研究或他人研究结果与本次研究结果作对照。除了非处理因素影响较小的少数疾病外，一般不宜使用这种对照。用时要特别注意资料的可比性。,实验设计的基本原则-对照,实验设计概述,所谓随机，就是每一个受试对象都有同等的机会被分配到任何一个组中去，分组的结果不受人为因素的干扰和影响。随机化分组可达到实验组和对照组均衡的目的。常用随机数字表和随机排列表来随机分组。,实验设计概述,实验设计的基本原则-随机,所谓均衡是指各组间除处理因素不同外，非处理因素均相同.,实验设计概述,实验设计的基本原则-均衡,所谓重复，就是实验要有足够的样本含量。影响样本含量大小的

41、因素有：检验水准，越小，样本含量越大；检验效能，检验效能越大，样本含量越大；处理组间的差别，越小，样本含量越大；标准差，越大，样本含量越大。常用的估计样本含量的方法：查表或用公式,实验设计概述,实验设计的基本原则-重复,1.样本均数与总体均数的比较,实验设计概述,实验设计的基本原则-重复,2.配对设计和交叉实验设计的样本含量估计,式中，N为实验所需的对子数目。,实验设计概述,实验设计的基本原则-重复,3.两样本均数比较,式中，N为每组所需的样本例数。,实验设计概述,实验设计的基本原则-重复,4.样本率与总体率的比较,式中，N为所需的样本含量。,实验设计概述,实验设计的基本原则-重复,

42、5.两样本率的比较,式中，N为两组总例数，每组的例数为N/2。,实验设计概述,实验设计的基本原则-重复,6.配对计数资料,式中，N为实验所需的对子数。,实验设计概述,实验设计的基本原则-重复,7.多个样本均数比较,式中N为各组样本所需例数，和分别为第个样本的均数和标准差的初估值，为组数。值可用相应的工具表查得。,实验设计概述,实验设计的基本原则-重复,8.多个样本率比较,式中N为每个样本所需观察例数。,实验设计概述,实验设计的基本原则-重复,9.估计总体均数,式中N为所需的样本含量，有单、双侧之分。,实验设计概述,实验设计的基本原则-重复,10.估计总体率,式中N为所需的样本含量，有单、双

43、侧之分。,实验设计概述,实验设计的基本原则-重复,11.直线相关分析的样本含量,式中，N为相关分析的样本例数为估计的总体相关系数。,实验设计概述,实验设计的基本原则-重复,常用实验设计方法,医学研究中常用的实验设计方法有：完全随机设计配对设计与配伍组设计交叉设计拉丁方设计析因试验设计正交实验设计不同的研究目的，应采用不同的设计方法安排实验。,实验设计,不考虑个体差异的影响，仅涉及一个处理因素，但可以有两个或多个水平，故亦称单因素实验设计。设计时，将受试对象按随机化原则分配到处理组和对照组中，各组样本例数可以相等，也可以不等，但相等时效率高。优点：设计和统计分析方法简单易行；缺点：只分析一个因

44、素，不考虑个体间的差异，因而要求各观察单位要有较好的同质性，否则，需扩大样本含量。,完全随机设计（pletely random design）,常用实验设计方法,先将实验对象编号，按预先规定，利用随机排列表（或随机数字表）的随机数字将实验对象随机分配到各组中去（用随机排列表进行分组时，各组例数相等；用随机数字表进行分组时，各组例数常不相等，故常用前者）。例按完全随机设计方法将10只小鼠随机分配到甲、乙两组。,常用实验设计方法,完全随机设计,用随机数字表分组,先将小鼠按体重由小到大编号；再从“随机数字表”中任意指定某行某列，如从第31行13列开始，向右抄录10个两位数的随机数字，依次录于小鼠编

45、号下；按预先规定，将随机数字为奇数者分到甲组，偶数者分到乙组。分组情况如下：,分组结果甲组：4、6、7、10号小鼠乙组：1、2、3、5、8、9号小鼠调整：85/6=14(余1)，乙组中的第1只小鼠被调到甲组。,85 53,常用实验设计方法,完全随机设计,用随机排列表分组,先将小鼠按体重由小到大编号；再从“随机排列表”中任意指定一行，如第3行，依次将09之间的随机数字录于小鼠编号下（遇9以上的数字应舍去）；按预先规定，将随机数字为奇数者分到甲组，偶数者分到乙组。分组情况如下,分组结果甲组：1、4、6、8、9号小鼠乙组：2、3、5、7、10号小鼠,18 1 10 13 17 2 0 3 8

46、 15 7 4 19 12 5 14 9 11 6 16,常用实验设计方法,完全随机设计,将受试对象按配对条件配成对子，再按随机化原则把每对中的两个个体分别分配到实验组或对照组。配对条件：以主要的非实验因素作为配比条件。动物实验中，常将同性别、同窝别、体重相近的两个动物配成一对；人群试验中，常将性别和年龄、生活条件、工作条件相同或相近的两个人配成对子。某些医学实验研究中的自身对照也可看作是配对设计。,常用实验设计方法,配对设计（paired design）,例试将已配成10对的20只小鼠随机分配到甲、乙两组。先将小鼠编号，如第一对第一受试者编号为1.1，第二受试者编号为1.2，余仿此。再从随

47、机排列表中随机指定某行，例如第6行，依次将09之间的随机数字录于受试者编号下，舍去10 19之间的数字，并规定随机数字为奇数时取甲乙顺序，偶数时取乙甲顺序。,常用实验设计方法,配对设计,分组结果甲组：1.2、2.2、3.1、4.2、5.1、6.2、7.1、8.2、9.1、10.1 乙组：1.1、2.1、3.2、4.1、5.2、6.1、7.2、8.1、9.2、10.2,随机分组,常用实验设计方法,配对设计,亦称随机区组设计，是配对设计的扩大。该设计是将受试对象，先按配比条件配成配伍组，每个配伍组有3个或3个以上受试对象，再按随机化原则分别将各配伍组中的受试对象分配到各个处理组。配对与配伍组设计

48、的优点：该类设计是按配比条件配对或配伍，考虑了个体差异的影响，可分析处理因素和个体差异对实验效应的影响，比完全随机设计的检验效率高；可减少样本含量。,常用实验设计方法,配伍组设计（randomized block design）,例按体重和年龄为配比条件将12只雌性小鼠配成4个区组，试对每个区组内的3只小鼠随机分配，分别给予甲、乙、丙3种饲料。,常用实验设计方法,配伍组设计,先给动物编号：第1配伍组为13号，第2配伍组为46号，第3配伍组为79号，第4配伍组为1012号；再从随机数字表中，任意指定某行某列，如从第11行第11列开始向右抄录12个两位数，依次列于受试者编号下，在每个区组内将随机

49、数按大小排序，序号为1的小鼠喂以甲饲料、2的喂以乙饲料、3的喂以丙饲料。分配结果如下：,常用实验设计方法,配伍组设计,先给动物编号：第1配伍组为13号，第2配伍组为46号，第3配伍组为79号，第4配伍组为1012号；再从随机排列表中，任意指定连续的4行，如第1215行，每行只取随机数字13，其余舍去，依次列于各配伍组的受试者编号下，并规定随机数字为1的小鼠喂以甲饲料，为2的小鼠喂以乙饲料，为3的小鼠喂以丙饲料。分配结果如下：,常用实验设计方法,配伍组设计,是在自身配对设计基础上发展起来的，该设计考虑了1个处理因素（A、B两水平），2个与处理因素无交互作用的非处理因素（试验阶段和受试对象）对试验

50、结果的影响。优点：具备自身配对设计的全部优点，如减少个体间的差异，减少样本含量；能控制时间因素（试验阶段）对处理因素的影响，因而优于自身对照设计；各试验对象均接受了试验因素和对照，符合医德要求。,常用实验设计方法,交叉设计（cross-over design）,适用条件及应注意的问题,处理因素只有2水平，且两个非处理因素（试验阶段、受试对象）与处理因素间无交互作用。要求两阶段间须有一定间隔时间，以消除前阶段治疗措施的残留效应，保证两阶段的起始条件一致；间隔时间的长短可参照药典或预试验中药物在血清中的衰减速度；两次观察的时间不能过长；适用于病情较稳定、病程可以分阶段、短期治疗可见疗效的疾病；为消