《《医学统计学》复习重点总结.ppt》由会员分享,可在线阅读,更多相关《《医学统计学》复习重点总结.ppt(62页珍藏版)》请在三一办公上搜索。
1、医学统计学复习与总结,统计学的内容结构,1.统计基础:基本 概念、术语、方法组成。2.统计基本方法:了解统计方法用途、对应 资料的数据类型、设计、适用条件。3.统计学的内容:描述样本特征。用样本信息估计总体参数,检验总体间的差别。了解变量间的关系。,应用规则:必须考虑数据类型(计量或计数),分布类型,对比组类型(2组或多组,独立或配对)。学习方法:按知识点 归纳,理解基本概念,掌握应用条件,正确表达(读书不背书)。,统计学方法小结:,计量资料,资料的性质?,计数或等级,单变量统计描述:平均数、变异指标单变量的统计检验:t检验,F检验,秩和检验两变量:相关、回归,原始数据、频数表,原始数据整理为
2、四格表、RC表,数据整理形式?,统计描述:率、构成统计检验:2检验,秩和检验,样本或总体?,统计方法,统计方法,第一 第三章,1.统计学研究的对象是什么?有什么特点?2.总体与样本3.变量与资料类型4.参数与统计量5.什么叫配对设计或完全随机分组设计?,掌握的基本概念,表 100例高血压患者治疗后临床记录,患者 年龄 性别 治疗组 舒张压 体温 疗效编号 X1 X2 X3 X4 X5 X6 1 37 男 A 11.27 37.5 显效 2 45 女 B 12.53 37.0 有效 3 43 男 A 10.93 36.5 有效 4 59 女 B 14.67 37.8 无效。100 54 男 B
3、16.80 37.6 无效,实验与观察研究要求掌握概念,1.实验与观察研究二者的主要区别。2.实验设计的三原则及意义和作用。3.实验设计的三要素是什么?4.观察研究中有那几种概率抽样方法?5.观察研究有几种研究类型?主要回答那些问题?6.何为随机化分组与随机化抽样?,第四、六章 数据特征与统计描述,单个变量的统计描述:1.计量数据:分布的描述:频数表 特征的描述:平均数、变异指标 2.计数资料:分布的描述:频数表 特征的描述:率、构成比、相对比3.统计结果的表达:统计表和图,第四、六章 数据特征与统计描述,掌握内容和概念:1.认识计量数据频数表及分布形态和计数数据的频数表。2.计量数据和计数数
4、据描述的统计指标有那些,各自的适用条件、概念及计算。3.正态分布(X值)理论上常用的三个分布范围为多少?4.熟悉统计描述指标的符号和基本计算。,频数表表达资料,定性数据的频数表,两组疗效的比较 比较组 疗效(y)(x)痊愈 显效 有效 无效 合计实验组 20 25 10 2 57对照组 2 5 15 30 52,1.计量资料统计描述指标,正态或近似正态分布资料描述指标:、S、CV,表达:,偏态分布资料 中位数(M)、四分位间距(QR)表达:M(QR)等比关系资料 几何均数(G),1)描述计量数据(X)几个特征值:平均水平、变异程度指标,正态分布法(正态或近似正态分布资料)百分位数法 P2.5%
5、-P97.5%(偏态分布资料)作用:估计变量值分布范围 评价个体的指标正常与否,2)描述计量数据变量值(x)分布范围,2、计数资料统计描述指标,相对数指标及含义:率指标:说明事物发生的频率和强度。构成比:说明各类别所占的构成比。说明事物的组成和分布情况。相对比:两事件的相对关系(增长速度)。掌握:相对数指标意义及计算 应用时的注意问题,例:某医院部分科室院内感染情况,科 室 住院 感染 感染 感染人数 病 人数 人数 率%构成比%呼吸内科 100 10 10.0 26.32心血管内科 100 8 8.0 21.05泌尿外科 40 6 15.0 15.78胸外科 42 2 11.9 13.16普
6、外科 100 12 12.0 31.58合计 382 38 9.9 100.00,相对数指标,不同职业各年龄(岁)组冠心病发病率比较,年 龄(岁)职业 40-50-60-70 病人数%病人数%病人数%干部 21 60 9 25.7 5 14.3工人 12 70 4 23.5 1 5.9有人认为:该单位冠心病发病率随年龄增加在下降,该结论。,3、统计描述统计表与统计图,统计表要求掌握统计表的基本格式,正确将数据结果用统计表表达。统计表类型:简单表和组合表统计图:要求掌握图形选择.如线图、直条图、直方图、构成图,例:简单表格式某地1980年男女HBsAg阳性率的比较,性别 调查例数 阳性数 阳性率
7、%男 4234 303 7.16女 4530 181 4.00合计 8764 484 5.52,例 组合表的格式某地不同年龄、性别HBsAg阳性率(%)的比较,年龄 男性 女性(岁)调查数 阳性数 阳性率 调查数 阳性数 阳性率0-2118 146 6.89 2719 74 2.7220-1287 116 9.01 1168 82 7.0240-695 37 5.32 571 23 4.0360 112 4 3.57 72 2 2.78合计 4234 303 7.16 4530 181 4.00,原表:,1.层次不清,结构混乱,难于理解2.线条过多,不符要求,指出表的问题,并按统计表的规范进行
8、修改,修改后:,包括癌437例,肉瘤101例,其他恶性肿瘤20例。,第七、八、十章参数估计和假设检验,掌握概念:1.何为均数的抽样误差,统计上用什么表示?2.标准差和标准误的区别?3.均数的可信区间与参考值范围在计算和用途的区别4.何为假设检验,假设检验有何用途5.假设检验的步骤和概念,6.统计检验中、型误差的概念7.区别 配对和两独立样本的资料。8.假设检验(t检验)与可信区间的联系是什么?9.什么叫方差齐性检验,何时采用?10.单样本的可信区间与两个样本的差值的可信区间区别?名词解释:标准差,标准误,均数的可信区间方差齐性,参考值范围,、型误差,计量数据统计的假设检验,假设检验回答问题:比
9、较组的样本均数、率的差别,差别是否由于抽样误差所致。(一)计量资料:1.两组数据的比较t检验 区别:*配对数据t检验(只要求正态)*两组独立样本t检验(例数少)资料要求:正态、方差齐性(两组独立样本t检验),计量数据比较的统计公式,样本均数与标准值的比较,*配对数据的比较(不做方差齐性检验,*两样本均数的比较,例数较小时(做方差齐性检验),t检验与可信区间公式小结,两独立样本均数的t检验公式两均数差值的可信区间公式,配对设计样本均数差值(d)的t检验公式差值均数的可信区间估计公式,第11章 多个样本比较的方差分析,用途:方差分析(F检验)用于三组及以上的计量资料组间均数差别的比较,如FF,做多
10、重两两比较检验。概念:1.为什么多组均数比较不能用t检验2.何为区组设计和完全随机设计的方差分析?3.两种设计方差分析变异分解几个部分,各部分变异的原因。4.方差分析和方差齐性检验区别,方差分析与t检验的关系,当比较两个样本均数时,从同一资料(配对设计或不配对设计),计算的 F 值与t值有如下关系:,F=t2,可见在两组均数比较时,方差分析与t检验的效果是完全一样的。,第九章 计数资料组间的比较,检验方法:2检验2检验可以回答:1.差别:两组或多组组间样本率检验 2.是否独立:两个变量的关联关系(行变量与列变量组间构成比的检验)掌握:1)独立性检验的数据表格形式 2)不同X2的公式及使用条件和
11、计算,计数数据(RC表)的2检验统计公式,基本公式,两组设计四格表专用公式(不配对),两组设计四格表校正公式(不配对),配对设计两组四格表专用公式,2K和RC表的专用公式,两种疗法心血管病病死率比较,疗法 死亡人数 生存数 合计 病死率%苯乙双胍 26(21.3)178(182.7)204 12.75 安慰剂 2(6.7)62(57.4)64 3.13合计 28 240 268 10.45假设:H0:1=2=c=10.45(两组总体率相等)H1:1 2(两组总体率不等)注意:进行卡方检验前,一定计算理论数理论数:T11=n1=20410.45=21.3(人)T12=20421.3=182.7,
12、第12、13章线性回归与相关,目的:探讨计量变量间相关关系(线性)(设计:变量(y、x)资料类型:变量为计量数据要求:有线性趋势方法:1.关系的描述指标:相关系数(r)、回归方程2.关系统计检验:t检验和方差分析,本章节概念,1.相关系数(r)、rs、回归系数(b)各自说明什么?2.相关系数(r)、rs、方差分析如FF,p0.05说明什么?3.SS回和SS剩表示含义?4.何为决定系数,在回归分析中有什么作用?,第14章基于秩次的统计方法,掌握概念:1)何为非参数统计?什么样数据适合采用秩和检验,以及秩和检验的优缺点。3)秩和检验有那几种检验方法?,注意:结果(y)数据为等级时,两组比较采用秩和
13、检验效率高于2检验,应首选秩和检验.,表 某病两组疗效的比较比较组 无效 有效 显效 痊愈 合计 试验组 18(31.6)18(31.6)15(26.3)6(10.5)57 对照组 21(46.7)15(33.3)8(17.8)1(2.2)45 Total39 33 23 7 102(括号内为构成比)计算2=4.81,p=0.186,p0.05计算两组秩和检验,u=2.64,p0.01,1.样本与总体的概念(举例说明)2.统计资料的类型、概念(举例说明)3.标准差与标准误的概念。4.可信区间与参考值范围有区别5.统计检验中的p值和的含义是什么?P0.05,说明什么?6.何时考虑用t检验、F检验
14、,资料满足检验的条件是什么?7.方差分析与方差齐性检验的区别?,思考复习题,8.何时考虑用秩和检验、2检验9.假设检验中的两类错误的概念是什么?10.相关分析和回归分析有何不同,何时考虑用相关,何时考虑用回归.11.实验设计的三要素和三个原则及意义,概念例题练习,一、选择题:1.判断下列资料的类型a.比较两组人的红细胞数(万/mm)b.某疗法治疗某病患者结果:结果:治愈 显效 好转 无效 c.血压指标分为90,90 d.某检查结果:,2.某地50岁以下女性血清铁蛋白数据的S=17.06(ng/ml)表示 表示含义a.数据最大和最小的范围 b.样本数据中个体值平均水平的指标 c.表示均数的抽样误
15、差大小 d.表示该指标的个体间变异程度的指标,3.某医院收治某病患者的年龄情况如下:年龄(岁)10-20-30-40-50-60以上人数 2 5 10 60 100 501)本研究关心变量是 a某病患者 b 某病患者年龄2)上述资料为:a原始数据 b计量资料频数表 c计数资料频数表3)应选择什么指标做统计描述:a b M与四分位间距(QR)4)如绘制统计图应选择什么图形?a直条图 b百分构成图 c直方图 d线图 5)本例数据是否要做t检验?,4.哪个公式是估计正态分布资料个体值95%的分布范围 a.b.c.d.5.做两组独立样本t检验和方差分析的前提条件:a.无条件 b.c.正态分布 d.资料
16、正态和方差齐性,6.两配对样本 t 检验的前提条件:a.无条件 b.方差齐性 C.正态分布 d.资料正态和方差齐性 7.两样本均数比较,分别取以下检验水准,下列何者2型误差最小?a.0.05,,8.测得18名正常人(晨尿)尿氟含量,可用 估计 的95%可信区间。a.b.c.d.9.的95%可信区间含义为:a.95%的个体值分布的范围b.95%的分布的范围c.范围包含,其正确的可能性为95%,10 某城市人口普查结果,65岁以上的老人占总人口的26.5%。这26.5%是。a.率 b.构成比 c.患病率 d.百分位数,11.两个独立小样本计量资料的统计检验,首先考虑 a.用t检验 b.用Wilcx
17、on秩和检验 c.用u检验 d.用a或b都可以 e.资料符合a或b的条件 12.在完全随机分组的方差分析中:总变异有以下关系a.MS总=MS组间+MS组内 b.MS组间MS组内SS总=SS组间+SS组内 d.SS总SS组间+SS组内,13.测得某地180名正常人血液总胆固醇含量并编制频数表,该资料可用 图表示。记录某年某省五种恶性肿瘤的死亡人数,该资料可用 表示。a.圆图 b.条图 c.线图 d.直方图,14.9名志愿受试者服用某种减肥药前后的体重列于下表,编号 服药前 服药后 1 101100 2 131136 3 131126 4 143150 5 124127 6 137126 7 12
18、6116 8 95105 9 90 87,服用某种减肥药前后的体重,本研究的设计为:A 两独立样本 b配对样本回答减肥药是否有作用,可以用A2检验 b两独立的t检验C 区组方差分析D完全随机分组的方差分析E 配对t检验,15两组样本均数比较,经t检验,差别有显著性,P值越小,说明_。a.两样本均数差别越大 b.两总体均数差别越大 c.H0被拒绝概率越小 d.H0成立概率越小,16.三组样本均数比较的方差分析,结果如下:统计检验p0.05,可推断_ a.各组的各个体数据之间有统计差别 b.表示第1组与第2组数据之间有统计差别 c.表示三组任意两组之间都有统计差别 d.表示三组数据的均数不等或不全
19、等.,17.某克山病区测得10名克山病患者与12名健康人的血磷值(mmol/L)如下:患者(X1):1.84 1.05 1.20 1.39 1.53 1.87 1.80 1.97 2.07 2.11健康人(X2):0.54 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 上述数据应采用什么统计方法a.2 检验 b.完全随机分组方差分析c.配对t检验 d.计算各组均数直接作比较e.t检验 f.两组秩和检验g.相关与回归分析,18.两组疗效的比较 痊愈 显效 有效 无效 合计实验组 20 25 10 2 57对照组 2 5 15 30
20、52本例资料做统计检验,应选择 a.2检验 b.t检验 c.相关分析 d.两组秩和检验,19在下面试验设计中,实验误差最小的是_。a.同体配对设计 b.异体配对设计 c.完全随机分组设计 d.不能区别20在下面观察设计中,抽样误差最小的是_。a.简单随机抽样 b.系统抽样 c.整群随机抽样 d.分层随机抽样,21.下面哪个统计指标是反映两个计量指标间的相关关系和密切程度的,_。a.t值 b.2值 c.回归系数 d.相关系数22.相关系数r=0.3,其统计检验P0.001,其P值的含义为:a.表示两变量有非常密切相关关系 b.表示两变量有相关关系的概率很小 c.表示两变量有相关关系存在,说错的概
21、率不到0.1%。,23.下面哪个指标反映X变量对Y变量是有作用(影响)a.回归系数大小 b.F值的大小 c.截距大小 d.相关系数24.下面哪个指标反映Y变量的变异不是由X变量作用引起 a.Sy b.回归系数 c.SS剩 d.SS回 25.计算回归方程时,何者作为x或y的选择 a.不影响回归系数 b.回归系数不同 c.不影响决定系数 d.相关系数不同,26.关于假设检验下面那些是正确的1)单侧检验优于双侧检验。错2)采用单侧检验或双侧检验是由专业知识确定的。对3)采用配对t或两组t检验是由设计确定的。对4)假设检验中的和p无区别。错5)p,表示比较的两总体均数差别很大。错6)两样本均数的比较既
22、可用t检验,也可用方差分析。对7)两组的等级资料比较,最好选择2检验。错8)p0.05时,拒绝H0,但有可能犯型错误。对,二、计算分析题 1、三地湖水中氯化物的含量(mg/L)如下,试比较三地湖水中氯化物含量差别有无意义。(13分),x x2 S2 甲地192314181589163512.7 乙地182021142497193713.8 丙地171522251695187918.5,2、某市调查市区在校小学生1800人,龋患率为41%,农村在校小学生1650人,龋患率为46%,试问该市区与农村在校小学生龋患率有无差别?。(10分),3、测得8名20岁男青年身高(cm,x)与前臂长(cm,y)
23、如下,请作直线相关与回归分析。(12分),例号 1 2 3 4 5 6 7 8 身高(x)170 173 160 155 173 188 178 183 前臂长(y)45 45 44 40 47 50 47 49,4.9名志愿受试者服用某种减肥药前后的体重列于下表,(14分),编号 服药前 服药后 1 101100 2 131136 3 131126 4 143150 5 124127 6 137126 7 126116 8 95105 9 90 87,服用某种减肥药前后的体重,.用方差分析方法检验此药是否有效?.除方差分析外,还可以用哪些参数检验方法分析?(不必计算),指出表中结果表达的错误之处,并进行修改,考试答题要点,计算题:选用相应公式前,应简述该公式的设计、应满足的条件。如需要列出表格,应列出表格(如四格表)。要求写出计算的公式、计算的中间过程结果。如是假设检验,应写出正确检验假设的步骤。,考试要求,1.闭卷考试(时间120分钟)2.带计算器,笔,尺子 3.要求掌握计算器对常用统计方法计算 谢 谢 大 家 祝大家考试成功,
链接地址:https://www.31ppt.com/p-5897138.html