中医药论文中常见统计学分析方法应用错误辨析.ppt
《中医药论文中常见统计学分析方法应用错误辨析.ppt》由会员分享,可在线阅读,更多相关《中医药论文中常见统计学分析方法应用错误辨析.ppt(98页珍藏版)》请在三一办公上搜索。
1、医学论文中常用统计分析方法误用辨析主讲人:黄品贤Email:电话:51322156,坐席安排,星期四上课学生,星期五上课学生,讲座内容,现代统计学的新观念面对现实中复杂的问题怎样处理?医学统计学的地位医学文章中统计分析的应用现状中国医学杂志的调查结果中华系列医学期刊的调查结果国外权威医学期刊调查结果国内外调查结果显示误用统计分析方法的原因医学论文中常用的统计分析方法误用辨析减少医学论文中统计学错误的对策,现代统计学的观念,“科学试验做完后再找统计学家分析数据,如同病人死了找医生进行尸体解剖,医生会告诉你病人死的原因。同样,统计学家会告诉你试验失败的原因。”-英国Ronald Fisher(18
2、901962),统计学是“对令人困惑费解的问题做出数字设想的艺术。”-David Freedman,“在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有的判断都是统计学。”统计与真理怎样运用偶然性 C.R.劳先生,统计学是处理复杂问题的工具,Francis Galton(1822.2.161911.1.17),“当人类科学探索者在问题的丛林中遇到难以逾越的障碍时,唯有统计工具可为其开辟一条前进的通道”。-英国著名遗传学家Galton,面对现实中复杂的问题怎样处理?,医学统计学如今是热门科学。美国食物和药品管理局(Food and Drug Administ
3、ration,FDA)和欧盟法规要求实验研究、临床研究、药物开发、医学杂志审稿、流行病学探索,以及政府制定有关政策的民意调查、数据分析、决策预测等都需要统计学家的直接参与。由统计学家指导研究设计、数据分析乃至准备呈递给FDA的报告。在我国,医学统计学也越来越受到学术界和有识之士的重视。,医学统计学的地位,医学统计学的地位,据调查,柳叶刀(The Lancet)、新英格兰医学杂志(New England J.Medical)、美国医学杂志(JAMA)、英国医学杂志(BritishJ.Medical)等著名医学杂志发表的文章中,有70%应用了统计学,而且杂志有统计学的常务编审。“统计学是现代医学大
4、厦的一个重要支柱”。-美国医学会杂志(JAMA)主编统计学能使数据变成信息。,医学论文中统计分析的应用现状,在医学事业迅速发展的今天,医学研究论文已成为主要的交流方式。但医学论文中尚存在各种统计分析方法应用上的问题,统计学缺陷涉及面:国外约50%,国内80%以上。主要有:研究设计不合理(设计水平低下);分析方法选用不得当(方法使用错误);应用条件不遵循;样本含量不满足统计学要求;结果解释不合理(推断过于肯定);统计报告(报告项目不全)。,由于计算机应用的普及和统计分析软件的发展,统计分析的过程和步骤主要由统计软件实现,随之普遍出现乱用计算机统计软件现象。不管统计分析方法的前提条件是否満足,将数
5、据直接代入计算机软件中,使得出的结果与实际相差甚远。现有的统计软件使用不太方便,造成用户的误用。作为医学学术刊物的主要读者一定要正确地评价、参考和利用这些发表的医学论著。,医学论文中统计分析的应用现状,中国医学杂志近800种,其中代表医学最高水平的中华、中国系列杂志近百种。据统计:中华系列医学杂志发表的论文中有统计问题或错误的达到70。国际著名医学杂志有统计问题或错误也达50%。-(胡良平 主编 军事医科院出版2003年),中国医学杂志的调查结果,国外权威医学期刊调查结果,Glantz调查了1977年Circulation Research和Circulation杂志中发表的文章,在使用统计学
6、方法的文章中具有统计学问题或错误的分别有61%和44%。Kanter等调查了1992年至1993年Transfusion杂志发表的文章,发现75%的文章至少存在一处统计问题或错误。,国内外调查结果显示,30年前,美国医学杂志(JAMA)一位编审曾说:“医学论文作者统计知识和统计水平低下”。近30年来,临床医学论著中统计应用缺陷没有发生根本改善,误用率仍很高。,统计学中特别强调,有缺陷的数据得不出明确的结论!皮尔逊(英国统计学家,1895-1980),误用统计分析方法的原因,1.对统计学的作用重视不够、统计教育的普及不够。,我国很多企业投入上千万资金进行计算机数据平台建设,但投入数据统计分析方面
7、很少。其结果是获得的只是一些简单的报表,有价值的信息很少。-中科院张永光教授,要提高统计信息的科学和真实性,必须在人力、资金财力、法律上对统计切实加以重视,不只是口头上,以统计P值来做装饰。,2.统计学教学观念和方法落后,教学与实际应用结合少;教学中结合软件授课少;教学人员较少参与医学研究设计、质控、数据管理和分析等;教学难以紧跟上统计分析方法与统计软件的发展速度。,误用统计分析方法的原因,3.计算机统计软件应用问题,“计算机软件给统计学带来了革命性的变化”,但对于同一份数据资料,统计学可提供多种不同的分析方法,应用各种分析方法都有一定的前提条件,采用不同方法所得到的结果不完全相同。对于研究者
8、来说,重要的是明确研究设计的类型、判别数据资料的分类、选择恰当的统计分析方法、遵循统计分析方法的应用条件、应用软件实现统计分析、对分析结果的正确解释和表达,则完全依赖于应用者所掌握的统计知识。,误用统计分析方法的原因,不少研究者曾多次学习医学统计学课程,但仍然对统计学知识理解很模糊。有的学生医学统计学成绩很好,但是遇到很简单的实际问题也不会解决。,误用统计分析方法的原因,4.医学统计学的学习和应用能力有待提高,医学论文中常用的统计分析方法误用辨析,一、实验设计存在的典型错误二、计量资料分析常见的统计问题三、计数资料分析常见的统计问题四、直线相关与回归分析常见统计错误五、统计分析方法表述问题六、
9、统计表与统计图方面的问题七、多元回归分析,1.1 没有遵循随机原则1.2 缺乏对照组1.3 对照不全1.4 实验分组不合理1.5 没有按设计类型进行实验和收集数据1.6 组间基线资料的均衡性检验1.7 用“重复取样”替代“独立重复实验”1.8 样本含量过少,一、实验设计存在的典型错误,1.1没有遵循随机原则,问题:某研究者人为地选择发病在5d以内的病人进入治疗组,而对照组则没此限制。,辨析:根据常识,早期治疗对疾病的预后具有重要影响,往往具有较高的治愈率和较低的病死率。治疗组和对照组由于人为因素的干扰和影响,在“病程”这一重要的非实验因素上并没有达到均衡,不具有可比性。在制定实验设计方案时,应
10、将重要的非实验因素考虑在内,用随机化法使各组病人在重要的非处理因素方面尽量达到均衡一致,以便提高组间的可比性。正确的做法:对病程不做限制或均选择发病在5d之内的病人,在实验分组时遵循随机的原则,减少人为因素的影响,使入选的任何一个病人有相同的机会进人治疗组和对照组。,1.2 缺乏对照组,问题:某作者对64例银屑病患者进行血型观察,其中O型血30例,A型血17例,B型血17例,AB型血0例。没有进行统计分析,仅凭数字大小,认为银屑病的发病与血型有明显的关系,同时也证实了遗传致病的决定意义。,辨析:正常人群中的血型构成存在较大差异,AB型的比例为最少,作者没有对正常人群的血型分布情况进行调查,仅根
11、据自己调查的银屑病人血型构成相差悬殊的情况,并不能说明银屑病人与正常人群在血型构成上存在差异,作出结论也是没有说服力的。正确的做法:应设正常对照组,调查正常人群的血型分布情况,并与银屑病人的血型分布情况对照不全进行比较,如果存在差异,则为银屑病的发病因素提供了某种线索,如果没有差异,则可以认为银屑病发病与血型构成没有关系。,1.3 对照不全,文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。设计:3个实验分组:1.模型组加入50gL重组人表皮生长因子(rhEGF);2.姜黄素(Cur)组加入终浓度为10gL的Cur和50gLrhEGF;3.空白对照组加入等体积硝酸盐缓冲液。请问:此设计正确吗?
12、,辨析:本实验实际上涉及了“rhEGF用否”、“Cur用否”两个实验因素。正确的实验设计应是这两个实验因素的全面组合,所以应设4个组(22析因设计)。作者仅设立3个组,缺了1个单用10gLCur的实验组,犯了“对照不全”的错误。,1.4 实验分组不合理,文题:参芪扶正注射液联合化疗治疗恶性肿瘤86例临床观察。问题:作者选取2002年12月2004年5月住院治疗的恶性肿瘤患者86例,其中男46例,女40例;年龄2669岁,平均53岁;其中肺癌26例,大肠癌22例,鼻咽癌16例,乳腺癌12例,卵巢癌6例,恶性淋巴瘤4例。采用随机交叉试验设计,将86例患者随机等分成A、B两组。请问:此设计正确吗?,
13、辨析:作者所选取的恶性肿瘤患者在病种方面差异较大,各病种的样本含量相差较大,且年龄跨度较大,不能认为他们来自于同一个总体。把他们随机分入试验组和对照组参加试验,两组之间的可比性可能很差,其结论的可信度很低。正确的做法:按6种疾病分层随机化,同时考虑年龄、性别、病情等非处理因素的组间均衡性,尽可能使组间非处理因素达到比较高均衡性。,1.4 实验分组不合理,文题:参芪扶正注射液联合化疗治疗恶性肿瘤86例临床观察。作者采用交叉实验设计,获得的实验数据见表1。请问:这样做正确吗?,1.5 没有按设计类型进行实验和收集数据,辨析:作者没有按照交叉实验设计的要求收集数据。没有将各组两阶段的数据分列出来,而
14、是简单地将试验组第1周期的数据和对照组第2周期的数据合并成试验周期(A为:参芪扶正注射液联合化疗所得的数据),将试验组第2周期的数据和对照组第1周期的数据合并成对照周期(B为:单纯化疗所得的数据),并按照化疗后的5个时间点将数据列表。这种列表方式掩盖了交叉设计中不同试验顺序和不同阶段各自总体间可能存在的差异,也就达不到交叉设计的目的。事实上,该文中的试验设计类型更像重复测量设计。,1.5 没有按设计类型进行实验和收集数据,1.6 组间基线资料的均衡性检验,文题:止痛如神汤对慢性非特异性溃疡性直肠炎的临床疗效 组间均衡性检验:破盲后经比较试验前两组间性别、年龄、病程、病情、临床类型构成等,认为两
15、组基线特征均衡性好,具有可比性,见表2。请问:下表是否有不妥之处?,辨析:1.年龄和病程资料为数值变量资料,作者将数值变量资料转化为等级资料,这个转化过程损失样本信息。可直接根据资料是否满足参数检验的条件,可用参数检验,如不满足则用非参数检验。2.没有提供假设检验的统计量和P值。3.本资料按照性别、年龄、病程、病情、临床类型等分层后,各个格子中的实际数较小,样本是否具有代表性?应根据本研究的主要指标估算样本量,以满足统计学要求。4.当样本较少的成组设计资料比较时,若检验结果为P0.05时,可能是由于样本量不满足统计学的要求,而导致检验效能低下。最好的办法是增加样本量。,1.6 组间基线资料的均
16、衡性检验,1.7用“重复取样”替代“独立重复实验”,文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。请问:此设计正确吗?,辨析:文章中没有描述实验采集了多少只健康小牛。如果作者取1只健康小牛晶状体的混合消化液消化后培养,加入不同药物,制成了3组所用的处理液,每份处理液再等分成6份,则犯了用“重复取样”替代“独立重复实验”的错误;同样,若作者取3只健康小牛晶状体的混合消化液消化后培养,加入不同药物,制成3组所用的处理液,每份处理液再等分成6份,
17、亦属重复取样。只有当作者取自18只健康小牛眼晶状体的混合消化液,进行相关培养后,随机分配至3组中,进行有关实验处理,才是正确运用了重复原则。,1.7 用“重复取样”替代“独立重复实验”,1.8 样本含量过少,文题:芪众颗粒预防老年人上呼吸道感染临床研究问题:三组之间证型分布比较,经RC卡方检验,无统计学意义,具有可比性(20.809,P0.05),排前三位的证型依次为:脾肺气虚(62.42%),脾肾阳虚(17.45%),心脾两虚(6.71%),见表3。,表3 三组证型之间比较,辨析:本资料中有一个格子的理论数小于1,说明本资料不可以做RC卡方检验,而应该做RC的fishers确切概率法。本资料
18、很多格子的实际数小于5,应增加样本量。作者设空白对照组(即观察期间忌服任何预防药物或采用任何预防方法),这是临床试验疗效评价的医学伦理学不应许的!国家临床试验规范中要求,临床疗效研究的对照组一般采用目前公认的有效治疗法或有效的常规治疗法。对于确定新药疗效评价可以用安慰剂对照。假设检验做等效性检验、非劣效性检验或优效性检验。设置空白对照组只有在动物研究中。,1.8 样本含量过少,二、计量资料分析常见的统计问题,2.1 忽视t检验的前提条件2.2 误用成组设计资料的t检验分析配对设计资料2.3 忽视方差分析的前提条件2.4 误用t检验分析等级资料2.5 误用t检验处理重复测量的两因素试验设计2.6
19、 误用配对设计资料的t检验处理单因素k(k3)水平设计的资料2.7 多因素非平衡组合设计的统计错误2.8 正确处理析因设计或嵌套设计定量资料,2.1 忽视t检验的前提条件,文题:重症急性胰腺炎并发肝功能不全的临床研究。实验数据见表5。原文作者用t检验分析此资料。请问:这样做正确吗?,辨析:1.对表5数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指标不能满足方差齐性的要求,故不能采用t检验进行分析。正确的做法:采用变量变换使数据服从正态分布且方差齐,然后进行t检验,否则,采用非参数检验。2.给出确切的统计量和P值。,2.2 误用成组设计资料的t检验分析配对设计资料,辩析:1.考虑到对数据
20、进行变换是正确的。但是如果采用成组t检验,还需要两总体方差齐性。但本研究是配对设计,如果采用成组t检验,会降低检验效率。应该采用配对t检验进行分析。注意配对t检验的条件:要对每对数据的差值(d)进行正态性检验。如果不满足,改用Wilcoxon符号秩检验。2.应给出确切的统计量和P值。,2.2 误用成组设计资料的t检验分析配对设计资料,2.3 忽视方差分析的前提条件,确切的统计量和P值,文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。请问:采用
21、方差分析正确吗?,均数标准差?,辨析:此实验分3组,应为单因素三水平设计定量资料,应首先进行“独立性”、“正态性”和“方差齐性”检验,如果满足方差分析的3个前提条件则用方差分析;如果不满足,则采用变量变换或秩和检验。如果P0.05,则进行多组均数间的多重比较。给出确切的统计量和P值。,2.3 忽视方差分析的前提条件,2.4 误用t检验分析等级资料,文题:止痛如神汤保留灌肠治疗CNUP:双盲随机安慰剂对照试验,表4 两组临床主要症状和结肠镜肠粘膜病变评分(),:与对照组(G2)比较,P0.05,组间差异无统计学意义;:与治疗前比较,P0.05,组内差异有统计学意义;:与对照组(G2)比较,P0.
22、05,组间差异有统计学意义;,2.4 误用t检验分析等级资料,辨析:对于腹痛、腹泻、脓血便、下坠感、充血、水肿、粘膜糜烂、粘膜溃疡的单项评分组间比较,不宜用t检验。因为每项评分为1、2、3等不连续的赋值,数据资料不服从正态分布。应将数据整理成分组无序指标有序的等级资料,宜采用秩和检验。分析“总评分”时,应对数据进行正态性和方差齐性检验后,决定选用t检验或秩和检验。与对照组(G2)比较,P0.05,组间差异无统计学意义,不必在备注中表示。应写出确切的统计量和P值。,2.4 误用t检验分析等级资料,2.5 误用t检验处理重复测量的两因素试验设计1,文题:益气活血法预防老年患者髋部术后下肢深静脉血栓
23、形成统计学处理:采用SPSS10.0统计软件,两组间计量资料比较用t检验。,辨析:本研究设计类型为:两因素(处理和时间)重复测量设计资料。在资料满足“独立性”、“正态性”和“方差齐性”的前提条件下,及进行球对称检验,应选用两因素设计的重复测量的方差分析,选用t检验分析该资料是不妥的。,文题:复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后T淋巴细胞亚群的影响。设计:作者选取60例恶性肿瘤患者,随机分成2组。试验组在伽玛刀放射治疗的同时给予复方苦参注射液20ml加入生理盐水500ml,静脉滴注,1次d,10d为1个疗程;对照组仅给予伽玛刀放射治疗。试验结果见表7。请问:统计分析方法选用t检验正确吗?
24、,2.5 误用t检验处理重复测量的两因素试验设计2,确切的统计量和P值。,辨析:1.统计分析错误 本试验中,每位受试者在试验前、后两个不同的时间点上被重复测量了同一个指标的数值,试验前与试验后的数据并不相互独立,这种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测量有关的试验因素。原作者用t检验进行两两比较,则割裂了整体设计,不能准确地估计和控制误差,因而不能得到可靠的结论。正确的做法:应将表7的形式改成重复测量试验设计的标准形式,采用与之对应的方差分析进行数据处理。,2.5 误用t检验处理重复测量的两因素试验设计2,原文题目:“莪术对大鼠在体子宫肌电活动的影响及其机制研究”,文章为
25、观察莪术水煎剂对未孕大鼠子宫肌电活动的影响,40只大鼠被随机分成4组,对照组:按10mlkg鼠重灌服生理盐水,莪术组:按10mlkg鼠重分别灌服25、50、100莪术水煎液分成3组。观察每个大鼠子宫肌电爆发波的峰面积、持续时间和个数。原作者应用配对设计定量资料的t检验进行统计处理,资料见表4。,表 莪术水煎剂对大鼠子宫肌电活动的影响(均数标准差),2.6 误用t检验处理单因素k(k3)设计的资料,辨析:没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。本资料有四个剂量,属于单因素四水平设计的定量资料,不可以用成组设计或配对设计的t检验。措施:如果满足正态性和方差齐性两个前提条件,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中医药 论文 常见 统计学 分析 方法 应用 错误 辨析
链接地址:https://www.31ppt.com/p-5165800.html