《医学科研数据评价与分析中的几个基本问题.ppt》由会员分享,可在线阅读,更多相关《医学科研数据评价与分析中的几个基本问题.ppt(35页珍藏版)》请在三一办公上搜索。
1、医学科研数据评价与分析中的几个基本问题,Fundamental Problems of Data Evaluation and Analysis in Medical Research,主讲人:孙振球 教授中南大学公共卫生学院,一、数据评价(Data Evaluation)1.代表性(Representativeness)2.均衡性(Proportionality,Balance,Comparability)3.可靠性(Reliability)4.完整性(Integrality)5.时效性(Timeliness)二、数据分析(Data Analysis)1.数据类型(Data Type)及其转
2、换(Transformation)2.变量代换(Variable Transformation)3.统计量选择(Selection of Statistic)4.参数估计(Parametric Estimation)5.假设检验(Hypothesis Testing)方法的选择,一、数据评价(Data Evaluation),1.数据代表性(Representativeness)评价(1)“质”(Quality)的代表性评价,随机化(Randomization)原则,A 意 义:机会均等;主观意愿的排除B 重要性:样本质的代表性的保证 组间均衡性的保证 统计推断的前提,C 常用方法,随机化抽样
3、,随机化分配,抽样框架(Sampling Frame)的确定案例分析(Case Analysis),(2)“量”(Quantity)的代表性评价 样本含量(Sample Size)的确定,A 意义:,正式试验,预备试验,发现总体间存在确有实际意义的差别,获得有关参数,一定精度下,所需的最少观察单位数,发现这种差别,C 常用方法,B 重要性:样本代表性的保证 样本间均衡性的保证 结果重现性的保证,案例分析,2.数据的均衡性(Proportionality,Balance)评价,(1)对照(Control)设置的科学性评价,A 意义:比较中进行鉴别B 重要性:实验因素效应的分离,C 常用方法:,(
4、2)案例分析,3.数据的可靠性(Reliability)评价,(1)有效数字(Significant Digit)问题:原始测量数据只允许保留一位估计数(2)可疑值(Suspected Value)清除:,A 意义:可疑值为由粗大误差导致的极端值B 常用方法举例:正态分布数据可疑值鉴别方法,(3)数据可靠性评价的几种方法:项目符合率(Item Concordance Coefficient)一致性度量(Agreement Measurement);相关分析方法(Correlation Analysis);Kappa系数(Kappa Coefficient)等。初级指标的合理性评价(4)案例分析
5、,4.数据的完整性(Integrality)评价 观察单位完整 观察项目完整,5.数据的时效性(Timeliness)评价,二、数据分析(Data Analysis),数据类型及其转换,(1)目的:适应某些统计方法的要求(2)类型:,数值变量Numerical Variable,(定量,计量资料)Quantitative,Measurement Data,(定性,等级资料)Qualitative,Ranked Data,分类变量Categorical Variable,(3)分类指标的量化,两向分类指标的量化 等级资料的量化,变量变换(Variable Transformation),(1)目
6、的:适应某些统计方法的要求(正态性与方差齐性,曲线的直线化),(2)常用方法:,对数变换(Logarithmic Transformation)A 形式:B 目的:对数正态分布;与s 有连带关系;曲线(指数,双曲线,Logistic曲线)直线化,平方根变换(Square Root Transformation)A 形式:B 目的:泊松分布资料的正态化;与s2 有连带关系,平方根反正弦变换(Arcsine Transformation)A 形式:(尤其P70时)B 目的:相同基数的百分数资料的正态化,其它变换 1)概率单位变换(Probit Transformation)u 为百分数P 相应的标
7、准正态离差,用于S 形曲线直线化 2)反双曲正切变换(tanh-1 Transformation)r 为直线相关系数,用于r 间的比较与合并,3.统计量(Statistic)的选择,(1)统计量选用的原则:研究目的:描述集中趋势?离散趋势?抽样误差?资料类型:计量资料?计数资料?等级资料?数值分布特征:正态分布(对称分布)?偏态分布(非对称分布)?(2)统计量的合理搭配使用,参数估计(Parametric Estimation),(1)参数的点估计与区间估计:精确的方法 与近似的方法(2)参数估计的精度与准确度,假设检验方法的选择(Hypothesis Testing),影响假设检验方法选用的
8、因素:研究目的:找差异;找关系;其它 研究因素的多少:单因素;两因素;多因素 研究的组数(水平数)的多少:两组;多组 实验设计类型:成组;配对;配伍组 资料特征与分布:检验何种统计量?样本含量大小,(2)案例分析,不同人群某种抗体滴度比较,研究目的?研究因素?分组或水平数?实验设计类型?资料分布特征:选用何种统计量?样本大小?选用何种假设检验方法?,问题:,计算题:,将116例癫痫患者随机分为两组,一组70例接受常规加高压氧治疗(高压氧组),另一组46例接受常规治疗(常规组),治疗结果见表1。问两种疗法有效率有无差别?表1 两种疗法治疗癫痫的效果,某抗癌新药的毒理研究中,将78只大鼠按性别、窝
9、别、体重、年龄等因素配成39对,每个对子的两只大鼠经随机分配,分别接受甲剂量和乙剂量注射,实验结果见表2。试分析该新药两种不同剂量的毒性有无差异。表2 某抗癌新药两种剂量的毒理实验结果,用A、B、C三种不同方法处理新生儿脐带,发生感染的情况见表3,试比较3种不同方法的脐带感染率有无差异。表3 三种脐带处理方法的脐带感染情况,在某项疼痛测量研究中,给160例手术后疼痛的患者提供四种疼痛测量量表,即直观模拟量表(VAS),数学评估量表(NRS),词语描述量表(VDS),面部表情疼痛量表(FPS),患者首选的量表以及患者的文化程度见表4,问患者首选疼痛量表与文化程度是否有关?表4 不同文化程度患者首
10、选疼痛量表的类型,为研究丹颐对蛛网膜下腔出血的治疗作用,将36例蛛网膜下腔出血的患者随机分为两组,每组18例。一组接受常规治疗(对照组),另一组接受常规治疗加丹颐静脉滴注治疗(丹颐组),结果见表5,问两种疗法的病死率有无差别?表5 两种疗法的治疗效果,用简单法和常规法分别对12份人尿进行尿铅测定,所得结果如表6,问根据现有资料能否说明两种方法检测结果不同?表6 两法测定12份尿铅含量的结果,将14只大白鼠随机分为两组,一组做成白血病模型,一组为正常鼠,然后测量两组鼠脾脏DNA含量(mg/g),问正常鼠和白血病鼠脾脏中DNA平均含量是否不同?白血病组(X1):12.3 13.2 13.7 15.
11、2 15.4 15.8 16.9 正 常 组(X2):10.8 11.6 12.3 12.7 13.5 13.5 14.8,为了解烫伤后不同时期切痂对肝脏三磷酸腺苷(简写为ATP)的影响,将30只雄性大鼠随机分为三组,每组10只;A组为烫伤对照组,B组为烫伤后24h(休克期)切痂组,C组为烫伤后96h(非休克期)切痂组。全部动物统一在烫伤后168h 处死并测量其肝脏的ATP含量,结果见表8。试推论B组和C组的处理对ATP是否有影响?,表8 大鼠烫伤后肝脏ATP的测量结果(mg),为了比较不同浓度的血水草总生物碱对血吸虫尾蚴的杀灭作用,实验 动物为48只雄性小鼠。实验方法是将试验小鼠感染40只血吸虫尾蚴后,分别接受4种处理,其中甲处理为对照,其余3种处理分别为不同浓度的血水草总生物碱浓度,用试验后小鼠体内的尾蚴的存活率评价不同浓度的血水草总生物碱的作用。实验结果见表9,试分析甲、乙、丙、丁不同浓度的血水草总生物碱对小鼠体内的尾蚴杀灭作用是否不同?,表9 不同浓度血水草总生物碱处理后小鼠体内的尾蚴存活率,谢谢大家!,
链接地址:https://www.31ppt.com/p-5689676.html