医学统计学九双变量回归与相关课件.ppt
《医学统计学九双变量回归与相关课件.ppt》由会员分享,可在线阅读,更多相关《医学统计学九双变量回归与相关课件.ppt(98页珍藏版)》请在三一办公上搜索。
1、2023/3/22,医学统计学,1,双变量回归与相关,Bivariate Regression&Correlation,第二军医大学卫生统计学教研室 张罗漫,第9章,2023/3/22,医学统计学,2,讲课内容:第一节 直线回归(重点)第二节 直线相关(重点)第三节 秩相关 第六节 两条回归直线的比较 第七节 曲线拟合,2023/3/22,医学统计学,3,第2、第3、第4章介绍了计量资料单变量的统 计描述与统计推断:P.13 例2-1:计算101名成年女子血清总胆固 醇的平均指标与变异指标。P.51 例3-7:比较阿卡波糖胶囊(试验组)与拜 糖苹胶囊(对照组)降低糖尿病人的空腹血糖值 有无差别
2、。P.73 例4-2:比较安慰剂组、降血脂新药2.4g 组、降血脂新药4.8g组、降血脂新药7.2g组降 低患者的低密度脂蛋白含量有无差别。,2023/3/22,医学统计学,4,在医学研究中常要分析两变量间或多变 量间的关系:年龄与血压 药物剂量与动物死亡率 肺活量与身高、体重、胸围和肩宽等,2023/3/22,医学统计学,5,事物间的相关关系确定性关系 两变量间的函数表达式 圆的周长与半径的关系:C2R 路程与速度、时间的关系:LST 数学中X与Y的直线函数关系:Ya+bX 非确定性关系 两变量间存在关系,但未精 确到可以用函数表达式来描述。年龄与血脂的关系;身高与体重的关系;体重与体表面积
3、的关系。,2023/3/22,医学统计学,6,第一节 直线回归,Linear Regression,2023/3/22,医学统计学,7,一、直线回归的概念“回归”是一个借用已久因而相沿成习 的统计学术语。直线回归是分析成对观测数据中两变量 间线性依存关系的方法。,2023/3/22,医学统计学,8,生物遗传学上的“回归”Pearson K(英,18571936)1903年搜集了1078个家庭人员的身高、前臂长等指标的记录,发现儿子身高(Y,英寸)与父亲身高间(X,英寸)存在线性依存关系:=33.73+0.516 X 但不少身材高的父亲的儿子成年后身高比其父亲矮,不少身材矮的父亲的儿子成年后身高
4、比其父亲高。Galton F(英,18221911)将这种现象称之为子一代身高向人群平均身高的“回归”。,2023/3/22,医学统计学,9,Regression 释义,210=1024,2023/3/22,医学统计学,10,Francis Galton,Francis Galton 爵士(英,18221911)是达尔文(Charles Darwin)的表弟。他对统计学的主要贡献是提出“相关”与“回归”的概念,用统计方法对进化论中的变异进行研究,开创了生物统计学。,2023/3/22,医学统计学,11,Karl Pearson,Karl Pearson(英,18571936)是Francis
5、Galton 的得意门生,他开创了统计方法学。他对统计学的主要贡献:变异数据的处理、分布曲线的选配、卡方检验的提出、回归与相关的发展。,2023/3/22,医学统计学,12,天文学上的“回归”地球绕太阳公转,在公转的同时本身还自转,在本身自转的同时地球的假设轴心还来回摆动。由于地球轴心的来回摆动,太阳光垂直照射到地球上就有南、北两个极限位置(南、北纬23027),分别称南、北回归线,太阳光对赤道“回归”垂直照射到南、北回归线的时间分别为我国农历的冬至与夏至。,2023/3/22,医学统计学,13,日常生活中的“回归”现象 1岁姜二狗,7岁姜二狗同学,20岁小姜同志,30岁姜科长,40岁姜处长,
6、50岁姜局长,60岁姜老,70岁老姜,80岁姜二狗。,目前“回归”已成为表示变量之间数量依存关系的统计术语,并且衍生出“回归方程”、“回归系数”等统计学概念。,2023/3/22,医学统计学,14,例 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h),试估计尿肌酐含量(Y)对其年龄(X)的回归方程。,2023/3/22,医学统计学,15,年龄(岁)X,尿肌酐含量,hat,2023/3/22,医学统计学,16,各散点呈直线趋势但并非均在一条直线上根据原始数据拟合的直线方程与数理 上二元一次函数方程在内涵上有区别,称为直线回归方程。,2023/3/22,医学统计学,17,二、直线回
7、归方程的求法,2023/3/22,医学统计学,18,CASIO fx-3600PV计算器计算a、b与r,步骤 键 盘 说 明 1 MODE 2 进入线性回归模式 LR 2 SHIFT KAC 清除以前储存数据 3 13 XDYD 3.54 DATA 数据输入 11 XDYD 3.01 DATA 9 XDYD 3.09 DATA 4 SHIFT r 显示相关系数 0.8818 5 SHIFT a 显示截距 1.6617 6 SHIFT b 显示回归系数 0.1392 SHIFT DEL 删除输错的一对数据,2023/3/22,医学统计学,20,年龄(岁)X,尿肌酐含量,Y,(mmol/24h),
8、2023/3/22,医学统计学,21,b 的意义,斜率(slope),年龄每增加1岁,尿肌酐含量平均增加0.1392(mmol/24h),b的单位为(Y的单位/X的单位),2023/3/22,医学统计学,22,a 截距(intercept,constant)X=0 时,Y的估计值a的单位与Y值相同当X可能取0时,a才有实际意义。,a 的意义,2023/3/22,医学统计学,23,回归直线的有关性质,直线通过均点 各点到该回归线纵向距离平方和较到其它任何直线者为小。,对于X各个取值,相应Y的总体均数,2023/3/22,医学统计学,24,X,Y,2023/3/22,医学统计学,25,三、直线回归
9、方程中的统计推断,(一)回归方程的假设检验,1.方差分析(1)建立检验假设并确定检验水准 H0:=0 H1:0=0.05,的分解,重点,2023/3/22,医学统计学,26,因变量Y总变异 的分解,X,Y,Y,2023/3/22,医学统计学,27,SS总=SS回+SS残,2023/3/22,医学统计学,28,未引进回归时的总变异:(sum of squares of deviation from mean)引进回归以后的剩余变异:(sum of squares of residuals)回归的贡献,回归平方和:(sum of squares due to regression),Y的总变异分解
10、,2023/3/22,医学统计学,29,(3)计算检验统计量F值,SS总=lYY=1.0462 SS回=blXY=l2XY/lXX=5.8452/42=0.8134SS残=SS总SS回=1.04620.8134=0.2328,v总=v回+v剩v总=n1,v回=1,v残=n2,2023/3/22,医学统计学,30,F0.01(1,6)=13.74,2023/3/22,医学统计学,31,2.t 检验,回归的剩余标准差,2023/3/22,医学统计学,32,(2)计算检验统计量 t 值,(1)建立检验假设并确定检验水准,(3)确定P值下结论,2023/3/22,医学统计学,33,(二)总体回归系数的
11、可信区间,此区间不包括=0,结论为b有统计学意义。,2023/3/22,医学统计学,34,SPSS结果,2023/3/22,医学统计学,35,(三)利用回归方程进行估计与预测,1.总体均数 的可信区间,:给定X后对应Y的总体均数,给定X后对应Y的样本均数,2023/3/22,医学统计学,36,2.个体Y值的容许区间,给定X后对应个体Y值波动范围,2023/3/22,医学统计学,37,X Y(体重,kg)(体表面积,103cm2)11.0 5.28311.8 5.29912.0 5.35812.3 5.29213.15.60213.7 6.01414.4 5.83014.9 6.10215.2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 变量 回归 相关 课件
链接地址:https://www.31ppt.com/p-3807222.html