欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    研究生统计学讲义第11讲相关与回归.ppt

    • 资源ID:5806374       资源大小:406KB        全文页数:74页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    研究生统计学讲义第11讲相关与回归.ppt

    第六章 一元线性相关与回归,变量间的关系有确定性关系(函数关系)和随机性关系。函数关系是指对于一个变量的每个可能取值,另外的变量都有完全确定的值与之对应。随机性关系是指变量间的关系以非确定性形式出现的情况。,例如儿童身高与体重的关系;随着身高的增长,体重也增加,一般说,身高高的儿童,体重也重一些,两者之间确实存在着某种关系,但显然不是函数关系,因为身高相同的人体重也有的重,有的轻,身高和体重之间的客观联系存在于随机背景中,不能说某一身高的儿童,其体重一定是多少。,第一节 直线相关,相关分析用于测量观察到的任何一对变量之间的联合强度,我们主要关心两个变量是否互相依赖或共同变化这里我们没有把变量表示成为其它函数,像回归分析一样并未暗示Y依赖于X X和Y二者测量有误差并且我们希望估计这些变量共同变化的程度见图,相关与回归分析的种类很多,按变量个数划分,有一个 x 一个 y 的简单相关与回归分析,多个 x 和一个 y 的多元相关与回归分析,以及多个 x 多个 y的典型相关。本章介绍最简单的两变量间的直线相关与回归,称为一元线性相关与回归,1.散点图,图7.1 a)图说明X 和Y 之间具有正相关b)图说明 X 和 Y 之间具有负相关.c)图和d)图说明 X 和 Y 之间没有相关关系,双变量相关分析步骤是先作原始数据的散点图,根据散点图的提示再作恰当分析,如两变量有直线趋势,则作直线相关分析。从散点图可初步看出变量分布非正态时,应考虑作等级相关而不宜作积矩相关。并非任何有联系的两个变量都是直线联系。例如,血压很高的人和很低的人死亡率均较高,而中等血压的人死亡率较低,死亡率和血压之间有如图7-1(h)所示曲线关系,不适合作直线相关分析。,2.积矩相关系数:Pearson积差相关系数,简称相关系数。表示两个变量间直线关系密切程度和方向的统计指标。,用 r 表示,总体相关系数用表示,r 是的点估计。考虑 X 和 Y 的标准正态离差:,和,把相应的离差同时相乘并求和时,得到一个联合指标:,这个指标具有下面的性质:,1如果大的X 值与大的Y 值相联系,小的X 值与小的Y 值相联系,那么 和 二者符号相同,在公式中它们的乘积为正 X 和 Y 之间有正相关,2如果大的X 值与小的Y 值相联系,小的X 值与大的Y 值相联系,那么 和 二者符号相反,在公式里符号为负.于是我们就说这种情形里 X 和 Y 之间有负相关,如果我们用 n1 除公式,就得到一个新指标,用 r 表示,首先它满足两个条件且范围从1到+1(我们将在随后验证).有,即 r 是 X 和 Y 的修正积差除以 X 和 Y 的修正平方和乘积的平方根注意 r 是参数的估计值,参数定义为:,希腊字母(“rho”)表示变量 X 和 Y 之间真实的总体关系,相关系数无单位,取值范围为1r1,r 的符号表示相关方向,r0称为正相关,r0称为负相关。r的绝对值表示两个变量间直线关系的密切程度,r的绝对值为1表示完全相关。生物界由于影响因素众多,很少完全相关,r 值多界于-1与1之间.,积差相关系数 r 只适用于双变量正态分布资料,否则应先作变量变换,使之正态化,然后用变换后的数值计算积差相关系数。,二、积矩相关系数的假设检验,=0表示总体中两变量 x 和 y 无直线相关关系。(注意:如果 x 和 y 独立,即 x 和 y 无相关关系,则=0但=0时,并不能说明x 与 y 一定无相关关系).因是一个客观存在的理论值,一般无法获得,在实际问题中,常通过用 r 来推断两变量 x 和 y 有无直线相关关系。当由r0时,因为存在抽样误差,不能认为0,所以,判断x 和y 是否线性相关,需要检验r是否来自0的总体,称为相关系数的假设检验。,从服从双变量正态分布的X,Y 和0的总体中每次随机抽取样本含量相同的样本,r 随样本的不同而不同,是一个随机变量,其分布接近正态分布时,r 的标准差为Sr:,服从自由度df=n2 的 t 分布,所以,可用来检验样本相关系数 r 是否来自0 的总体.,Ha:0,H0:=0,也可直接用 r 作检验统计量,用自由度dfn-2,查附表16,相关系数 r 界值表,得出 r 界值,若rr,(df),则P,按检验水准不能拒绝H0,从而认为x、y之间无直线相关关系。,例6.1 测得某地10名三岁儿童的体重与体表面积如下,试计算样本相关系数r,并检验其是否来自0的总体,体重x(kg):11.0 11.8 12.0 12.3 13.1 13.7 14.4 14.9 15.2 16.0,面积y(10-1m2):5.283 5.299 5.358 5.602 5.292 6.014 5.830 6.102 6.075 6.411,H0:总体相关系数0,体重与体表面积间无直线相关关系;H1:0。0.05。,在直角坐标系上画出散点图,有直线趋势,故进行直线相关分析.使用程序型计算器时,在线性回归(LR)工作方式下,成对地输入x 与y 后,可直接输出r=0.9568。无程序型计算器和计算机时,用一般计算器可求出n对x与y 的乘积之和xy=775.6606,=13.440,=5.7272,x、y 的样本标准差Sx=1.6635、Sy=0.4136,按公式计算相关系数 r:,=(775.6606-1013.4405.7272)/(10-1)1.66350.4136=5.92492/6.1922=0.9568。,以r0.9572作统计量,用自由度df10-28,查附表16得界值r0.01(8)0.765,统计量r r0.01,P0.01,按0.05水准拒绝H0,接受H1,可以认为某地三岁儿童体重(kg)与体表面积(101m2)呈正向直线相关。,使用SPSS11.5统计软件,(3)进行直线相关分析,Cross-product deviations and covarlances;,输出结果:体重与体表面积的Pearson相关系数r=0.923,双侧 P 值=0.000,可认为直线相关有统计学意义。,三、直线相关分析应注意的问题,1判断两个变量间是否存在相关关系,不能仅根据样本相关关系的大小下结论,必须进行假设检验。2正相关或负相关并不一定表示一个变量的改变是引起另一个变量变化的原因,可能同受另一个因素的影响。因此,事物间有相关关系,不一定是因果关系;但如果两事物之间存在因果关系,则两者必然是相关的。3当样本含量不大时(如n30时),在相关系数检验有显著性的情况下,也不要轻易凭 r 值的大小去判断两变量间相关关系的密切程度;一般来说,当样本含量较大时:,0.7r 0.4(中度相关)或r0.7(高度相关),都有作回归分析的必要。0.4r0.2(低度相关),是否有作回归分析的必要,有不同的看法。4相关分析中对变量的选择及统计结果的解释要结合专业背景。不要把P值大小误解为相关程度,样本相关系数有统计学意义并不一定反映相关就很密切,需要考虑专业意义或进一步结合决定系数来作实际意义解释。牢记:统计上显著性水平的高低,不能代表实际相关水平的高低。,第三节 直线回归,一、直线回归的模型-简单线性回归,在线性回归里,一个变量的变化(因变量Y)是由于另一个变量(自变量X)的变化所致明确地,我们将寻找直线或寻找由X的变化而引起Y的线性变化回归分析通常所处的位置是已经控制了变量X并且基本上能够准确测量它当变量之间有曲线关系的时候,也就是指数,抛物线或多项式,但我们限定所考虑的是线性情形我们考虑简单线性回归,分析目标是描述两变量之间的函数关系,这里 X 是自变量而 Y 是应变量.假定 X 可测量而没有误差,而且是可以重复测量的因为Y 是应变量,它是自由多变的.当我们把数据画图时,如果数据表现出有线性关系,希望了解这个线性方程性质的真实参数,二、直线回归方程的建立与检验,回归分析的内容包括三个方面:(1)建立回归方程,是根据样本数据判定回归方程的类型,建立回归方程的估计式。(2)检验回归方程,是判断建立的回归方程能否使用。(3)使用回归方程,是在样本数据范围内,由自变量数据推算因变量的估计值(称预测),或由因变量数据推算自变量的估计值(称控制)。,1直线回归方程的建立,补充例题:一名学生想要确定温度与中国林蛙心律之间的关系,调节温度范围从2到18,纪录每个温度下的心律.数据如下表所示,编号 1 2 3 4 5 6 7 8 9,对两变量之间的关系怎样进行处理描述呢?显然两个变量有函数依赖随着温度的增加,心律也就增加.这里温度由学生控制,且在使用不同蛙的其它实验里能够准确测得相同值(见下图)温度是自变量或“预报”变量.心律由温度确定,因此它是应变量或“反应”变量.以不同温度下心律预测为目标,回归分析能够正确地分析这些资料,X(温度)2 4 6 8 10 12 14 16 18,Y(心律)5 11 11 14 22 23 32 29 32,图6.5 温度和心律数据用表示,这些数据接近所显示的直线,在相同温度下,如果重复7次实验,数据是相似的,但是并非都一样(见空心).在实验运行中,因为研究者控制了温度,所以这些点排列在垂线上,线性模型的假定1.X 固定且测量无误差2.对所给的X,变量 Y 的期望值(或平均值)用一个线性函数来描述:E(Y)=Y|X=+X,这里的和是实常数,且0 Y的期望值取决于X 和参数和.注意这些和与前面使用的型错误和型错误值不同.它们代表的是截矩 intercept 和斜率slope,分别表示 Y 和 X 之间的线性关系,3.对任何固定的X值,能够测量相应的变量Y的一些值.(例如固定一个温度,测量一些蛙的心律值)然而,我们假定对任何的X i,Y i 彼此独立而且服从正态分布,(见图10.1垂直排列的数据)能够把每一个Yi 值表示为,Y i=+X i+i 或,Y i 被描述为期望值(+X i)加上一个来自于期望值的偏差i 我们假定i 是具有均值为 0 的正态分布的误差项,4对不同的X 值,假定 Y 的分布的方差相等.统计学家说它们是等方差!为了描述 Y 和X 之间的实验回归关系,需要执行下列步骤:,1画散点图借以发现明显存在的线性关系2为数据集寻找一条最合适的直线,3检验这条拟合的直线是否能解释 Y 的变化的重要部分,也就是检验线性关系是否真实,作一个初步的散点图以获得两变量之间是否有存在任何联系的印象,如果是这样,两变量或许可能有联系下面 a)图表示在 X 和 Y 之间不存在有意义的关系大的Y值与既大又小的两个 X 值相联系图b),c)和d)表示在变量之间有关系,但不是直线关系如果它们能够通过数学函数转换为直线图形,回归分析就能够对转换的数据进行描述,图e)显示 Y 和 X 之间有负的线性关系(即 X 增加时,Y减少)而数据点不一定恰好在直线上,它们给我们一个线性的印象图10.3 f)表示变量之间有很强的正线性关系(即 X 增加,Y 增加),与直线偏差小线性回归只适合最后两种情形,a)表示在 X 和 Y 之间不存在有意义的关系,b),c)和d)表示在变量之间有关系,但不是直线关系,e)显示 Y 和 X 之间有负的线性关系,f)表示变量之间有很强的正线性关系,图6.6 数据,最佳直线拟合一旦确定适合作回归分析,就是要确定哪一条直线最能拟合数据.在下图拟合了a,b,c三条直线.很明显,c 拟合数据比a 和b 更好.这些数据有正的倾向:随X的增加,Y也增加.而直线 b 完全不能够反映 Y 和 X 之间的关系,而且这条线暗指不存在关系,图6.7 如何确定哪条线最好拟合这些数据呢?,在图6.8 里,考虑相同数据和两条直线c与d这个时候两条直线都顺着直线的正向为讨论这些直线哪条最能拟合数据或者是否有一些其它直线能更好地拟合需要某些我们能够判断其拟合的准则为了产生最满意的直线,下面我们制定这个准则和方法,回归的目的是预测 Y 的值开始瞬间,忽略变量 X,按照前面单样本分析进行思考Y的预测值将是E(Y)=Y,通过使用样本平均值 进行估计该直线有方程.见图7.9,我们使用记号(念作“Y hat”)而不是用Y去表示它的预测值,预测值不是精确值或观察值直线 的斜率为0,即它平行于x 轴作为,它意味着Y 和X 之间没有关系,因为Y的值不依赖(随着变化的)X 值,图6.9 对数据拟合,然而在下面,我们认为Y的值不依赖 X 的取值,而且我们能够度量 Y 的精确值Yi 和 Y 的预测值 之间的差值从每一数据点向直线 画一节垂线任何一段的长度都是见图7.10,如果对这些离差平方求和,有,图6.10 从数据点向直线画垂线,Y 的总离差平方和=,现在画一条斜线,去拟合数据再从每一个,数据点向斜线画垂线段,如果我们对这个离差求,平方和,就得到:,比从图7.10计算,要小,因线段短些.画出“拟合”数据直线后,这个剩余变化被认为是系统残差或无法解释的变化,图7.11,最佳直线是这样的一条直线,它的截矩a 和斜率 b 同时使这个残差减至最小与第 8 章一样,我们能划分平方和以确定残差数量如图7.12,每一个 Yi 都能够表示为,移项得,(7.15),图7.12,对公式7.15两边平方并且求和,我们得到,公式7.15 总的平方和是,总平方和=回归平方和+残差平方和,SS总=SS回+SSE,使 SS回 达到最大值,而使 SSE 达到最小值,要使SSE达到最小值,就要使得图10.8里作出的垂线段尽可能地短,拟合直线:,是样本回归方程,用来估计前面给出的参数关系:Y|X=+X这里的 a 是真实截矩的估计值,而 b 是真实斜率的估计值在公式10.1里,因为这条直线使误差平方和达到最小,它就是众所周知的,由上式,对 a 作代换得到,它能表示为(见P109公式7.11)截矩的最优估计:,最小二乘回归直线,要得到使 SSE 取得最小值的斜率b,需要最小二乘法技巧最小二乘回归方程是,斜率 b 由最小二乘回归法确定:,作为斜率b 的方程离差的基本计算是解方程7.11然而,斜率 b 是由最小二乘法来确定,是修正的交叉积 lXY 除以修正的lXX.值得重复的是,利用公式7.14,这个方程对一组线性数据集会产生最佳斜率,产生的误差平方项是最小的,而产生的回归平方和是最大的,公式7.14,如果公式7.14给出的是最优拟合回归方程,我们需要检验方程的统计显著性.要明白为什么,考虑图7.13里的数据,因为用箭头指出了数据点,所以能够用一条斜率为正的回归直线来拟合它们.这条回归直线能证明X 和Y 之间有真实的线性关系吗?或许不是因为方程有意义就必须解释由X 的改变而引起Y 的主要变异,正的斜率能够象征这组数据吗?变量X 和Y 之间有线性关系吗?,图6.13,SS总=SS回+SSE,因为,所以,2.直线回归中变异的分析,公式6.16 总的平方和是,由回归引起的平方和是:,残差的平方和是:,=SS总SS回=SS总b*lXY,SS回是由 x 不同引起的线性效应,它反应在y 的总变异中,由于x 与y 的直线关系而使 y 变异减小的部分,为y 的总变异SS总lyy中可以用自变量 x 来解释的变异.SS回越大,说明回归效果越好。,SS剩余表示散点图中各实测点关于回归直线的偏离情况,SS剩越小,说明各实测点离回归直线越接近,直线回归的误差越小,反映除自变量x对因变量y线性影响之外的一切因素对y变异的作用,也就是在总平方和中,无法用自变量解释的作用,即随机误差作用。SS剩 的大小与自由度df剩 有关,因为 中的 a 和 b 都是由样本值算得的,所以df剩n-2。,X 和 Y 的样本相关系数 r 及 y的方差 已知时:,SS剩(y)2(n-1)(1-r2),df剩n-2。,3.剩余标准差与决定系数 剩余标准差和决定系数都是描述回归方程拟合效果的指标。,(1)剩余标准差(standard deviation about residual)剩余标准差表示各实测值y关于回归直线 纵向距离的离散程度。因=a+bx 系由x推断y,所以其剩余标准差记为Syx:.,(7.20),(2)决定系数(determining coefficient,R2)回归平方和在总平方和中所占的比例称为决定系数:,在直线回归中,将SS回=代入式(7.25)得:,当SS总 不变时,SS回的大小决定 r 的大小.SS回 越大,则 r 越接近1。如 r=0.2,n=100,则,拒绝H0,认为变量之间存在相关关系.但是,r2=0.04,表示SS回仅占SS总 的4%.两变量之间相关程度不大。,如下图中SS剩 相同时,但相关系数相差很大,r 随 b 的增大而增大,所以 r 的大小与SS剩 与 b 有关,r 不能用来作为回归估计精度的指标。,对R2的要求随研究领域而不同.在一些临床研究中,因病人之间的个体差异较大,R2 达到0.7 认为回归效果不错.而在一些高精度的医药实验室研究中,要求R2 较大,例如,标准线的配制要求 R2 在0.95以上,回归的显著性检验是ANOVA表.假设 H0:Y的主要变化不能用线性模型解释,即=0 H1:Y的主要变化能用线性模型解释,即0 期望值列在表7.1里,这里无需证明,只是为假设检验提供直接值,4直线回归方程的检验(1)直线回归方程的方差分析 对直线回归方程作方差分析的目的是检验所建立的直线回归方程是否有统计学意义。,假设H0为真:,表6.1 回归分析的方差分析表,方差来源 SS DF MS E(MS)F c.v.,回归 SSR 1 MSR,误差 SSE n-2 MSE,见附表7,总 SS总 n-1,假设H1为真:,2lXX 永远为正或 0(在H0下为0而在H 1下为正),回到前例,对中国林蛙(哈士蟆)心律和温度之间的关系进行回归分析我们开初使用数据散点图(见图6.14),它表示心律和温度之间存在明显的线性关系,图6.14 中国林蛙心律和温度的散点图,下一步对回归分析进行初步计算,n=9 X=90 Y=179 X2=1140 Y2=4365 XY=2316现在我们能够计算回归系数或斜率,在图6.14 里数据的最优二乘拟合方程是,为画这条直线,在研究的范围值内利用两点温度求两点值,我们使用X=5和X=15:,=19.9+1.78(5-10.0)=11.0,=19.9+1.78(15-10.0)=28.8,图6.15 最小二乘回归线通过两点(5,)和(15,)延长,坐标是由回归方程确定的,作出回归方程后,我们需要检验它是否能够解释 Y 的主要变化假设 H0:=0 Ha:0利用最初的计算结果,我们有,SSR=b2lXX=(1.78)2(240)=760.42,SSE=SS 总SSR=804.89760.42=44.47,方差来源 SS DF MS F c.v.,回归 760.42 1 760.42 119.75 5.59,误差 44.47 7 6.35,总 804.89 8,因为119.755.59,我们确信心律的主要变化能通过温度的回归进行解释,(2)回归系数的假设检验:,根据样本回归系数blxy/lxx,由正态分布性质可知:样本回归系数 b 是一个正态变量;b 的总体均数为.b的方差为:,估计值是:,H0:=0 Ha:0,可以检验样本回归系数 b 是否来自=0的总体。,(3)直线回归方程、回归系数、相关系数假设检验的关系,=F,同样可推导出 tr2=tb2=F,因为线性回归中只有一个自变量,所以,对同一资料,回归系数的假设检验、相关系数的假设检验、回归方程的方差分析都是一致的,当相关系数有统计学意义时,回归系数与回归方程也一定有意义,反之亦然.由于相关系数的计算及检验比较方便,故常用相关系数的假设检验代替回归系数、回归方程的假设检验。,5.回归系数的可信区间 由式(7.25),按 t 分布的规律,推导出回归系数的(1)可信区间计算公式(缩写)为:,例7.3 由图7-4可见例7.1资料三岁儿童体重与体表面积资料的散点图有直线趋势,故适于作回归直线分析。,第四节 直线回归与相关的区别和联系,1区别(1)在资料要求上,回归要求因变量 y 服从正态分布;x是可以精确测量和严格控制的变量,一般称为 I 型回归,相关要求两个变量 x、y 都服从正态分布,称为双变量正态分布.这种资料若进行回归分析,称为II型回归,(1)已知x、y 的标准差Sx、Sy时,相关系数r 与回归系数 b 可以相互推算:r=b sx/sy,b=r sy/sx(7.31),同一组数据的r与b的正负号是一致的。r为正号,说明两变量间的相互关系是同向变化的;b为正,说明自变量 x 增(减)一个单位,因变量y 平均增(减)b个单位。,(2)r 和 b 的假设检验是等价的。对同一样本,二者假设检验的t值相等。由于r的假设检验可直接查表,较为方便,故在实际应用中常以前者代替后者。,(3)回归强度和相关强度可以互相解释。,第五节 回归分析的应用,1.描述变量间的数量变化关系,2.预测(x=x0时,求y0 估计值的容许区间),3.控制(y=y0时,求x0估计值的容许区间),(1)II型回归资料;(2)I 型回归资料时,,4.估计(x=x0时,求的可信区间),y0的1-预测区间,的1-预测区间,例6.8 用显微定量法测定生产二陈丸的甘草浓度(x)与镜检晶纤维的数目(y),得表7-5资料试预测甘草浓度x0=4mg/mL时,晶纤维数目总体均数90%可信区间,使用SPSS 统计软件:,第六节 曲线回归,1曲线回归的意义 2曲线拟合,第六节 曲线回归,1曲线回归的意义直线回归可分析呈直线变化趋势的变量之间的数量依存关系,但在实践中,很多变量之间并不是直线关系,而呈曲线关系,如服药后的血药浓度与时间的关系;毒物剂量与毒性反应的关系;年龄与血红蛋白平均浓度的关系;细菌繁殖与培养时间的关系;等等,都不是简单的直线关系,即使在不太大的范围内,仍不能以直代曲。对呈曲线关系的资料,需要用曲线回归(curve linear regression)的方法进行分析,根据样本资料找出能够反映变量间关系的曲线回归方程。,2曲线拟合求曲线回归方程的过程或方法叫曲线拟合(curve fitting)。进行曲线回归分析的要点是选择合适的曲线类型。一般,需要采用几种最可能的曲线类型分别拟合同一个资料,先对每种拟合结果进行拟合优度检验,然后对它们进行拟合优度比较。从而挑选出拟合得最好的曲线模型。如使用统计软件,一组资料可同时拟合多种模型,可在R Square(决定系数)接近1和标准估计误差sy较小者中筛选。如果进行预测,则在上述基础上,对拟合度较好(一般认为,一组资料同时适用的模型不只一条)的模型进行回代,依预测值评判模型的适用程度,其条件是预测值(尤其是外推值)尽可能接近实际情况,然后再以“最适合”的模型评价结果,若同时满足上述条件的模型有数条,则以变量数最小,结构最简单的模型为首选。,例6.7 研究板蓝根注射液含量的稳定性,在pH=6.28,温度为78下,测得保温时间与含量破坏百分比的结果如下,作保温时间t与含量破坏百分比p间的曲线拟合。,使用SPSS统计软件,故S曲线拟合有统计学意义。S模型的决定系数R Square=0.997,S曲线方程为:,P=exp(b0+b1/t)=exp(),第七节 半数致死量LD50,一、LD50的意义,1.最小致死量和绝对致死量:在进行毒力实验观察时,由于动物的个体差异,每个动物对毒物的反应不尽相同。药物剂量较小时,动物不死,当剂量逐渐增加,动物开始死亡,能使一只动物死亡的剂量,称为最小致死剂量(minimum lethal dose);剂量增加到一定程度,动物全部死亡,称为绝对致死量(lethal dose)。,2.半数致死量LD50 使一组试验动物死亡一半的药物剂量称为半数致死量LD50(Lethal dose 50%),以剂量作横轴,死亡率作纵轴作图,即得死亡率P=F(x)关于剂量 D 的分布函数图,称为剂量-死亡率曲线。,二、半数致死量LD50的实验设计要求,1.给药剂量的确定:参考有关资料或作预备试验,找出动物全部不死或全部死亡的剂量范围,并加以分组(一般58组)。要求50%死亡率的上下各有一半组数。剂量分组一般按等比级数排列,对数转换剂量间等距。相邻高低剂量之比一般为1:0.8左右,或按,的比值作等比级数分组,从最低量组开始乘以比值,即得相邻组的剂量。,注意:剂量间距的大小与药物剂量反应关系直线的斜率有关,斜率较大时,间距可小一些。,2.动物实验选择与分组:根据实验的性质合理地选择动物的种属。,3.设置的最小剂量组最好有12只动物死亡,最大剂量组动物不要全部死亡,中间剂量的反应率应接近50%.4.给药途径:要求采用两种给药途径,其中必有一种与临床采用的相同。溶于水的药物尚须测定静脉注射的LD50,亦可采用腹腔注射,腹腔注射的LD50与静脉注射的LD50相似。口服制剂无法通过注射给药途径,只用胃肠给药。5.试验周期和观察指标:给药后至少观察7天。观察期间应逐日记录动物的毒性反应情况和死亡动物分布,三、概率单位法计算LD50(Bliss 法),把剂量 D 转换为对数剂量 lgD,(lgD,P)散点图呈对称 S 形,对称中心为死亡率为50%的点,因为 lgD 近似服从N(,2),把死亡率 P 视为分布函数F(lgD)的近似值,为避免出现负值,Bliss 提议加5,称 x为概率单位Probit,lgD=+(x-5)=(-5)+x,可查百分率与概率单位转换表,受个体差异影响大的P=0或100数据应删除,用(x,lgD)数据建回归方程,当P=50%时概率单位x0=5,记lgLD50 点估计值,LD50 点估计,lgLD50 的1预测区间,(y1,y2),LD50 的1预测区间,例6.8 不同剂量厚朴注射液时小白鼠死亡情况如表6-1.求LD50 及其95%预测区间,10 10 10 10,如使用SPSS11.5统计软件,以剂量D、鼠数、死亡数建立如图8-2的数据文件例5.11.sav以后,操作分两步:,(1)先将死亡率转换成概率单位,(2)用x与剂量作曲线回归,步骤同例7.9,即:,治疗指数(therapeutic index,TL)是将致死量与有效量联系起来综合评价一个药物的毒性与剂量大小关系的指标。治疗指数为半数致死量LD50与半数效量ED50的比值:治疗指数TL=LD50/ED50(8.5)治疗指数大,表示毒性低,用药比较安全。如果有效量与中毒量非常接近,则治疗指数比较小。,第八节 联合用药效应判断、疗效综合评价一、联合用药的效应判断,本节就两种作用方向相同的药物或因素联合应用效应,介绍联合用药效应判断的基本概念与两种常用计算方法。,四、LD50与治疗指数,1.协同、叠加与拮抗关系 因为药物的剂量-效应关系不是直线关系而是曲线关系。在一定范围内药物剂量加大 l 倍,其效应不一定是原剂量效应的2 倍。所以,习惯上人们把“1+12”判为协同作用,“1+12”视为叠加效应,“1+12”看成拮抗作用,只能当是一种形象的说法而已,不能把它绝对化。有效的方法是用等效概念表达两药联合应用效应:用DA和DB分别表示A、B两药联合应用时各自的剂量;DA0和DB0分别表示与联合用药效应相等的单用A药和B药的剂量。两药联合应用的效应关系记为Q:,第九节 协方差分析,1.基本思想和应用条件:协方差分析(analysis of covariance)是把直线回归与方差分析结合起来的一种分析方法。常用于难以完全控制混杂因素的观察研究,例如,比较不同饲料的营养价值,以实验动物所增的体重为指标,必须考虑动物进食量对体重的影响,而动物进食量又难以控制完全相同,因而影响所增体重的比较,这时进食量就成为混杂因素,用协方差分析可消除混杂因素对分析指标的影响。协方差分析也用于可以控制影响因素的实验研究,以便更好地控制比较组间的随机误差,提高比较结果的精度。,协方差分析的基本思想:利用直线回归方程中回归系数 b 的统计意义是x 值每改变(增或减)一个单位,y 值平均改变一个单位,用总x 值的均数作标准,对y 值进行校正,而对每个y 值校正后的均数等于对 值的校正.根据这样的道理,协方差分析将混杂因素作协变量 x,找出各比较组的观察指标y 分别与x 之间的直线回归关系,用这种直线回归关系求得 x 值相等时的修正均数值(k 为比较组数):,然后用方差分析比较修正均数的差别,其实质就是从y 的总离均差平方和中扣除协变量x 对y 的回归平方和,对残差平方和作进一步的分解后再进行方差分析,更好地评价各种处理的效应。,应用协方差分析的条件:各观察数据相互独立,服从正态分布,各比较组方差齐性;各比较组的x 与y 之间直线回归系数 b 有统计学意义(即回归系数0);各比较组回归系数 b 之间差别无统计意义(各比较组总体直线回归系数i相等).协变量是连续变量,而不能是影响处理的变量.,协方差分析比较的是修正均数,H0为修正后的均数相等。按不同实验设计类型,相应有完全随机设计、配伍组(随机区组)设计、拉丁方设计及析因设计等类型的协方差分析,解决问题的基本思想是相同的.如果在多因素研究中有一个或多个因素(协变量)不能或难以控制,而这个或这些协变量对观察变量可能有影响,可用多元协方差分析方法(analysis of multiple covariance).,2.完全随机设计类型的协方差分析例6.10 降压宁的临床实验的资料如表6-7.为合理比较用药组与对照组对舒张压影响的差异,用治疗前的数值作协变量(控制变量),比较两组治疗后的舒张压差异.,第一步:用散点图初步判断两比较组的舒张压与用药前之间是否有直线趋势。,第二步:用交互项来检验两比较组总体直线回归系数是否相等,,第三步:比较修正均数是否相等,操作过程和界面同第二步,3.配伍组(随机区组)设计类型的协方差分析,小节当适宜作回归分析时,我们按照下面步骤来作1画散点图确定线性关系是否明显2使用最小二乘法计算回归方程3用方差分析检验回归方程的显著性4如果 H0 被拒绝,在所绘数据上标绘出方程5最后,在支持的线性关系内计算任何置信区间,

    注意事项

    本文(研究生统计学讲义第11讲相关与回归.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开