生物统计学课件回归与相关分析.ppt
《生物统计学课件回归与相关分析.ppt》由会员分享,可在线阅读,更多相关《生物统计学课件回归与相关分析.ppt(24页珍藏版)》请在三一办公上搜索。
1、第七章 回归与相关分析,(针对两个变量的相互关系进行分析)第一节 直线回归第二节 直线相关第三节 多项式回归第四节 协方差分析*,第七章要点提示,本章对两个变量的相互关系进行分析,是多元统计分析的基石。学习时首先要求区分“回归”术语古今含义的不同之处,充分认识一元线性回归与相关分析的基础地位;熟悉回归关系与相关关系的本质区别及两者在统计表述方法上的联系(如r与b在数学意义上的统一性)和各自的侧重点;重点掌握直线回归与相关分析的显著性检验方法和双变量回归模型的协方差分析技术,以便将统计控制手段与试验控制手段一起综合运用到试验设计和统计分析中去。涉及教材内容:第八章,第九章第四节,第十章。作业布置
2、:教材第九章一、二、三节内容自习;教材P1175 T4、T5、T6;P210 T4、T5。,第一节 直线回归,一、回归的含义“回归”原文为regression,该术语最先由英国的F.Galton于1886年左右研究人类身高遗传的规律时所作的“高尔顿解释”中使用,详情如右图所示:高尔顿对此所作的解释是:大自然有一种约束机制,使人类身高分布保持某种稳定形态而不作两极分化,也就是有回归于中心的作用,这个中心值即该种族身高在一定历史时期的平均值。现在就“回归”所作的定义是:如果两个变量X和Y,总是Y随着X的变化而变化,且这种变化关系不可逆,则称X和Y为回归关系。其中:X叫自变量dependent va
3、riable;Y叫因变量或依变量independent variable。,高:xg 71 72 g(69)64 a矮:xa 67 调查n 1074个家庭,统计结果:X 68英寸 69英寸得:X 1(1英寸2.54cm)但分组统计的结果却并非如此父母为高个子组时,g 721父母为矮个子组时,a 641 走向指回归的本意 走向指回归的今义,第一节 直线回归,二、建立直线回归方程 例7.1 在四川白鹅的生产性能研究中,得到如下一组n=12(只)关于雏鹅重(g)与70日龄重(10g)的关系的数据,其结果如下表,试予分析。解 描散点图 本例已知雏鹅70日龄重随雏鹅重的变化而变化,且不可逆;又据散点图反
4、映的趋势来看,在80120g的重量范围,70日龄重随雏鹅重呈上升的线性变化关系。故可假定直线回归方程为:y a bx 读作“Y依直线回归”,70 90 110 130,y a bx,340300260220,第一节 直线回归,数据整理 由原始数据算出一级数据6个:X1182 Y32650 XY3252610X 2118112 Y 2896696700 n12 再由一级数据算出二级数据5个:SSX X 2(X)2/n1685.00SSY Y 2(Y)2/n 831491.67SP XY X Y/n 36585.00 XX/n 98.5 Y/n 2720.8333计算三级数据 b SP/SSX 2
5、1.7122 365851685 a bX582.1816 2720.8333 21.712298.5 得所求直线回归方程为:y 582.1816+21.7122 x,80 100 120,y a bx,320280240200,80,120,第一节 直线回归,三、直线回归关系的显著性检验 将a bx 代入Y a bx 得:y b(xx)及 y b(xx)于是由因变量离均差的两个线性分量:(Y)2(Yy)(y)2 可推导出因变量总SS的如下分解公式:(Y)2(Yy)2(y)2 简写成:SSY SSR SSr分别叫“离回归平方和”与“回归平方和”其计算公式及本例分解结果:SSRSP2/SSX36
6、5852/1685 794339.6 SSrSSY SSR 37152.07 83149167 794339.6故 F MSR/MSr 213.81*(F0.01,1,1010.04)(794339.6 1)/(37152.0710)表明双变量直线回归关系极显著,所得方程 y 582.1816+21.7122 x可用于预测。,也可对回归系数进行t-test来证实。只是要利用分子df1时,Ft2的关系推导出回归系数的标准误SbSe/SSX其中,Se2SSr/dfr3715.21 37152.0710 于是t-test的步骤如下:H0:=0(为回归系数b的真值)Sb Se2/SSX 1.4849
7、3715.211685 t(b)Sb 21.71221.484914.62(3)按自由度dfr 10 查得两尾 t0.01=3.169(4)推断:t t0.01 H0 不成立。可见t-test与F-test的效果完全一致。若显著性检验结果不显著,则三选一:Y与X没有回归关系;Y与X有回归关系,但不是直线回归;Y与X有回归关系,但不是简单回归,而是多元回归。,第二节 直线相关,一、相关的含义 如果两个变量X和Y,总是X和Y 相互制约、平行变化,则称X和Y为相关关系。此时,X和Y没有严格意义上的自变量和因变量之分,既可以说Y随着X的变化而变化,也可以讲X随着Y 的变化而变化。即不存在谁决定谁或谁依
8、赖谁的问题。如人或动物的胸围和体重,作物的生物产量和经济产量,树干的胸径与材积等。可见,相关关系以双向、平行为特征。但相关关系如果仅从数学角度看,和回归关系是统一的,因为其双变量变化规律如果是线性关系的话,也可以由根据“最小二乘法”原理得出的直线方程来表述,所以有些文献不区分回归关系和相关关系,将二者笼统地称之“回归”或者“相关”。从统计上讲,相关分析的侧重点和回归分析不完全一样。,二、相关系数 前已述及,具有线性回归关系的双变量中,Y变量的总变异量分解为:SSY SSr SSR 对于具有线性相关关系的双变量,Y变量的总平方和也可以分解成同样的两个分量,只是分别改称为“非相关平方和”与“相关平
9、方和”于是有:r SSR/SSY SP/SSX SSY“r”叫相关系数,其绝对值越大,SSR所占的比重就越大,在散点图上就表现为各散点越靠近直线;反之,即SSr所占的比重越大,各散点越远离直线。并且有以下性质:r 的正负和b一样取决于SP的正负;r0,正相关;r0,负相关 r1,1或r(1,1);决定系数 r 2bb 或 r bb,第二节 直线相关,三、相关分析举例 例7.2 为研究绵羊胸围(cm)和体重(kg)的相互关系,调查了10只绵羊胸围和体重的对应观察值X和Y,所得结果如下表,试予分析。解 描散点图 本例已知绵羊胸围(X)和体重(Y)为相关关系,散点图也显示两者的变化规律呈线性正相关,
10、SP0。故可假定直线相关方程为:y a bx 或 x a b y后一个方程也可写成:y a b x,y a bx,807468625650,第二节 直线相关,数据整理 由原始数据算出一级数据6个:X720 Y680 XY49123X 251904 Y 246818 n10 再由一级数据算出二级数据5个:SSX X 2(X)2/n64SSY Y 2(Y)2/n 578SP XY X Y/n 163 XX/n 72 Y/n 68计算三级数据 b SP/SSX 16364 2.547 a 72 2.54768 115.4b SP/SSY 163578 0.282 a 68 0.282 72 52.8
11、2 即所求相关方程可以有两个(如右图)r SP/SSX SSY 0.8475r 2bb2.547 0.2820.7192,y 52.82 0.282 x,767268,40 50 60 70 80,80706050,y 2.547x115.4,第二节 直线相关,、直线相关关系的显著性检验 和直线回归关系的显著性检验原理一样,直线相关关系的双变量也可导出Y变量总SS的如下分解公式:(Y)2(Yy)2(y)2 简写成:SSY SSR SSr分别叫“非相关平方和”与“相关平方和”其计算公式引用三级数据后简化为:SSY(1 r 2)SSY r 2 SSY 或者 SSX(1 r 2)SSX r 2 SS
12、X SSR r 2 SSY0.7182 578 415 SSr(1 r 2)SSY 0.2818 578 163 故 F MSR/MSr 20.4*(F0.01,1,811.26)(n 2)r 2/(1 r 2)表明双变量直线相关关系极其显著,所得两个直线相关方程都可用于预测。,也可对回归系数进行t-test来证实。只是要利用df(分子)1时,Ft2的关系推导出相关系数的标准误:Sr(1 r 2)/(n 2)并且Se2SSr/dfr 1638 20.4于是t-test的步骤如下:H0:=0(为相关系数 r 的真值)Sr 0.28188 0.1877 t(r)Sr0.84750.18774.51
13、6(3)按自由度dfr 8 查得两尾 t0.01=3.355(4)推断:t t0.01 H0 不成立。可见t-test与F-test的效果完全一致。若显著性检验结果不显著,则三选一:Y与X没有相关关系;Y与X有相关关系,但不是直线相关;Y与X有相关关系,但不是简单相关,而是复相关。,第二节 直线相关,四、回归与相关关系的统一性 既然相关关系和回归关系的显著性检验原理一样,那么,不论回归还是相关关系,其检验都可用“相关系数”r 进一步简化如下:即由 t2 F(n 2)r 2/(1 r 2)解得:r t2/(n 2 t2)于是利用这一关系将各个自由度下的 t 临界值t0.05和 t0.01换算出相
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 课件 回归 相关 分析
链接地址:https://www.31ppt.com/p-6317042.html