生物统计学:第10章 多元线性回归分析及一元非线性回归分析课件.ppt
《生物统计学:第10章 多元线性回归分析及一元非线性回归分析课件.ppt》由会员分享,可在线阅读,更多相关《生物统计学:第10章 多元线性回归分析及一元非线性回归分析课件.ppt(35页珍藏版)》请在三一办公上搜索。
1、第10章 多元线性回归分析及一元非线性回归,多元线性回归(multiple Linear regression),一、多元线性回归模型 在回归问题中,一个量只受一种因素影响的情况是较少的,往往是很多因素共同影响一个量。 例如,农作物的产量,除受种植密度影响之外,还受施肥量、灌水量和田间管理次数等的影响。 例如,动物体重的增加与饲料中蛋白质含量、饲料总量和每日透料次数等都有关。 特别是当几个自变量之间还存在相关时,只考虑一个自变量与因变量的关系,往往得不到正确的结果。必须同时考虑几个因素的共同作用,才能得到比较正确的结论。这就是我们要讨论的多元回归问题。,一个典型的多元回归资料,可以列成下表。,
2、表 10.1 典型的多元线性回归数据,第p 次观察值为:,其中e1,e2, ,en是相互独立且服从正态分布的随即变量。该式即所谓的多元线性回归模型。,多元线性回归和一元线性回归一样,用最小二乘法求a和bj 的估计值a和bj 。所不同的是,一元回归中,只需求出a和1个b,而多元回归中则需求出a和k个b。用a和b1,b2, ,bk 分别表示a和b1,b2, ,bk 的估计值。根据最小二乘法,回归方程,其中的a和bj应使得全部实际观察值,与回归估计值p的离差平方和达到最小。,将方程组整理 ,可得,正规方程,解上述方程组,可以得到b1,b2,b k。a由(1)式给出,,由实际观察值,计算得到的bj是b
3、j的无偏估计量,a是a的无偏估计量,于是得到多元回归方程:,其中a为常数项;b1,b2, ,bk分别称为Y对X1,X2, ,Xk的偏回归系数(partial regression coefficient)。它表示当其它自变量都固定时,该自变量每变化一个单位而使因变量平均改变的数值。,二、多元回归方程的计算 例10.1 为研究黄牛的体重与体长和胸围的关系。测定了20头鲁西黄牛的体长、胸围和体重,试建立体重对体长和胸围的回归方程。 (教科书中p150),解 将数据按表中的要求整理好,然后计算,于是得出二元回归方程,方程中的3.03和3.80都称为偏回归系数。偏回归系数是指在其它自变量都固定时,其中
4、一个自变量对因变量的影响。,列出正规方程,因为只有b1和b2两个未知数,可解二元联立方程组。常数a可根据各变量的平均值求得。,在上述两个自变量同时影响一个因变量的情况下,只有用二元回归分析,才能得到可靠的结果。若只考虑其中的一个因素,用一元回归分析,另一个因素并不固定,这时所得到的回归系数b,并不能真正表示该变量对因变量贡献的大小。例如,上例中若只考虑体长对体重的影响,回归方程为:,这时体长每变化一个单位,体重平均改变4.608个单位,远远大于二元回归中的b1。若只考虑胸围对体重的影响,回归方程为:,其回归系数亦不同于二元回归中的b2。特别是当两个自变量之间有密切相关时,差异就更大,甚至得出相
5、反的结论。,三、多元线性回归方程的显著性检验 多元线性方程求出后,往往需要做关于模型参数的检验。在多元线性回归模拟中,随机误差是服从正态分布的随即变量。因此,Y亦为独立正态随机变量。在多元线性回归中,关于回归显著性检验的假设是:,拒绝H0意味着至少有一个自变量对因变量是有影响的。,检验的程序与一元的情况基本相同,即用方差分析的方法。将总平方和分解为回归平方和与剩余平方和,,回归平方和由下式计算,,剩余平方和,,总的自由度为n1,回归项的自由度等于自变量的个数k,剩余项的自由度为本nk1。下面对例10.1的回归方程做显著性检验。回归平方和与剩余平方和分别为:,列成方差分析表:,拒绝H0:bj0。
6、结论是Y与Xj之间的回归关系极显著。,四、偏回归系数的显著性检验 如果回归方程显著性检验的结果是显著的,说明回归系数中,至少有一个bj0,但并不能证明所有的bj0。因此,在回归方程中,可能存在非主要因素。在实际应用时,希望能从方程中剔除不重要因素,从而建立一个比较简单的回归方程,以利于对Y做预报。这就需要确定在一个方程中,哪些因素是主要的,哪些因素是次要的。,例10.1 的两个偏回归系数的显著性检验如下:,bj服从正态分布,可以用t检验对bj的显著性做检验。,t17,0.01(双)=2.898p1=0.00088,p2=9.5310-6,因此,体长和胸围对体重的贡献都是极显著的。,五、复相关系
7、数和偏相关系数(一)复相关系数(multiple correlation coefficient) 在一元回归中,回归的显著程度可用相关系数来表示。同样在多元回归问题中,可以用复相关系数表示。对于一个多元回归问题,Y与X1,X2, ,Xk 的线性关系密切程度,可以用多元回归平方和与总平方和的比来表示。因此复相关系数由下式给出,,复相关系数R等于实际观察值Y与回归估计值 之间的简单相关系数,,对复相关系数的显著性检验,相当于对整个回归的方差分析。在做过方差分析之后,就不必再检验复相关系数的显著性,也可以不做方差分析。,例10.1的RY1,2为:,从附表(相关系数检验表)中查出,当独立自变量个数k
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物统计学:第10章 多元线性回归分析及一元非线性回归分析课件 生物 统计学 10 多元 线性 回归 分析 一元 非线性 课件
链接地址:https://www.31ppt.com/p-1789875.html