高等生物统计学课件.ppt
《高等生物统计学课件.ppt》由会员分享,可在线阅读,更多相关《高等生物统计学课件.ppt(125页珍藏版)》请在三一办公上搜索。
1、第2章 回归分析与相关分析(Regression analysis and correlation analysis),2.1 回归与相关,2.3 协方差分析,2.4 多元线性回归,2.2 简单回归复习与提高,2.5 通径分析与偏相关分析,2.6 逻辑(logistic)回归,2.1 回归与相关,在生物科学研究中,经常会遇到探讨共处于一个统一体中变量之间的关系问题,其目的就是想了解变量之间是否有因果关系或相关关系。,对于变量之间的因果关系,统计学的任务是查明因果关系是否存在,若存在,判定强弱,并找出揭示这种关系的模型,用于预测、控制、优化。对于相关关系(又叫相依关系),统计学的任务是找出刻画这
2、种关系强弱的指标,并用于判定这种关系存在性及强弱。前者就是回归分析,后者就是相关分析。,相关关系,如人的血压Y与年龄X之间的关系,一般来说,年龄越大血压越高,但年龄相同的两个人的血压不一定相等。又如某农作物的亩产量Y与施肥量X之间有一定的关系,但施肥量相同,亩产量却不一定相同。这样的例子在实际中举不甚举。相关关系是两个随机变量之间的平行关系,它们要么互为因果,要么具有共同的因。,相关关系概念,相关关系度量指标,线性相关关系检验,例题 设从某油松林地随机抽测10块样地,测得林地林木平均高X与木材蓄积量Y如下表所示,试检验X与Y的线性相关关系强弱。,例题 设从某油松林地随机抽测10块样地,测得林地
3、林木平均高X与木材蓄积量Y如下表所示,试检验X与Y的线性相关关系是否可认为是0.99,并给出其95%置信区间。,回归关系与回归分析回归关系在相关关系中,如果关心的是容易测定或控制变量X对变量Y的决定作用大小,将X看成一个普通变量,这时变量X与Y之间就成为回归关系。,回归模型如果普通变量x与随机变量Y具有回归关系,则Y除过受变量x的作用以外,还受到控制不严格和未知因素的作用。所以,x与Y应满足关系式,对于回归模型,显然有,回归模型分类,回归分析,研究一个随机变量与一个或几个可控变量之间回归关系,从而找出回归关系的模型,用于预测、优化和控制,这种统计方法称为回归分析。回归分析主要解决三个问题:提供
4、建立具有回归关系的变量之间的数学关系式(称为经验公式)的一般方法;判别所建立的经验公式是否有效,并从影响随机变量的诸变量中判别哪些变量的影响是显著的,哪些是不显著;利用所得到的经验公式进行预测和控制。,2.2 简单回归复习与提高,一元线性回归模型,一元线性经验回归方程及其建立,最小二乘法(The least square method),最小二乘法估计量的统计性质,所以,又正态分布的性质有:,进而有,一元线性回归有关检验,离差平和分解,回归显著性检验,F检验,T检验,相关系数检验,截距检验,例 为了研究大豆脂肪含量 和蛋白质含量 的关系,测定了10种大豆品种籽粒内的脂肪含量和蛋白质含量,得到如
5、下数据。分别两组观测数据建立蛋白质含量对脂肪含量的回归方程。,回归直线间与相关系数间比较,两条回归直线间比较,在生物科学研究中,人们经常要了解物种之间是否存在共同生物学基础。这种问题的探讨是以回归线的比较为基本工具。回归线比较包括平行检验、共截距检验、重合检验等。,平行检验,共截距检验,重合检验,所谓回归线重合检验就是在平行检验接受平行的情况下,两回归线合并估计斜率,在进行共截距检验。,例 对由两组观测数据建立蛋白质含量对脂肪含量的回归线进行比较。,多条回归直线间比较,重合分析,平行分析,共截距分析,注意:k条回归线的共截距分析方法略作改进就可以用于检验k条回归线是否过指定点。具体做法如下:,
6、三种施肥试验下y对x回归线分析,两条相关系数间比较,在生物科学研究中,人们经常要探讨某个试验指标受不同控制因素影响关系的强弱。这一问题在相当普遍情况下,可以通过相关系数的比较得以解决。,2.3 协方差分析(Analysis of covariance),生物科学研究试验,大部分情况下是自然试验,或观测试验。试验指标除受人们关心的、严格控制因素影响以外,很多情况下会受到无法控制的可测量因素指标的影响。如果在对试验指标受严格控制因素影响的探索试验中,忽视这种无法控制的可测量因素指标对试验结果的作用,无疑会由试验数据得到虚假结论。例如前面我们介绍的苹果树产能受施肥影响的实验中,如果忽视苹果树产能受基
7、础产能影响,直接由施肥后的产量数据进行方差分析,会得到下列结论:,不考虑基础产能影响的产能方差分析,协变量与协方差分析概念,设在研究试验指标Y受可控因素A影响的试验中,由于无法控制可测量指标因素指标x导致试验单元不一致,从影响试验结果,则称指标x为协变量;分析带有协变量试验数据的统计方法称为协方差分析。协方差分析是把回归分析与普通方差分析相结合,处理带有些变量数据问题有效方法。,协方差分析数据结构,协方差分析统计模型,协方差分析一般流程,苹果树生产能力受施肥影响例子续,回归校正后试验指标数据表,协方差分析出了可以按前面所讲的过程实现以外,也可以用与前面所讲过程等价的离回分析来实现,具体见下表。
8、,单因素单协变量协方差分析(离回分析)表,在生物科学研究中,经常会遇到探讨共处于一个统一体中一个变量(向应变量)与多个变量(自变量)之间的关系问题,其目的就是想了解变量之间是否有因果关系或相关关系,进而确定引起应变量发生变化的主要自变量,并建立应变量随这些主要自变量变化关系的经验模型。在统计学中,把分析两个或两个以上自变量对一个自变量是否有线性影响关系的统计分析称之为多元线性回归.,二元性线性回归模型,二元性回归模型及其几何解释,2.4 多元线性回归分析,二元性线性回归几何解释,多元性回归分析,多元性线性回归模型,多元性线性回归模型的数据结构,多元性线性经验回归方程建立,中心化经验回归方程为,
9、一医学工作者与了解糖尿病人的血糖(响应变量)与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂(均为自变量)之间的多元回归方程,以便了解糖尿病人的血糖与其他几个血液理化指标之间的关系,进而探索糖尿病的有效治疗方案.其随机收集了27名糖尿病患者的血液化验样本数据如下表所示,试就这些数据建立糖尿病人的血糖(响应变量)与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂(均为自变量)之间的多元线性经验回归方程.,多元线性回归分析举例,计算建立经验回归方程所需各量,最小二乘法的正规方程组,记号及其含义,一、回归方程的方差分析,多元线性回归方程的假设检验及其评价,二、偏回归系数检验,偏相关系数t检验,偏相关系数F
10、检验,三、复相关系数与多元线性回归显著性检验,决定系数表示回归离差平方和占总离差平方和的比例,它反映了进入回归方程所有自变量对响应变量回归贡献的大小,决定系数愈接近1,说明回归整体愈显著。,复相关系数所有自变量xi与响应变量y间的线性相关程度。如果只有一个自变量,此时,复相关系数等于样本相关系数。复相关系数与下列临界值比较可以检验回归显著性。,糖尿病人血糖与其他血液理化指标回归的方差分析表,Parameter Standard Variable DF Estimate Error t Value Pr|t|变量 自由度 偏回归系数 标准误 t值 P值Intercept 22 5.94327 2
11、.82859 2.10 0.0473 X1 22 0.14245 0.36565 0.39 0.7006X2 22 0.35147 0.20420 1.72 0.0993 X3 22-0.27059 0.12139-2.23 0.0363 X4 22 0.63820 0.24326 2.62 0.0155,糖尿病人血糖与其他血液理化指标回归的偏回归系数t检验,糖尿病人血糖与其他血液理化指标回归的偏回归系数F检验,标准化回归系数,1.残差标准差(Root MSE),反映了回归方程的精度,其值越小说明回归效果越好。,三、其他有关评价指标与评价,2.决定系数(determination coeffi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高等 生物 统计学 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6404401.html