《广义线性回归分析》PPT课件.ppt
《《广义线性回归分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《广义线性回归分析》PPT课件.ppt(50页珍藏版)》请在三一办公上搜索。
1、多元统计分析方法,The Methods of Multivariate Statistical Analysis,主要的统计分析方法,卡方分析,分类型,数值型,回忆,方差分析回归分析,比较率,比较均值,依存关系,反应变量,异同点?,方差分析,分析效应因子A对反应变量Y的影响,即,分析效应因子A的不同水平对反应变量Y的作用差异。,。男性和女性之间收缩压的差异。试验药和对照药之间的作用差异。大学生和运动员之间肺活量的差异,方差分析的原理,分解总体变异:,SST=SSA+SSE,舒张压,性别,回归分析,分析自变量X对因变量Y的依存关系,即,分析自变量X改变一个单位时,因变量Y的改变量大小。,。收缩
2、压和胆固醇的依存关系。肺活量和体重的关系。污染物浓度和污染源距离之间的关系,回归分析的原理,分解总体变异:,SST=SSX+SSE,舒张压,胆固醇,方差分析和回归分析的相同点,模型:因变量=自变量+残差,方法原理:分解总体变异 SST=SSA+SSE SST=SSX+SSE 因变量:连续型数值变量,方差分析和回归分析的不同点,自变量:方差分析:自变量-分类型 回归分析:自变量-连续型,结合?,广义线性模型分析,General Linear Model Analysis,什么是广义线性模型分析?协方差分析 广义线性回归分析,主要内容,第一节 广义线性模型分析的概念,广义线性模型分析是将方差分析和
3、回归分析的基本原理结合起来,用来分析连续型因变量与任意型自变量之间各种关系的一种统计分析方法。其意义是使得方差分析和回归分析的实用性和准确性得到进一步提高。,两个典型的广义线性模型分析方法,协方差分析,广义线性回归分析,含有数值型自变量的方差分析,含有分类型自变量的回归分析,第二节 协方差分析,协方差分析是将方差分析原理和线性回归分析原理结合起来的一种方差分析方法。它消除了混杂变量(协变量)对因变量的影响,使得方差分析结果更加准确。,。男性和女性之间收缩压的差异。试验药和对照药之间的作用差异。大学生和运动员之间肺活量的差异,方差分析存在的问题:结果不够准确,用方差分析结果来对下面问题作结论,合
4、适吗?,方差分析不够准确的原因:,年龄身高,SST=SSA+SSE,肺活量,职业,解决的办法,处理效应Y,一、协方差分析的原理,分解总体变异:,SST=SSA+SSX+SSE,舒张压,性别,年龄,二、方差分析和协方差分析的区别区别(1):数据,方差分析协方差分析AYA Y X1y111y11 x111y121y12 x12 1 y1.n11y1,n1 x1,n12y212y21 x212y222y22 x22 2 y2,n22y2,n2 x2,n2,区别(2):模型,方差分析模型 协方差分析模型,i 是组均值 i 是校正的组均值(group mean)(adjusted group mean)
5、i j 是随机误差 i j 是随机误差 是协变量x对因变量y的影响,在效应因子的每一个水平上,因变量y服从正态分布;方差相等。,区别(3):假设条件,在效应因子的每一个水平上,因变量y服从正态分布;方差相等;在效应因子的每一个水平上,因变量y和协变量x呈线性关系;斜率相同。,方差分析 协方差分析,三、协方差分析的方法步骤,检验数据是否满足假设条件:正态分布性 方差齐性 线性相关性 平行性 检验效应因子的显著性 估计校正的组均值 检验校正的组均值之间的差异,【例6_1】为了研究两种药物对癫疯病菌的治疗效果,将30名病人随机分成3组,一组使用抗生素A,一组使用抗生素D,另一组作为对照组使用安慰剂。
6、治疗前和治疗后分别对病人身体的癫疯病菌数量进行了检测,病菌的数量是由每一个病人身体上六个部位病菌感染的程度而定的,数据列在下表中。试对该试验研究进行统计分析。,四、协方差分析的应用举例,数据:,解:这是一个完全随机设计资料。令 x 表示治疗前病人身体的癫疯病菌数量,y 表示治疗后病人身体的癫疯病菌数量,drug 表示用药方式,取值为A、D和F,分别 表示使用抗生素A、抗生素D和安慰剂。,首先建立SAS数据集data eg6_1;do id=1 to 10;do drug=A,D,F;input x y;output;end;end;cards;11 6 6 0 16 13 3 0 15 9 1
7、2 20run;,(一)检验协方差分析的4个假设条件是否满足(1)检验正态性:proc sort data=eg6_1;by drug;run;proc univariate data=eg6_1 normal;var y;by drug;run;(2)检验方差齐性:proc discrim data=eg6_1 pool=test;class drug;var y;run;(3)检验线性相关性:proc reg data=eg6_1;model y=x;by drug;run;(4)检验平行性:proc glm data=eg6_1;model y=drug x drug*x;run;,【S
8、AS 部分输出结果】(1)检验正态分布的结果:(H0:y 服从正态分布)A组:W=0.928405,P=0.4166D组:W=0.871798,P=0.1002F组:W=0.972136,P=0.9023-说明三个组的y 值均近似服从正态分布。检验方差齐性的结果:(H0:方差相等)Chi-Square=1.551005,DF=2,P=0.4605,-说明三个组的方差在统计意义上是相等的。,注意,以上检验过程应逐条进行,若发现有不满足假设条件的,应当选取适当的变量变换,使之尽可能接近假设条件。,检验线性相关性的结果:(H0:线性无关,H1:线性相关)A组:F=11.23,df=(1,8),p=0
9、.0101 D组:F=39.24,df=(1,8),p=0.0002F组:F=6.21,df=(1,8),p=0.0374-说明三个组上 y 与 x 均近似呈线性关系。检验平行性的结果:(H0:斜率相等)F=0.59,df=(2,24),p=0.560,-说明三条直线近似平行。,(二)假设条件满足后,再进行协方差分析:【SAS 程序】proc glm;class drug;model y=drug x;lsmeans drug/pdiff;run;【SAS 输出结果】General Linear Models ProcedureClass Level InformationClass Leve
10、ls ValuesDRUG 3 A D FNumber of observations in data set=30,Dependent Variable:Y Sum of MeanSource DF Squares Square F Value Pr FModel 3 871.49740304 290.49913435 18.10 0.0001Error 26 417.20259696 16.04625373Corrected Total 29 1288.70000000 R-Square C.V.Root MSE Y Mean 0.676261 50.70604 4.0057775 7.9
11、000000Source DF Type I SS Mean Square F Value Pr FDRUG 2 293.60000000 146.80000000 9.15 0.0010X 1 577.89740304 577.89740304 36.01 0.0001Source DF Type III SS Mean Square F Value Pr FDRUG 2 68.55371060 34.27685530 2.14 0.1384X 1 577.89740304 577.89740304 36.01 0.0001,T for H0:Pr|T|Std Error ofParamet
12、er Estimate Parameter=0 EstimateINTERCEPT-0.434671164 B-0.18 0.8617 2.47135356DRUG A-3.446138280 B-1.83 0.0793 1.88678065 D-3.337166948 B-1.80 0.0835 1.85386642 F 0.000000000 B.X 0.987183811 6.00 0.0001 0.16449757,Least Squares MeansDRUG Y Pr|T|H0:LSMEAN(i)=LSMEAN(j)LSMEAN i/j 1 2 3A 6.7149635 1.0.9
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 广义线性回归分析 广义 线性 回归 分析 PPT 课件
链接地址:https://www.31ppt.com/p-5505107.html