欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    spss中的回归分析课件.ppt

    • 资源ID:1288833       资源大小:1.69MB        全文页数:134页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    spss中的回归分析课件.ppt

    5.7 回归分析 线性回归 曲线估计 二分量逻辑分析 多项式逻辑分析 标称变量分析 概率回归 非线性回归 加权估计 2阶段最小二乘法,5.7 回归分析,5-7-1 线性回归模型,总体回归模型,j也被称为偏回归系数(partial regression coefficients),表示在其他解释变量保持不变的情况下,Xj每变化1个单位时,Y的均值E(Y)的变化。,样本回归函数,5-7-1 线性回归模型总体回归模型j也被称为偏回归系数(,参数估计 最小二乘法模型统计推断检验 拟合优度检验 方程显著性检验(F检验) 变量显著性检验(t检验),参数估计,(1)拟合优度检验 回归方程的拟合优度检验就是要检验样本数据聚集在样本回归直线周围的密集程度,从而判断回归方程对样本数据的代表程度。,回归方程的拟合优度检验一般用调整判定系数R2实现。该统计量的值越接近于1越好。(注:在一元线性回归中拟合优度的检验可用判定系数R2实现),(1)拟合优度检验 回归方程的拟合优度检,(2)回归方程的显著性检验(F检验) 回归方程的显著性检验是对因变量与所有自变量之间的线性关系是否显著的一种假设检验。 回归方程的显著性检验一般采用F检验,利用方差分析的方法进行。,(2)回归方程的显著性检验(F检验),F,F,(3)回归系数的显著性检验(t检验) 所谓回归系数的显著性检验,就是根据样本估计的结果对总体回归系数的有关假设进行检验。 之所以对回归系数进行显著性检验,是因为回归方程的显著性检验只能检验所有回归系数是否同时与零有显著性差异,它不能保证回归方程中不包含不能较好解释说明因变量变化的自变量。因此,可以通过回归系数显著性检验对每个回归系数进行考察。,(3)回归系数的显著性检验(t检验),回归参数显著性检验的基本步骤。 提出假设 计算回归系数的t统计量值 根据给定的显著水平确定临界值,或者计算t值所对应的p值 作出判断,H0:j =0 (j=1,2k),回归参数显著性检验的基本步骤。H0:j =0,一、一元线性回归 y=a+bx例5-7-1 已知我国分地区家庭人均食品支出、人均收入。试作一元线性回归分析。(e5-7-1),一、一元线性回归 y=a+bx,操作步骤:使用系统默认选择项进行线性回归分析Analyze-Regression-Linear分析回归线性,Dependent:存放因变量 Independent:存放自变量,操作步骤:使用系统默认选择项进行线性回归分析Depende,输出结果及结果分析,变量引入或剔出表:Model 1 引入变量 income, 用强迫输入法Enter。,输出结果及结果分析变量引入或剔出表:,模型摘要表 相关系数R=0.923, 判定系数R2=0.852,调整判定系数R2=0.847,估计值的标准误为73.83 注:在一元线性回归中可用判定系数R2来判断模型的拟合度。调整判定系数R2的值越大,模型的拟合优度越好。,模型摘要表,方差分析表 回归的均方(RegressionMean Square)=878382.334,剩余(残差)的均方(Residual-Mean square)=5450.755, F=161.149 P=0.000.可以认为这两个变量之间有直线关系. 注:H0为模型线性关系不成立,即b=0,方差分析表,变量显著性检验(t 检验)回归系数:t=12.694, p=0.00, 拒绝原假设,显著不为0常数项:t=-0.781,p=0.441,接受原假设,常数项与0没有显著差异。注意:在实际中一般不以t检验决定常数项是否保留在模型中,而是从经济意义方面分析回归线是否应该通过原点。,变量显著性检验(t 检验),回归方程: 常数项=-53.086, 回归系数=0.422, 则线性回归方程为: y=-53.086+0.422x,回归方程:,二、多元回归分析1、从“Analyze” (分析)“Regression”(回归)“Linear”(线性),打开 Linear线性回归主对话框 。,二、多元回归分析,2、在左侧的源变量栏中选择一数值变量作为因变量进入Dependent栏中,选择一个或更多的变量作为自变量进入Independent(s)栏中。 3、如果要对不同的自变量采用不同的引入方法,可利用“Previous” 与“Next” 按钮把自变量归类到不同的自变量块(Block)中,然后对不同的变量子集选用不同的引入方法(Method)。 Enter(进入):强迫引入法,默认选择项。定义的全部自变量均引入方程。 Remove(移去):强迫剔除法。定义的全部自变量均删除。 Forward(向前):向前引入法。自变量由少到多一个一个引入回归方程,直到不能按检验水准引入新的变量为止。该法的缺点是:当两个变量一起时效果好,单独时效果不好,有可能只引入其中一个变量,或两个变量都不能引入。 Backward(向后):向后剔除法。自变量由多到少一个一个从回归方程中剔除,直到不能按检验水准剔除为止,能克服向前引入法的缺点。当两个变量一起时效果好,单独时效果不好,该法可将两个变量都引入方程。 Stepwise(逐步):逐步引入一剔除法。将向前引入法和向后剔除法结合起来,在向前引入的每一步之后都要考虑从已引入方程的变量中剔除作用不显著者,直到没有一个自变量能引入方程和没有一个自变量能从方程中剔除为止。缺点同向前引入法,但选中的变量比较精悍。,2、在左侧的源变量栏中选择一数值变量作为因变,说明:为弥补各种选择方法和各种标准的局限性,不妨分别用各种方法和多种引入或剔除处理同一问题,若一些变量常被选中,它们就值得重视。 4、 Selection variable(选择变量):可从源变量栏中选择一个变量,单击Rule后,通过该变量大于、小于或等于某一数值,选择进入回归分析的观察单位。 5、Case Labels(个案标签):在左侧的源变量框中选择一变量作为标签变量进入 Case Labels框中。,说明:为弥补各种选择方法和各种标准的局限性,,6、Statistics(统计)对话框单击“Statistics”按钮,进入统计对话框如图:,6、Statistics(统计)对话框,Estimates(默认选择项):回归系数的估计值(B)及其标准误(StdError)、常数(Constant);标准化回归系数(Beta);B的t值及其双尾显著性水平(Sig.)。 Model fit(默认选择项):列出进入或从模型中剔除的变量;显示下列拟合优度统计量:复相关系数(R)、判定系数(R2)、调整 R2(Adjusted R Square)、估计值的标准误以及方差分析表。 Confidence intervals:回归系数 B的 95可信区间(95Confidence interval for B)。 Descriptives:变量的均数、标准差、相关系数矩阵及单尾检验。 Covariance matrix:方差协方差矩阵。 R sqared change:R2和 F值的改变,以及方差分析 P值的改变。 Part and partial correlations: 显示方程中各自变量与因变量的零阶相关(Zero一order,即Pearson相关)、偏相关(Partial)和部分相关(part)。进行此项分析要求方程中至少有两个自变量。 Collinearity diagnostic(共线性诊断)。显示各变量的容差(Tolerance)、方差膨胀因子(VIC,Variance Inflation Factor)和共线性的诊断表。,Estimates(默认选择项):回归系数的,容差(Tolerance)是不能由方程中其它自变量解释的方差所占的构成比。所有进入方程的变量的容差必须大于默认的容差水平值(Tolerance:0.0001)。该值愈小,说明该自变量与其他自变量的线性关系愈密切。该值的倒数为方差膨胀因子(Variance Inflation Factor)。当自变量均为随机变量时,若它们之间高度相关,则称自变量间存在共线性。在多元线性回归时,共线性会使参数估计不稳定。逐步选择变量是解决共线性的方法之一。 DurbinWaston:用于随机误差项的分析,以检验回归模型中的误差项的独立性。如果误差项不独立,那么对回归模型的任何估计与假设所做出的结论都是不可靠的。,计算DW值 给定,由n和k的大小查DW分布表,得临界值dL和dU 比较、判断,容差(Tolerance)是不能由方程中其,0D.W.dL 存在正自相关 dLD.W.dU 不能确定 dU D.W.4dU 无自相关4dU D.W.4 dL 不能确定4dL D.W.4 存在负自相关,说明:当D.W.值在2左右时,模型不存在一阶自相关。,0D.W.dL,Casewise diagnostic:对标准化残差(服从均数=0,标准差=1的正态分布)进行诊断。 判断有无奇异值(离群值)(outliers)。 Outliers:显示标准化残差超过n个标准差的奇异值,n=3为默认值。 All Cases:显示每一例的标准化残差、实测值和预测值、残差。7、Plots(图)对话框 单击“Plots”按钮,对话框如下图所示。Plots可帮助分析资料的正态性、线性和方差齐性,还可帮助检测奇异值或异常值。,Casewise diagnostic:对标准化残差(服从均,spss中的回归分析课件,(1)散点图:可选择如下任何两个变量为Y(纵轴变量)与X(横轴变量)作图。为 获得更多的图形,可单击“Next”按钮来重复操作过程。 DEPENDENT:因变量。 *ZPRED:标准化预测值。 *ZRESID: 标准化残差。 *DRESID:删除的残差。 *ADJPRED:调整残差。 *SRESID:Student氏残差。 *SDRESID: Student氏删除残差。 (2)Standardized Residual Plots:标准化残差图。 Histogram:标准化残差的直方图,并给出正态曲线。 Normal Probality Plot:标准化残差的正态概率图(PP图)。 (3)Produce all Partial plots:偏残差图。,(1)散点图:可选择如下任何两个变量为Y(纵轴变量),8、Save(保存新变量)对话框 单击“ Save”按钮,对话框如下图所示。每项选择都会增加新变量到正在使用的数据文件中。,8、Save(保存新变量)对话框,(1)预测值(Predicted Values): Unstandardized:未标准化的预测值,简称预测值(新变量为pre_1)。 Standardized标准化的预测值(新变量为Zpr_1)。 SEOf mean prediction:预测值的标准误(新变量为 Sep_l)。(2)残差(Residuals) Unstandardized未标准化残差(新变量为res_1)。 Standardized:标准化残差(新变量为Zre_1)。(3)预测区间估计(Prediction Intervals) Mean:是总体中当X为某定值时预测值的均数的可信区间(新变量lmci_1为下限, umci_1为上 限。 Individual:个体Y值的容许区间。即总体中,当X为某定值时,个体Y值的波动范围(新变量lici_1为下限,uici_1为上限)。 Confidence Intervals:可信区间。默认为 95的可信区间,但用户可以自己设定。,(1)预测值(Predicted Values):,9、Options选择项对话框 单击“Option”按钮,打开Options对话框,如下图。,9、Options选择项对话框,(1)逐步方法准则(Stepping Method Criteria): Use Probability of F(使用 F显著水平值):当候选变量中最大 F值的 P值小于或等于引入值(默认:005)时,引入相应的变量;已进入方程的变量中,最小F值的P值大于或等于剔除值(默认:0.10)时,剔除相应的变量。所设定的引入值必须小于剔 除值,用户可设定其它标准,如引入 0.10,剔除 0.11,放宽变量进入方程的标准。 Use F value使用 F值。含义同上。 Include constant in equation:线性回归方程中含有常数项。(2)缺失值的处理方法(Missing Value) Exclude cases listwise:剔除所有变量中有缺失值的观测量。 Exclude cases pairwise:仅剔除正在参与运算的一对变量中有缺失值的观测量。 Replace with mean:以平均数代替缺失值.,(1)逐步方法准则(Stepping Method Crit,11、“ WLS”(Weight Least Squares) (1)利用加权最小平方法给于观测量不同的权重值,它或许用来补偿采用不同测量方式时所产生的误差。 (2)将左侧源变量框中的加权变量选入WLS Weight框中。应用举例 例5-7-2 在例5-7-1中增加一自变量粮食价格price,数据如下图。试作多元线性回归分析。(e5-7-2.sav),11、“ WLS”(Weight Least Squar,spss中的回归分析课件,操作步骤: 1、从菜单“Analyze”“Regression”“Linear”,打开Linear线性回归主对话框。 2、在左边的源变量栏中选择foodexp作为因变量进入Dependent栏中,选择income、price作为自变量进入Independent(s)栏中。在Method栏中选择Stepwise(逐步引入一剔除法)。 3、单击“Options”按钮,进入Options对话框。在Use probability of F栏中的Entry框内输入010,Remove框中输入011。 4、单击“Statistics”按钮,进入 Statistics对话框,选择 Descriptives、Casewise diagnostic中的outliers(n3为默认值)。 5、单击“Plots”按钮,选择以下3项: 散点图。选用SRESID(Y纵轴变量)与*ZPRED(X横轴变量)作图。 Histogram:标准化残差的直方图,并给出正态曲线。 Normal Probability plot:标准化残差的正态概率图(PP图)。,操作步骤:,6、单击“Save”按钮,选择保存以下新变量: (1)预测值(Predicted Values)中的 Unstandardized,未标准化的预测值(新变量为 pre_l) SEof mean Predictions,预测值的标准误(新变量为 sepl)。 (2)残差(Residuals)中的 Unstandardized末标准化残差(新变量为res_1) (3)预测区间估计(Prediction Intervals)中 Mean,当自变量为某定值时,预测值的均数的可信区间(新变量lmci_1为下限,umci_1为上限) Individual,个体Y值的容许区间,即总体中,当自变量为某定值时,个体Y值的波动范围(新变量lici_1为下限,uici_1为上限); Confidence,可信区间,默认为95的可信区间,用户可以自己设定。 7、单击“OK”按钮,运行程序,得到结果如下:,6、单击“Save”按钮,选择保存以下新变量:,描述统计量表:均值、标准差、观测量的个数,描述统计量表:均值、标准差、观测量的个数,相关系数表:相关系数、检验概率、观测量个数,相关系数表:相关系数、检验概率、观测量个数,变量引入剔除表: Model 1中:引入自变量income Model 2中:又引入Price,没有剔除变量,所以有两个自变量。,变量引入剔除表:,模型摘要表 Model1 中:相关系数R=0.923, 判定系数r2=0.852,调整判定系数R2=0.847,估计值的标准误为73.83 Model2 中:相关系数R=0.940, 判定系数r2=0.884,调整判定系数R2=0.876,估计值的标准误为66.47。,模型摘要表,方差分析表 Model 2 中:F103.167, P=0.000, 说明因变量foodexp与自变量income、price之间有线性关系。,方差分析表,回归分析系数表 Model 2中回归方程为: foodexp=-87.378+0.354income+206.538price 经t检验, 在0.05检验水平下,回归系数b1、b2有显著性意义。而常数项的P0.173, 无显著性意义。,回归分析系数表,模型外的变量 Model1中方程外的变量price的t检验概率 P=0.0110.10, 所以在Model 2 中被引入方程。,模型外的变量,残差统计表,残差统计表,标准化残差直方图及正态曲线,标准化残差直方图及正态曲线,标准化残差的正态概率图:用来判断一个变量的分布是否符合一个特定的检测分布。如果两分布基本相同,那么在PP图中的点应该围绕在一条斜线的周围。,标准化残差的正态概率图:用来判断一个变量的分布是否符合一个特,散点图:可以判断模型的拟合效果。在残差图中,如果各点呈随机状,并绝大部分落在2范围内,说明模型对于数据的拟合效果较好。,散点图:可以判断模型的拟合效果。在残差图中,,spss中的回归分析课件,多元线性回归: 1、因变量、自变量的确定 2、变量引入、剔除方法的选择 3、常用选择项,多元线性回归: 1、因变量、自变量的确定 2、变量引入,4、检验 (1)模型拟合检验:调整R2,4、检验 (1)模型拟合检验:调整R2,4、检验 (2)模型线性关系检验:方差分析表,F统计量 零假设:回归系数全为0,4、检验 (2)模型线性关系检验:方差分析表,F统计,4、检验 (3)模型回归系数检验:t检验 零假设:相对应的回归系数为0,4、检验 (3)模型回归系数检验:t检验,应用举例:全国财政收入的回归分析,应用举例:全国财政收入的回归分析,采用ENTER法:引入全部变量,采用ENTER法:引入全部变量,spss中的回归分析课件,移除GNP后,剩余的自变量采用ENTER法,移除GNP后,剩余的自变量采用ENTER法,Y=2311.598+0.9X1+1.819X2-0.0458X3+0.03368X4其中:x1税收;x2其它收入;X3从业人数;X4进出口额为什么从业人数的系数为负?注意:本题变量的引入剔除可采用Stepwise(逐步)法由计算机自动完成。,Y=2311.598+0.9X1+1.819X2-0.045,5.7.2 曲线估计(曲线拟合 )一、曲线拟合的功能与应用 在很多情况下有两个相关的变量,用户希望利用其中的一个变量对另一个变量进行预测,此时采用的方法也很多,从简单的线性模型到复杂的时间序列模型。如果不能马上根据观测数据确定一种最佳模型,可利用曲线估计在众多的回归模型中建立一个简单而又比较适合的模型。,5.7.2 曲线估计(曲线拟合 ),二、曲线拟合的应用示例 例5-7-3 已知变量X,Y的数据如下,试拟合曲线。(e5-7-3.sav) x: 50.00 100.00 150.00 200.00 250.00 300.00 400.00 500.00 y: .687 .398 .200 .121 .090 .050 .020 .010,1 、作散点图 “graphs-legacy Dialogs -“scatter/Dot”(-“Simple”,二、曲线拟合的应用示例1 、作散点图 “graphs-,2、曲线估计 Analyze-“Regression”-“Curve Estimation”,2、曲线估计 Analyze-“Regre,(l)Dependent(s):因变量栏。 (2)Independent:定义自变量选项。 Variable:把左侧源变量栏的某变量放入该栏作为自变量,系统默认值。 Time:以时间序列作为自变量。 (3)Case Labels:数据标签栏,把左侧源变量栏的某变量放入该栏,该栏的变量值作为结果散点图中的点标记。 (4)Models:曲线模型选择栏,有 11种类型曲线可供选择。 (5)Display ANOVA Table:结果中显示方差分析表。 (6)Inc1ude constant in equation:方程包含常数项,系统默认值。 (7)Plot models:绘制曲线拟合图,系统默认值。 (8)“Save”按钮:变量储存按钮,激活变量储存对话框。,(l)Dependent(s):因变量栏。,spss中的回归分析课件, Save variables(保存变量选项)。 点击一个或全部选项,可将相应的数值以新变量形式储存到数据库中,这些变量的定义将在结果中显示。 Predicted values:预测值选项(fit_1 )。 Residuals:残差(观察值与预测值之差)选项(err_1 )。 Prediction intervals:预测值区间(上、下限)选项(lcl_1, ucl_1 )。 Confidence interval:可信区间选项。 Predict Case:预测观测量栏,仅在以时间序列作为自变量时有效。 Prediction estimation Period through last case:计算样本中数据的预测值。 Predict through:可计算样本中和样本之后的预测值仅用于时间序列的数据。 Observation:观察值号。, Save variables(保存变量选,spss中的回归分析课件,spss中的回归分析课件,spss中的回归分析课件,线性模型,线性模型,指数模型,指数模型,spss中的回归分析课件,spss中的回归分析课件,结果分析如下: (1)方差分析表: 线性拟合:F=12.39758,Signif F(P值)=0.0125。 指数拟合:F=701.9507,Signif F0.0000 可见两种拟合方法都通过0.05水平检验,即有统计意义。但指数拟合比线性拟合更为显著。 (2)调整后的判定系数: 线性拟合:R2=0.61952。 指数拟合:R2=0.99011。 (3)自变量X检验: 线性拟合:t=-3.521,P=0.0125。 指数拟合:t=-26.490,P=0.0000。 (4)拟合方程 线性拟合:y=0.5055430.001266x 指数拟合:y=0.929305e-.009412x (5)新增变量的描述 数据文件增加了8个变量,前四个为线性拟合的,后四个为指数拟合的.,指数估计法的拟合效果比线性估计法好。,两种方法的自变量系数都通过t检验。,结果分析如下:指数估计法的拟合效果比线性估计法好。两种方法的,结论: 通过方差分析两种模型都具有统计意义,但指数拟合模型的拟合效果好。 说明: 首先,判断模型的方差分析结果,如果模型没有统计意义,那么即使它有最好的R2值,与其它呈显著意义的模型进行比较是没有意义的。 然后,比较模型的R2值。,结论:,在例5-7-3中,对y进行按时间序列做曲线估计。,在例5-7-3中,对y进行按时间序列做曲线估计。,5.7.3 逻辑回归分析(逻辑斯谛回归)一、逻辑回归分析的基本概念 使用多元线性回归来分析多个自变量与一个因变量的关系,因变量要求正态分布的连续随机变量。所谓Logistic回归,是指因变量为二级计分或二类评定的回归分析,这在经济学研究中经常遇到,如:如人的素质的高低跟人的受教育年数等因素有关。这类变量称二项分类变量(0,1)。如果因变量是二项分类变量,显然不满足正态分布的条件,这时可用Logistic 回归分析。在Logistic 回归分析中常把自变量(Independent variable)称为协变量(Covariate)。 SPSS 10.0 以上版本增加了可以处理多项逻辑分析的功能。多项的含义是指有时事物的状态不止两种,用二项分类变量不足以描述。 无论是处理二项分类变量还是处理多项分类变量逻辑分析统称为逻辑分析。,5.7.3 逻辑回归分析(逻辑斯谛回归),Binary Logistic回归模型中因变量只能取两个值1和0(虚拟因变量),而Multinomial Logistic回归模型中因变量可以取多个值。本节将只讨论Binary Logistic回归,并简称Logistic回归(与曲线估计中介绍的Logistic曲线模型相区别)。,Binary Logistic回归模型中因变量只能取,Binary Logistic回归模型,令Y服从二项分布,取值为0,1。Y=1的概率为P(Y=1),则k个自变量分别为X1,X1,X3,.Xk所对应的Logistic回归模型为:,Binary Logistic回归模型 令Y服从二,或者写为:,或者写为:,参数估计方法:最大似然估计法,参数估计方法:,1-2对数似然值(-2 log likelihood,-2LL),模型检验,2 log likelihood(-2LL)是检验模型拟合度的一个统计量,当2LL0时模型非常完美地拟合数据。,1-2对数似然值(-2 log likelihood,-2,Logistic回归的拟合优度统计量计算公式为 在实际问题中,通常采用如下分类表(Classification Table)反映拟合效果。,2拟合优度(Goodness of Fit)统计量,Logistic回归的拟合优度统计量计算公式为2拟,Classification Table for Y,Predicted(预测值)01Percent Correc,3Cox和Snell的R 2(Cox&Snells R-Square),3Cox和Snell的R 2(Cox&Snells R-,4Nagelkerke的R 2(N agelkerkes R-Square),4Nagelkerke的R 2(N agelkerkes,5Hosmer和Lemeshow的拟合优度检验统计量(Hosmer and Lemeshows Goodness of Fit Test Statistic),与一般拟合优度检验不同,Hosmer和Lemeshow的拟合优度检验通常把样本数据根据预测概率分为10组,然后根据观测频数和期望频数构造卡方统计量(即Hosmer和Lemeshow的拟合优度检验统计量,简称H-L拟合优度检验统计量),最后根据自由度为8的卡方分布计算其值并对Logistic模型进行检验。,5Hosmer和Lemeshow的拟合优度检验统计量(Ho,如果该p值小于给定的显著性水平(如 =0.05),则拒绝因变量的观测值与模型预测值不存在差异的零假设,表明模型的预测值与观测值存在显著差异。如果值大于,我们没有充分的理由拒绝零假设,表明在可接受的水平上模型的估计拟合了数据。,如果该p值小于给定的显著性水平(如 =0.05),6Wald统计量,Wald统计量用于判断一个变量是否应该包含在模型中,其检验步骤如下。 (1)提出假设。 零假设:变量的系数等于0 (2)构造Wald统计量。 (3)作出统计判断。,6Wald统计量 Wald统计量用于判断一个变量是否,二、操作步骤:Analyze-Regression-Binary Logistic,二、操作步骤:,1Logistic回归过程对话框。 (l)Dependent:因变量栏。用于放入因变量,因变量可以是数值型或短字符型的二分变量。 (2)“Previous” Block of“Next”:设定不同区组(Block)的协变量,可以用不同的协变量筛选方法对不同区组的协变量进行筛选。 (3)Covariates:协变量栏。用于放入协变量或一级交互作用的协变量,用“a*b”按钮。 (4)Method:协变量筛选方法选项。可选择七种筛选协变量方法的其中之一。,1Logistic回归过程对话框。,Enter:所有自变量强制进入回归方程。 Forward:Conditional:以假定参数为基础作似然比概率检验,向前逐步选择自变量。 Forward:LR:以最大局部似然为基础作似然比概率检验,向前逐步选择自变量。 Forward:Wald:作 Wald概率统计法,向前逐步选择自变量。 Backward:Conditional:以假定参数为基础作似然比概率检验,向后逐步选择自变量。 Backward:LR:以最大局部似然为基础作似然比概率检验,向后逐步选择自变量。 Backward:Wald:作 Wald概率统计法,向后逐步选择自变量。,Enter:所有自变量强制进入回归方程。,(5)“Select Variable” : 放入将要按规则选择观察值的变量。 “ Rule”:规则按钮。激活 Set Rule对话框。设定规则:选择变量等于,不等于,小于,小于或等于,大于,大于或等于某值。,(5)“Select Variable” :,(6)“ Categorical”:定义分类协变量按钮。激活定义分类协变量对话框,可定义一个或多个字符型和数值型分类变量。 (7)“Save”:储存新变量按钮。激活储存新变量对话框。 (8)“ Options”:选择按钮。激活选择对话框。,(6)“ Categorical”:定义分类协变量按钮。激活,2、Define Categorical Variables定义分类协变量对话框。 (1)Covariates:协变量栏,列出源协变量。 (2) CategoricalCovariates:分类协变量栏,用于放入分类协变量。(3)Change:改变对照方法选项。,2、Define Categorical Variables,Contrast栏,对照方法选项。 Indicator:比较显示是否具有同类效应,为系统默认值。 Deviation:除参照分类外,各分类与总效应比较。 Simple:除参照分类外,各分类与参照分类比较。 Difference:逆Helmert对照,除第一分类外,各分类与以前平均分类效应比较。 Helmert:除最后分类外,各分类与以后平均分类效应比较。 Repeated:除第一分类外,各分类与以前分类效应比较。 Polynomial:假定分类等距,该分类仅用于数值型变量。 Reference Category:参照方法选项。 Last:最后的分类为参照分类,系统默认值。 First:第一分类为参照类.,Contrast栏,对照方法选项。,3Save New Variables(储存新变量)对话框,3Save New Variables(储存新变量)对话,(l)Predicted Values:预测值选项。Probabilities:每个变量的事件发生的预测概率。Group membership:基于变量的预测概率归组。(2)Residuals:残差选项。Unstandardized:非标准化残差。观察值与预测值之差。Logit:Logit单位化残差。使用Logit单位的预测模型残差。Studentized:学生化残差。某观察值删除时,模型偏差的改变量。Standardized:标准化残差。非标准化残差除以其标准差。Deviance:偏差。基于模型偏差的残差。(3)Influence:预测值影响量度选项。Cook:Cook上影响统计量。当删除某观察值时,全部观察值残差改变的量度。Leverage values:Leverage值。每个观察值对模型拟合优度的相对影响。Dfbeta(s):Beta的差值。当删除某观察值时,回归系数的改变量。,(l)Predicted Values:预测值选项。,4Options选择项对话框。,4Options选择项对话框。,Statistics and Plots 统计量和图形选项。 Classification plots:显示有关因变量观察值与预测值的分类图。 Correlations of estimates:显示模型中参数估计的相关矩阵。 HosmerLemeshow goodnessof-fit:估计模型拟合优度,特别是在较多协变量或协变量是连续变量时。 Iteration history:在参数估计过程中,显示每次迭代的系数和对数似然比统计量。 Casewise listing of residuals:显示非标准化残差、预测概率、观察和预测组关系。 Outliers outside,显示某个标准差以外的奇异值。默认值是 2个标准差。 All cases:显示所有变量的残差。 CI for exp(B):计算参数值95%的置信区间。,Statistics and Plots 统计量和图,Display:显示方法选项。 At each step:显示每一步的结果。系统默认值。 At last step:显示综合中间过程和最后结果。 Probability for stepwise:协变量引入或删除的概率标准选项 Entry栏,引入协变量标准,默认值为0.05。 Removal栏,删除协变量标准,系统默认值为0.10。 Classification Cutoff: 因变量分类界限,系统默认值为0.5。 Maximum Iterations:设定最大迭代次数,系统默认值为20次。 Include constant in model:模型包含常数项,系统默认值,Display:显示方法选项。, 研究问题 在一次关于某城镇居民上下班使用交通工具的社会调查中,因变量y =1表示居民主要乘坐公共汽车上下班;y=0表示主要骑自行车上下班;自变量x1表示被调查者的年龄;x2表示被调查者的月收入;x3表示被调查者的性别(x3=1为男性,x3=0为女性)。试建立y与自变量间的Logistic回归.,三、应用举例, 研究问题三、应用举例,使用交通工具上下班情况,使用交通工具上下班情况序号x1(年龄)x2(月收入:元)x, 实现步骤,“Logistic Regression”对话框, 实现步骤“Logistic Regression”对话,“Logistic Regression:Options”对话框,“Logistic Regression:Options”,(1)第一部分输出结果有两个表格,第一个表格说明所有个案(28个)都被选入作为回归分析的个案。,结果和讨论,(1)第一部分输出结果有两个表格,第一个表格说明所有,第二个表格说明初始的因变量值(0,1)已经转换为逻辑回归分析中常用的0、1数值。,第二个表格说明初始的因变量值(0,1)已经转换为逻辑,(2)第二部分(Block 0)输出结果有4个表格。,(2)第二部分(Block 0)输出结果有4个表格。,spss中的回归分析课件,spss中的回归分析课件,(3)Omnibus Tests of Model Coefficients表格列出了模型系数的Omnibus Tests结果。,(3)Omnibus Tests of Model,(4)Model Summary表给出了-2 对数似然值、Cox和Snell的R2以及Nagelkerke的R2检验统计结果。,(4)Model Summary表给出了-2 对数似,(5)Hosmer and Lemeshow Test表格以及Contingency Table for Hosmer and Lemeshow Test表格给出了Hosmer和Lemeshow的拟合优度检验统计量。,结论:因变量的观测值与模型预测值不存在显著性差异。,(5)Hosmer and Lemeshow Tes,(6)Classification Table分类表说明第一次迭代结果的拟合效果,从该表格可以看出对于y=0,有86.7%的准确性;对于y=1,有76.9%准确性,因此对于所有个案总共有82.1%的准确性。,(6)Classification Table分类表,(7)Variables in the Equation表格列出了Step 1中各个变量对应的系数,以及该变量对应的Wald 统计量值和它对应的相

    注意事项

    本文(spss中的回归分析课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开