《相关回归分析》PPT课件.ppt
《《相关回归分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《相关回归分析》PPT课件.ppt(31页珍藏版)》请在三一办公上搜索。
1、相关与回归分析,一、相关分析一种事物与另一种事物的相互联系程度 及性质的分析。前面已经讲过:次数资料X2独立性检验,就是一种相关分析。连续性资料相关分析。相关两个具有相互依存的现象,一种现象的数值常常 伴随另一种现象的数值变化,呈现相偕变异,称 为相关。,相关分析,相关形式,相关程度,直线相关曲线相关矩阵相关,相关系数衡量现象间相互关系的尺度。决定系数衡量相关程度的尺度,不表示 相关性质。,相关系数0 1 正相关现象间变量关系成正比。0-1 负相关现象间变量关系成反比。0 无关独立事件。1 直接相关,(x-x)(y-y)=0 无关,(x-x)(y-y)0,(x-x)(y-y)=1,(x-x)(
2、y-y)=0无关,(x-x)(y-y)0,(x-x)(y-y)=-1,由于:(x-x)(y-y)统计学上称为乘积和能反映两个 变量的联系程度,但受N的影响很大。所以:把乘积和标准化。标准化的方法是:把离差转换成标准差,再除以N.1 X-X Y-Y得:r N,(X)(Y),1 X-X Y-Y N(X)(Y)N N,1(X-X)(Y-Y)N XY N,(X-X)(Y-Y)XY,(X-X)(Y-Y)(X-X)2(Y-Y)2,因为:(X-X)(Y-Y)X(Y-Y)-X(Y-Y)=XY-XY-XY+XY Y X X Y=XY-X n-Y n+n n X Y X Y X Y=XY-n-n+n,X Y所以:
3、XY-n r(X)2(Y)2(X2 n)(Y2 n),例:用凯氏定氮法(KP)和染料结合法(DBC)两种方法测定水 稻籽粒蛋白质含量如表,求两种方法的相关系数。第一步:列表、求出X、X2、Y、Y2、XY,将数据代入公式,得:,2、决定系数即相关系数的平方。这是统计学上规定的,目的是防止对相关程度作夸大的解释。它只表示相关程度,而不表示相关性质。上例中的决定系数为:r0.953 则:r20.90823、简单相关系数的显著性检验:X-X 因为:t X r p 1 r2 所以:tr Sr 定义:Sr=n 2 由于单个样本的相关系数的显著性检验是:H0:p 0 HA:p 0 以总体无相关为出发点的,r
4、 r p r 1 r2 所以:tr Sr Sr n 2,0.935上例中:r 1 0.9082 trSr 102 8.90t0.01,8 3.355 8.90 3.355 p 0.01,相关系数显著性检验:方法二(ra值查表法t r值的转换)我们已知:r r r ta sr(1-r2)/(n-2)=(1-r2)/df r2 r2df平方后得:t2(1-r2)/df r2df/(1-r2)1-r2移项:t2(1-r2)r2df t2t2r2r2df t2r2dft2r2 t2r2(dft2)t2 t2 r2df+t2 rdf+t2,上例中:r0.935 n 10 df10-28 t0.01,83
5、.355 3.3552所以:r8+3.3552 0.7646以上的计算已列于表12中(416页)查a0.01,剩余自由度8得:r0.01,80.765现在:0.9350.765 p0.01 否定H0,接受HA。相关极显著。,4、r z值变换:当:0时,r的抽样分布不是正态的,例如:n8时r的抽样分布:因此,必须将r转换成z值后才符合正态分布。转换的方法是:1、先求出相关系数离1的偏差比值:即:(1+r)/(1-r)2、进行平方根转换:即:(1+r)/(1-r)(1+r)/(1-r)1/2,3、进行对数转换:即:ln(1+r)/(1-r)1/2 这就是著名的Fisher Z值变换公式 所以:Z=
6、ln(1+r)/(1-r)1/2 ln(1+r)/(1-r)=1/2 ln(1+r)-ln(1-r)折合成常用对数:Z=1.1513log(1+r)-log(1-r)这种转换已经制成了表格(附表13,p462页,书中的表格不全,有些转换还必须计算)。例:1)、r0.62 n14 2)、r0.4699 n103 查表得:Z0.51 3)、r0.83 n14 4)、r0.81 n11解:1)当r0.62时,Z=1/2 ln(1+0.62)-ln(1-0.62)=0.7250 2)当r0.83时,Z=1/2ln(1+0.8)ln(1-0.8)=1.1881 3)当r0.81时,Z=1/2ln(1+0
7、.81)ln(1-0.81)=1.1270,5、r z 转换后的显著性检验:根据零假设的不同,将有三种情况:H0:=0,HA:0 r z转换后 u测验的三种情况 H0:=m,HA:m H0:1=2 HA:1 2,因为r z值后资料已服从正态分布,所以采用u测验。,、H0:=0(总体无相关),HA:0(总体有相关)例:287页(6.15)已知r0.62 n14 问:相关是否显著?(单个样本的显著性检验,样本比总体)方法一:t测验法:r r 0.62 tSr(1-r2)/(n-2)(1-0.622)/(14-2)2.7374 查t值表:t0.05,122.179;t0.01,123.055 2.7
8、3742.179 P0.05 否定H0,接受HA,相关显著。,方法二:查r值表法:查附表12:(461页)n 2 12 k 1(单个样本)R0.05,120.532 r0.01,120.661 0.620.532 P1.96 p0.05 否定H0,接受HA,相关显著。,、H0:P1=P2(两样本相关系数相等)HA:P1P2例:6.17 P288页:r10.83 n114 r20.81 n211问:两个相关系数之间的差异是否显著?解:当:r10.83时,Z1 1/2ln(1+0.83)-ln(1-0.83)1.1881 当:r20.81时,Z2 1/2ln(1+0.81)-ln(1-0.0.81
9、)1.1270 Z1-Z2 U=1/(n1-3)+1/(n2-3)=1/(14-3)+1/(11-3)=0.1315因为:U0.05(双侧)1.96 0.13150.05结论:接受H0:P1=P2 r1与r2两个相关系数间的差异不显著。,6、相关系数的合并:a、必须是相关系数间无显著差异才能合并。合并的原则:b、不是将r值平均,而是将Z值加权平均。Z值加权平均的公式为:(n3)Z Z 自由度上例(p288页,例6.17)r Z dfn3(n3)Z r10.83 Z1=1.1881 14-3=11 13.0691 r20.81 Z2=1.1270 11-3=8 9.0160 df19(n3)Z2
10、2.0851(n3)Z 22.0851 Z 自由度=19=1.1624 1+r因为:Z=1/2ln(1-r)所以:2Z=ln(1+r)/(1-r),取反对数:(1+r)/(1-r)antiln(2Z)1+rantiln(2Z)(1-r)1+r antiln(2Z)-antiln(2Z)r r+antiln(2Z)r antiln(2Z)-1 rantiln(2Z)+1=antiln(2Z)-1 antiln(2Z)-1 antiln(21.1624)-1 r antiln(2Z)+1 antiln(21.1624)+1 0.8218所以:水稻籽粒蛋白质含量与赖氨酸含量两个相关系数合并 后的相关
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 相关回归分析 相关 回归 分析 PPT 课件
链接地址:https://www.31ppt.com/p-5558032.html