直线相关回归简单回归分析.ppt
《直线相关回归简单回归分析.ppt》由会员分享,可在线阅读,更多相关《直线相关回归简单回归分析.ppt(83页珍藏版)》请在三一办公上搜索。
1、两变量关联性分析,第十一章,第一节 线性相关,什么是相关?,当所研究的两个事物或现象之间,既存在着密切的数量关系,又不象函数关系那样,能以一个变量的数值精确地求出另一个变量的数值,我们称这类变量之间的关系为相关关系,简称相关。,目的:研究事物或现象之间有无关系、关系的方向和密切程度。,线性相关(linear correlation)又称简单相关,用于双变量正态分布资料。,相关关系并不一定是因果关系,相关分析的任务就是对相关关系给以定量的描述。,第一节 线性相关,线性相关的性质和相关之间的密切程度:,1.正相关2.负相关3.无相关4.非线性相关,线性相关系数,(一)相关系数的意义,相关系数(co
2、efficient of correlation)又称积差相关系数(coefficient of product-moment correlation),以符号r表示。它是说明具有直线关系的两个变量间相关密切程度和相关方向的统计指标。,线性相关系数,(一)相关系数的意义,r0:正相关;r0:负相关;r=0:零相关;|r|=l:完全相关。,相关系数没有单位,其值为-1rl,线性相关系数,Pearson相关系数的计算公式,(二)相关系数的计算方法,线性相关系数,(二)相关系数的计算方法,相关系数的计算,例:某地一年级12名女大学生的体重与肺活量数据如下,试问肺活量(L)Y与体重(kg)X有无相关关
3、系?,体重X:42,42,46,46,46,50,50,50,52,52,58,58。肺活量Y:2.55,2.20,2.75,2.40,2.80,2.81,3.41,3.10,3.46,2.85,3.50,3.00,X=592,Y=34.83,X2=29512,Y2=102.9833,XY=1736.32,n12,相关系数的假设检验,r是样本相关系数,它是总体相关系数的估计值。要判断X、Y间是否有相关关系,就要检验r是否来自总体相关系数为零的总体。常用t检验:,Sr为相关系数r的标准误自由度=n-2,1.t检验法,相关系数的假设检验,亦可按n-2,直接查附表13,r界值表,得P 值。,2.查表
4、法,例:就上例检验女大学生体重与肺活量间是否有直线相关关系,=0.05,本例,n=12,r=0.7495,=n 2=12 2=10,t 0.01(10)=3.169t=3.583.169,P0.01,按=0.05水准,拒绝H0,接受H1,故可以认为一年级女大学生体重与肺活量间呈正的直线相关,查表法:根据自由度=n-2=12-2=10,查附表13,r界值表r 0.05(10)=0.576r=0.74950.576,P0.05,按=0.05水准,拒绝H0,接受H1,故可以认为一年级女大学生体重与肺活量间呈正的直线相关,进行相关分析时的注意事项,线性相关表示两个变量之间的关系是双向的,当散点图出现直
5、线趋势时,再作分析。相关系数的计算只适用于两个变量都服从正态分布的资料。,样本相关系数是总体相关系数的一个估计值,与总体相关系数之间存在着抽样误差,必须作假设检验。相关分析是用相关系数来描述两个变量间相互关系的密切程度和方向,相关关系不一定是因果关系。出现异常值时慎用相关。,进行相关分析时的注意事项,第二节 秩相关(Spearman秩相关),秩相关,又称等级相关。适用于不服从正态分布的资料或总体分布未知的资料,属非参数统计方法。,一、秩相关的概念及其统计描述,例11-4 某地研究27岁急性白血病患儿的血小板数与出血症状程度之间的相关性,结果见表11-2。试用秩相关进行分析。,表11-2 患儿的
6、血小板和出血症状,编号 血小板数 秩次 出血症状 秩次 pq 1 121 1 11.5 11.5 2 138 2 9.0 18 3 165 3 7.0 21 4 310 4 3.5 14 5 426 5 9.0 45 6 540 6 9.0 54 7 740 7 3.5 24.5 8 1060 8 3.5 28 9 1260 9 3.5 31.510 1290 10 3.5 3511 1438 11 11.5 126.512 2004 12 3.5 42合计 78 78 451,步骤:1.将两变量X、Y成对的观察值分别从小到大排序编秩,以pi表示Xi的秩次,以qi表示Yi的秩次。2.观察值相同
7、的取平均秩次。3.将pi、qi直接替换原始数据,计算秩相关系数(rs)。,p=78,q=78,p2=650,q2=630,pq=451,n12,二、秩相关系数的统计推断,=0.05,当n50时,可查附表14,rs界值表,若统计量rs大于临界值,则拒绝H0假设。当n50时,可作t检验。,例11-4中,算得rs0.422,n12,查rs界值表,rsr12,0.1=0.503,P0.1,按0.05的水准,不拒绝H0,可认为急性白血病患儿的出血症状与血小板数之间无相关关系。,第三节 分类变量的关联性分析,例11-6 为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机收集了消化不良的婴儿82例,把该院儿科
8、所有消化不良的患儿视为一个总体的话,则该82例患儿可看作一份随机样本,对每个个体分别观察腹泻与否和喂养方式两种属性,试分析两种属性的关联性。,一、交叉分类22表的关联分析,表11-3 婴儿腹泻与喂养方式的关系,喂养方式 腹泻 合计 有 无 人工 30 10 40 母乳 17 25 42 合计 47 35 82,两种属性的关联性分析H0:喂养方式与婴儿腹泻间互相独立H1:喂养方式与婴儿腹泻间有关联 0.05,由于2=9.98 2 0.05(1)=3.84,故P0.05,按=0.05 水准拒绝H0,接受H1,故可以认为喂养方式与婴儿腹泻间存在关联性。,两分类变量的关联程度,可用pearson列联系
9、数来描述。,例11-7 有56份咽喉涂抹标本,把每份标本一分为二,依同样的条件分别接种于甲、乙两种培养基上,观察白喉杆菌的生长情况,结果见表11-5,问两种培养基的结果有无关联?,二、22配对资料的关联性分析,表11-5 两种培养基白喉杆菌生长情况 甲培养基 乙培养基 合 计 22(a)18(b)40 2(c)14(d)16合计 24 32 56,检验步骤:1建立假设:H0:两种培养基的结果之间互相独立H1:两种培养基的结果之间互相关联0.052计算2值,由于2=8.43 2 0.05(1)=3.84,故P0.05,按=0.05 水准拒绝H0,接受H1,故可认为两种培养基的结果之间存在关联性。
10、,pearson列联系数,例11-8 某地居民主要有三种祖籍,均流行甲状腺肿。为探讨甲状腺肿类型与祖籍是否有关联,现根据居民甲状腺肿筛查结果,按甲状腺肿类型与祖籍两种属性交叉分类,得表11-6的结果,问甲状腺肿类型与祖籍间有无关联?,三、RC表分类资料的关联性分析,表11-6 甲状腺肿类型与祖籍的关系,祖籍 甲状腺肿类型 合计 弥漫型 结节型 混合型甲 486 2 4 492乙 133 260 51 444丙 100 315 85 500合计 719 577 140 1436,两种属性的关联性分析H0:甲状腺肿类型与祖籍间无关联H1:甲状腺肿类型与祖籍间有关联 0.05,由于2=723.783
11、 2 0.05(4)=9.49,故P0.05,按=0.05 水准拒绝H0,接受H1,故可认为甲状腺肿类型与祖籍间有关联。,pearson列联系数,线性相关的概念,线性相关(linear correlation)又称简单相关,用于双变量正态分布资料。,相关关系并不一定是因果关系,相关分析的任务就是对相关关系给以定量的描述。,小 结,相关系数的意义,相关系数(coefficient of correlation)又称积差相关系数(coefficient of product-moment correlation),以符号r表示。它是说明具有直线关系的两个变量间相关密切程度和相关方向的统计指标。,小
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 直线 相关 回归 简单 分析

链接地址:https://www.31ppt.com/p-5803325.html