统计学教程相关与回归.ppt
《统计学教程相关与回归.ppt》由会员分享,可在线阅读,更多相关《统计学教程相关与回归.ppt(46页珍藏版)》请在三一办公上搜索。
1、相关与回归,第九讲,王晓莉,基本内容,相关与回归,3,医学上,许多现象之间都有相互联系,例如:身高与体重、父亲身高与儿子身高、体温与脉搏、产前检查与婴儿体重、乙肝病毒与乙肝等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。,相关与回归,4,变量之间的关系:乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之间是因果关系;有的现象之间因果不清,只是伴随关系,例如丈夫的身高和妻子的身高之间,就不能说有因果关系。,相关与回归,5,相关与回归就是用于研究和解释两个变量之间相互关系的。,相关与回归,6,主要内容,第一节 直线相关第二节 直线回归第三节 注意事项,第一节 直线相关,一、相关的类
2、型二、相关系数 相关系数的计算公式 相关系数的假设检验三、直线相关的意义,为研究父亲与成年儿子身高之间的关系,皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上。X上的数代表父亲身高,Y上的数代表儿子的身高1078个点形成图形是一个散点图。,相关与回归,9,散点图,为了确定相关变量之间的关系,收集一些数据,这些数据是成对的;然后在直角坐标系上描述这些点,这一组点集称为散点图。,相关的类型,正相关 负相关 完全正相关 完全负相关 称零相关,相关系数,样本的相关系数用r表示r的值在-1和1之间;r的绝对值越接近1,两变量的关联程度越强,r的绝对值越接近0,两变量的关联程度越弱;正相关时
3、,r值在0和1之间,这时一个变量增加,另一个变量也增加;负相关时,r值在-1和0之间,此时一个变量增加,另一个变量将减少。,相关系数的计算公式,一个产科医师发现孕妇尿中雌三醇含量与产儿的体重有关;于是设想,通过测量待产妇尿中雌三醇含量,可以预测产儿体重,以便对低出生体重进行预防。因此收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。问尿中雌三醇含量与产儿体重之间相关系数是多少?是正相关还是负相关?分析问题:总体-样本、目的、变量、关系,待产妇尿雌三醇含量与产儿体重关系,X=534Y=99.2 X2=9876 Y2=324.8XY=1750N=31,相关与回归,16,计算
4、结果,r的值说明了两个变量X与Y之间关联的密切程度(绝对值大小)与关联的性质(正负号)。,问题:我们能否得出结论:待产妇尿中雌三醇含量与产儿体重之间成正相关,相关系数是0.61。为什么?,从计算结果可以知道,31例待产妇尿中雌三醇含量与产儿体重之间程正相关,相关系数r0.61。,相关与回归,18,相关系数的假设检验,上例中的相关系数r等于0.61,说明了31例样本中雌三醇含量与出生体重之间存在相关关系。但是,这31例只是总体中的一个样本,由此得到的相关系数会存在抽样误差。因为,总体相关系数()为零时,由于抽样误差,从总体抽出的31例,其r可能不等于零。这就要对r进行假设检验,判断r不等于零是由
5、于抽样误差所致,还是两个变量之间确实存在相关关系。,相关与回归,19,相关系数的假设检验,常用t检验,选用统计量t的计算公式如下:,=n-2,相关与回归,20,1.H0:=0 H1:0 2.=0.05 3.t=,=n-2=31-2=29,t=4.14,4.确定P值:查t值表,t 0.05(29)=2.045 t=4.142.045,由t所推断的P值小于0.055.结论:按=0.05水准拒绝?,接受?,认为临产妇24小时内尿中雌三醇浓度与产儿体重之间有正相关关系。,直线相关的意义,在确实存在相关关系的前提下(?),如果r的绝对值越大,说明两个变量之间的关联程度越强,那么,已知一个变量对预测另一个
6、变量越有帮助;如果r绝对值越小,则说明两个变量之间的关系越弱,一个变量的信息对猜测另一个变量的值无多大帮助。一般说来,当样本量较大,并对r进行假设检验,有统计学意义时,r的绝对值大于0.7,则表示两个变量高度相关;r的绝对值大于0.4,小于等于0.7时,则表示两个变量之间中度相关;r的绝对值大于0.2,小于等于0.4时,则两个变量低度相关。,雌三醇含量与产儿体重有相关关系:如果知道了一位待产妇的尿雌三醇含量能推断出产儿的体重吗?能预测产儿的体重可能在什么范围内?这要用直线回归的方法来解决。,第二节 直线回归,一、回归方程二、回归系数三、回归系数的假设检验四、直线回归的应用,一个人的快乐,不是因
7、为他拥有的多,而是因为他计较的少,休息,相关与回归,24,一、回归方程二、回归系数三、回归系数的假设检验四、直线回归的应用,第二节 直线回归,相关与回归,25,知道了两个变量之间有直线相关关系,并且一个变量的变化会引起另一个变量的变化,这时,如果它们之间存在准确、严格的关系,它们的变化可用函数方程来表示,叫它们是函数关系,它们之间的关系式叫函数方程。,相关与回归,26,实际上,由于其它因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程反映,为了区别于两变量间的函数方程,我们称这种关系式为直线回归方程,这种关系为直线回归。,相关与回归,27,直线回归就是用来描述一个变量如何依赖
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 教程 相关 回归

链接地址:https://www.31ppt.com/p-6332805.html