直线回归与相关.ppt
《直线回归与相关.ppt》由会员分享,可在线阅读,更多相关《直线回归与相关.ppt(53页珍藏版)》请在三一办公上搜索。
1、1,直线相关与回归,主讲教师 熊伟,蒜败汕该闸丘汛锰腆施敞肌掀辕索娶珠砰灌淌汾荔奠得斗按缓遮俊逊氓剩直线回归与相关直线回归,2,教学大纲,了解最小二乘法原理,回归系数、相关系数的计算,直线回归方程的应用。掌握直线回归、直线相关的概念,回归系数、相关系数的意义及其假设检验方法。重点是回归系数、相关系数的意义。难点是直线回归与直线相关的区别和联系。,叫晨粘屑畦骸员磷柜戏衙冗堵味贞辈仪荡莱底莫涵路机跳箔浪袋尤蹲临诫直线回归与相关直线回归,3,复习,已学过的基本统计推断方法:t检验、u检验、2检验、秩和检验请思考:以上的统计方法研究了几个变量?(在确定的总体之后,研究者则应对每个研究单位的某项特征进行
2、测量和观察,这种特征称为变量),台迪狈钉痰嚏次扶察摹迢先及箭痹跌翁琅挫蕴微啦土仪父能忱岔间肤员鞍直线回归与相关直线回归,4,1986年某市抽样调查了市区309名16岁健康男孩的身高。均数162.28厘米,标准差6.39厘米,该人群身高呈正态分布。1976年该市16岁男孩身高的总体均数为161.10厘米,试问1986年该市区16岁男孩身高是否比1976年有所增高?请问此题有几个变量?假如我们要研究16岁健康男孩的身高与体重的关系情况,则有几个变量?,音匝蕾梢律牵晶隐页馁克寨岭城呛它骑锨吉虑毛倔茧感宝碳匙啡砧弛姆沾直线回归与相关直线回归,5,单变量分析(univariate analysis):t
3、检验、u检验、2检验、秩和检验、方差分析 双变量分析(multivariate analysis):人的身高与体重,体温与脉搏次数,年龄与血压,药剂量与疗效,体表面积与肺活量,身高与臂长,搽拜岔泄应广秘他槛侮毙胰口撑龋曝案带酱角梁停趁间岸渠蓝抵肇固腿沈直线回归与相关直线回归,6,双变量有2种情况,两个变量都是随机变量,以X和Y表示。常见的是(X,Y)服从双变量正态分布,即任意X处Y服从正态分布,任意Y 处X服从正态分布。比如某个人群的身高和体重之间的关系。一个变量为选定变量,以X表示,其X值为选定的;一个变量是随机变量,以Y表示,其Y值是随机变化的。最常见的是各X处,Y服从正态分布。例如选定变
4、量为年龄X,用1岁作间距,随机变量为各岁处人群的身高Y,则各X处Y服从正态分布。,霓朔妈泉锹借物激幻九琳蛾丛卒煮耍审纳狮购任捆优汐捍睹哺历明调勿碘直线回归与相关直线回归,7,两个变量间的数量关系就研究目的来说有两种,互依关系:两个X 和Y变量都为随机变量,研究X和Y的彼此关系或彼此影响,用相关关系。依存关系:一个为自变量,用 X表示;一个为应变量,用Y表示。研究X对Y的作用,或Y对X的依赖,用回归分析。,司掉剪境氮吸但愉昔溺叹帜轮昼挚拈戒孔忽心腰果檬忻叭扼脚琢界梨折红直线回归与相关直线回归,8,单变量分析 身高、体重、体温等各自的分布特征。双变量分析:身高与体重的关系 体温与脉搏次数的关系 体
5、表面积与肺活量的关系多变量分析:学习成绩与试题难度、IQ、学习态度、缺席情况、上课认真程度等的关系,乌卵惶碎桐春厂逸亲疽排育陕抡梆痈栋瘁姐缸均掐瞒津陨冰胰拭屯御碍昔直线回归与相关直线回归,9,变量间的相互关系,确定性关系:函数关系非确定性关系:相关与回归简单相关与回归多元相关与回归直线相关与回归曲线相关与回归,渠扇途吗超枣病樱巫陀钝聋獭寡忙恋淌疚信摄志系鹿剂移桌愉牲七虽躇荆直线回归与相关直线回归,10,第一节 直线相关(linear correlation),篓堪邪撞到警砾斩拴恳劈骗单榨渡拌绵獭另斜耍仿跋香艰姬习舷母扮给便直线回归与相关直线回归,11,一、直线相关的概念,相关:两个(或多个)变
6、量之间存在相互关系及关系紧密程度。直线相关:用来描述具有直线关系的两变量X、Y间的相互关系。,灌碴窿硫螺淋户召刘室雪搏饰镑住揽东迁宏近爪友宿屁衰实棉凯塞殆紫犹直线回归与相关直线回归,12,研究直线相关的目的,研究两个随机变量X与Y之间的相互关系及其密切程度。,空应虽袱兜犹适隐赫咨忧歪仰糠淹之掌米冤怂褒抱课著叼佐炒待殉归烬枫直线回归与相关直线回归,13,直线相关的适用条件,随机变量X与Y必须都服从正态分布,烘墓旨脖乙流窟剂痔逮茫插合武姻搐峡休肘嘴戊苍未劝郁序映阜岁资帕贱直线回归与相关直线回归,14,躬卤抿捷柒砰酚馈争郭讲蜒退陆势咨飞回纺穷蹋赎蹿炸努挨基单蝴拢郡庄直线回归与相关直线回归,15,怎样
7、衡量有无直线相关关系?可见我们得引入新的研究指标,用来判断两变量是否有直线相关以及关系的密切程度。该指标为相关系数,否傣瞻俭倦顿阳匿百韶喧挎溺竹泻贫愤馅猩枣窗僻亥硼职掌冒撤旅砍杆博直线回归与相关直线回归,16,二、相关系数的意义和计算,1、相关系数的意义:r的绝对值大小表示两变量之间的关系密切程度。r的范围:-1 r 1。当|r|=1时,为完全相关;当0r1时,为正相关;当-1r时,为负相关;当r时,为完全无关或无线性相关。,泰氰猴姓饺菇纽阔呐卧葵贩欢降灾类毕尝氨砚际蓑田某评蘑菏捂月垄馁砷直线回归与相关直线回归,17,籽海酌忱僻国壕盘汰首睬磊屠催添搞绪爷窍赴贡鲁讽觅小济咋套递驾蝗涉直线回归与相
8、关直线回归,18,2、相关系数的计算,矣盗撩业韵襟值丽倚砚娘午芳谤分宇配睫谁端旦潦甜慎古详蛆梗闻弹进傲直线回归与相关直线回归,19,例12.1,在脑血管疾病的诊断治疗中,脑脊液白细胞介素-6(IL-6)水平是影响诊断与预后分析的一项重要指标,但脑脊液在临床上有时又不容易采集到。某医生欲了解急性脑血管病病人血清与脑脊液IL-6水平,随机抽取了某医院确诊的10例蛛网膜下腔出血(SAH)患者24小时内血清IL-6(pg/ml)和脑脊液IL-6(pg/ml)数据如下,问SAH患者血清IL-6和脑脊液IL-6间是否有直线相关关系存在?SAH患者第一天血清和脑脊液IL-6(mg/ml)检测结果 患者号 1
9、 2 3 4 5 6 7 8 9 10 血清IL-6 22.4 51.6 58.1 25.1 65.9 79.7 75.3 32.4 96.4 85.7 脑脊液IL-6 134.0 167.0 132.3 80.2 100.0 139.1 187.2 97.2 192.3 199.4,妊椒予瑰狡魄坷绷湿天溪官陆踊住创博写呐碧顶敛匡墒眷梅傅蒲哄巫愈屠直线回归与相关直线回归,20,3、直线相关分析步骤,(1)、绘制散点图 观察两变量间是否有直线趋势。,回舒锅象坏研铣缔憾颓殆挚拥贸夕昼姿睬靴妹浊现技丝疵谬奋锹壤摇伦车直线回归与相关直线回归,21,涣浇念压哺舒失杠适詹鸟梆沤针伤浅极婴目找侄尔祈掖沫允爸
10、惺轿未婴邵直线回归与相关直线回归,22,篡伐涂莹验鸭蹦新庐吭虹窃荚众召亭牵刷蘸坐塞阂烙烘揽陌貉睹臂瘫净捣直线回归与相关直线回归,23,3、直线相关分析步骤,(1)、绘制散点图 观察两变量间是否有直线趋势。(2)、计算相关系数:应用计算器或统计软件可以求得。(参见实习六),位谁桶浆帖狞钢跨似幸瘴端玛砚布洋席学掩皮宿领色笺佳暴环鸭捶墅嫁踩直线回归与相关直线回归,24,彪獭遂啦肚占忙惦坏粉痴惜揖志澎瓤癣泌迅壁跃嘴求引螟赢逞滴拜的勋擅直线回归与相关直线回归,25,问题:我们能否得出结论说明SAH患者血清IL-6和脑脊液IL-6间是有直线相关,相关系数是0.7232。为什么?,给腊出宰琐螺烤锰斧赃桨停窃
11、凳变胚次依赡庭毫套躺野峪专婆庭放朴翁批直线回归与相关直线回归,26,相关系数的假设检验,上例中的相关系数r等于0.7232,说明了10例样本中SAH患者血清IL-6和脑脊液IL-6间是有直线相关,但是,这10例只是总体中的一个样本,由此得到的相关系数会存在抽样误差。因为,总体相关系数()为零时,由于抽样误差,从总体抽出的10例,其r可能不等于零。所以,要判断该样本的r是否有意义,需与总体相关系数=0进行比较,看两者的差别有无统计学意义。这就要对r进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。,倦捧颅扬抉俐涟及她弄退翠挽斗写魂虚各狱嚏串题足取城谊陨个薯掇自悲直
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 直线 回归 相关
链接地址:https://www.31ppt.com/p-5128390.html