第8章整理ppt.ppt
《第8章整理ppt.ppt》由会员分享,可在线阅读,更多相关《第8章整理ppt.ppt(86页珍藏版)》请在三一办公上搜索。
1、第八章 相关分析与回归分析,(教材第十一、十二章),第一节 相关分析,现象(变量)间的关系,函数关系:用函数表达式表示一一对应的精确关系,无关系,依存关系,相关关系:变量间存在依存关系,但非一一对应的精确关系,函数关系,它反映着现象之间存在着严格的依存关系,也就是具有确定性的对应关系,这种关系可用一个数学表达式反映出来。若两个现象x、y有严格的直线依存关系,则其函数关系还可用右图表示。,x0,y0,某种商品的销售额(y)与销售量(x)之间的关系可表示为 y=p x(p 为单价)圆的面积(S)与半径之间的关系可表示为S=R2 企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价
2、格(x3)之间的关系可表示为y=x1 x2 x3,相关关系,它反映着现象之间在数量上不严格的依存关系,也就是说两者之间不具有确定性的对应关系,这种关系有二个明显特点:,现象之间确实存在数量上的依存关系,即某一社会经济现象变化要引起另一社会经济现象的变化;,现象之间的这种依存关系是不严格的,即无法用数学公式准确表示。,若现象间这种不严格的依存关系近似一种直线关系,则其相关关系的图示如右,为线性相关。,商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的
3、关系父亲身高(y)与子女身高(x)之间的关系,根据涉及变量多少:简单相关和复相关,相关关系类型,根据关系表现形式:线性相关和非线性相关,根据关系密切程度:完全相关、不完全相关和不相关,根据关系变动趋向:正相关和负相关,二因素之间的相关关系称单相关 三个或三个以上因素的相关关系称复相关在实际分析时,如存在多个变量与某变量存在关系时,可抓住其中主要的变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为偏相关,线性相关是指两个相关现象之间,当一变量X的数值发生变动时,另一变量y随之发生近似于固定比例的变动,其散点图近似地表现为直线形式,因此称其为直线或线性相关关系。非线性相关是指两个相关现
4、象之间,当一变量X的数值发生变动时,另一变量y也随之发生变动,但这种变动在数值上不成固定比例,在相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其为非线性或曲线相关关系。,完全相关就是相关现象之间的关系是完全确定的关系,因而完全相关关系就是函数关系。不相关是指两现象之间在数量上的变化上各自独立,互不影响。不完全相关就是介于完全相关和不相关之间的一种相关关系。相关分析的对象主要是不完全相关关系。,正相关是指两相关现象变化的方向是一致的。负相关是指两相关现象变化的方向是相反的。,相关分析与回归分析的区别,1.在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量
5、,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。2.相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。3.相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。,相关分析与回归分析的联系,相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析
6、寻求其相关的具体形式才有意义。,相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。,相关分析的主要内容:,判断社会经济现象之间是否存在相互依存的关系,是直线相关,还是曲线相关,这是相关分析的出发点;确定相关关系的密切程度;即测定两个变量之间的一般关系值;相关系数的显著性检验。,相关关系的度量:散点图与相关系数,散点图又称相关图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上,用来反映两变量之间的相关关系。,未分组数据的散点图,分组数据的散点图,相关系数(简单线性),相关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综合性指标。一般地,若用样本数据计算,
7、记为r;若用总体全部数据计算,则称为总体相关系数,记为。,简单线性相关系数r的测定方法:,积差相关系数,例题,相关系数的函数形式:CORREL或者,数据分析相关系数,对r的解释(即r的特点):,(1)r取正值或负值决定于分子项(协方差);(2)r的绝对值,在0与1之间;(3)r的绝对值大小,可说明现象之间相关关系的紧密程度。,r,实际应用与判断的一般准则,上例中,r=0.98,为高度相关,从单变量(单项式)分组表计算相关系数,Spearman(斯皮尔曼)等级相关系数(二列等级相关系数),r=0.676,考试成绩与产量之间:,我们观察到这两个变量间密切程度很高,但所计算出来的相关系数值并不高,为
8、什么?非线性关系。,如果用两个变量等级值计算相关系数,,r=?,r=1,斯皮尔曼等级相关对数据条件的要求没有严格要求,只要两个变量观测值是成对的等级评定资料,或是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究。,Di为对应的等级值之差,n为观测值组的个数或样本单位数,10名五年级学生数学成绩(X)与参与课堂学习的态度(Y)的资料如下表。据此判断,学习成绩与学习态度之间是否存在相关的联系?,两者之间高度相关,例题,当两组数据中,一个为连续型变量,另一个是绝对二分变量(即是绝对是非标志变量)时,用点二列相关系数表示两个变量的
9、相关程度。,点二列相关系数,表示绝对二分变量中某一类别频率较大者 表示绝对二分变量中另一类别频率较小者 表示与二分变量中p类别相对应的连续变量的平均数 表示与二分变量中q类别相对应的连续变量的平均数 表示连续变量的标准差,在某班随机抽取20个学生的语文考试成绩如下表所示。据此信息,以99%的把握推断:该班学生的语文考试成绩与学生性别之间是否存在必然关系?,例题,p=11/20=0.55,q=0.45,男生为p,女生为q,男生的平均数为 女生分数的平均数为,所有语文考试成绩的标准差:,对相关系数进行显著性检验给定=0.01,df=n-2=20-2=18,查积差相关系数临界值表,得临界值 0.56
10、14,学生语文考试成绩与学生性别之间的相关系数为0.396。,结论:学生语文考试成绩与性别无关,二列相关系数,当两组数据中,一个为连续型变量,另一个是相对二分变量(即是相对非标志变量)时,用点二列相关系数表示两个变量的相关程度。,表示相对二分变量中某一类别的频率 表示相对二分变量中另一类别的频率 表示与二分变量中p类别相对应的连续变量的平均数较大者 表示与二分变量中q类别相对应的连续变量的平均数较小者 表示连续变量的标准差 表示正态曲线下与P相对应的纵线高度,15名高中毕业生,重点中学5人,用“1”表示;非重点中学10人,用“0”表示,毕业考试平均成绩如下表所示。问毕业考试成绩是否与学校为重点
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 整理 ppt

链接地址:https://www.31ppt.com/p-4826679.html