EXCEL与数据分析.ppt
《EXCEL与数据分析.ppt》由会员分享,可在线阅读,更多相关《EXCEL与数据分析.ppt(44页珍藏版)》请在三一办公上搜索。
1、授课教师:马银戌,第四章 数据间的相关性分析,第一节 数据间的相关性,第二节 相关图表与相关关系 的初步判断,本章主要教学内容,第三节 相关系数的计算和分析,第四节 线性回归分析,第一节 数据间的相关性,一、函数关系和相关关系 二、线性相关和非线性相关 三、正线性相关和负线性相关,一、函数关系和相关关系,任何事物都不是孤立存在的,总会与其他事物有或多或少的联系,其运行轨迹会受到其他事物的影响,同时也影响着其他事物的发展。因此,仅从事物本身出发研究其特征和规律是不全面的,还应对事物之间的相关性进行分析。在自然界和社会现象中,客观现象之间的数量关系其通常有两种类型,即:,现象之间的数量关系,函数关
2、系,相关关系,函数关系是现象(变量)之间客观存在的确定性的数量对应关系。,如:圆面积与半径的关系。,相关关系即现象(变量)之间客观存在的非确定性的数量依存关系。,即当一个现象取一定值时,与其相对应的另一个现象的值不完全确定,而是有多个值与其对应。,例如:消费支出与消费收入的关系、学习成绩与学习时间的关系、亩产量和浇水量之间的关系、企业生产规模和综合单位成本之间的关系等。,二、线性相关和非线性相关,事物间的相关性又可以从相关的表现形式划分为线性相关和非线性相关。,线性相关:,相关的两个事物的对应值画在直角坐标图上,其数据散布点趋向直线形式,则称为线性相关。如商品的销售量与销售额之间就是一种线性相
3、关关系。,非线性相关:,如果其散布点分布趋向某种曲线形式,则称为非线性(曲线)相关。,例如,随着家庭年收入的增长,购买轿车的可能性也会增加。但当年收入处在较低水平时,年收入增加,轿车的购买量增长幅度不会很大;当年收入达到一定水平时,购买量的增长幅度会较大;而当年收入达到一个较高水平时,购买量的增长幅度将会再次保持平稳。这就是一个典型的非线性相关关系。,线性相关关系是有方向性的,按照相关的方向不同可以分为正线性相关和负线性相关。,负相关:,如果自变量x的数值增加(或减少),因变量y的数值则随之减少(或增加),即自变量与因变量的变动方向是相反的,这种相关关系称为负相关。如商品的价格和销售量之间的关
4、系。,三、正线性相关和负线性相关,正相关:,当自变量x数值增加(或减少)时,因变量y的数值也将随之相应的增加(或减少),这种相关关系称为正相关。如学习时间和学习成绩之间的关系。,第二节 相关表、相关图与相关关系的初步判断,一、相关表的制作 二、相关图的制作 三、相关关系的初步判断,(一)定性分析,(二)定量分析,相关表,相关图,相关系数,分析和判断两数值型数据间的相关性,可采用理论分析(定性分析)方法和定量分析方法两大类。定量分析方法又包括图表分析方法和数值分析方法。数据间相关性的初步判断可通过定性分析及定量分析中的图表分析方法。,一、相关表的制作,相关表是用来观察两个现象之间是否具有相关关系
5、的数据表格,它是将数据表格中的其中一个现象进行排序(降序或升序均可),然后观察另一个数据随着前一个数据的增加或减少是否呈现出有规律的变化,从而初步判断两个现象之间是否具有相关关系。相关表的制作很简单,将两个现象的数据分别两列录入Excel,然后将其中一列排序即可。,表4-1 学习时间与学习成绩相关表,二、相关图的制作,相关图又称散点图,它是将相关表中的数值在平面直角坐标系中用坐标点描绘出来,以表明相关数据点的分布状况。通过相关图可观察两个现象之间关系的总体模式,初步判断它们之间是否具有相关关系以及相关关系的强弱程度和相关的方向。,相关图的制作步骤:(1)将搜集的两个现象的数据分两列录入Exce
6、l表;(2)选中制作图表的数据区域;,(3)点击“插入”点击“图表”,出现“图表向导”的复选框;或直接在Excel表上方的工具栏中点击图表向导:,(4)在“图表类型”中选择“XY散点图”,并选择“子图表类型”中的第一类;(5)单击“下一步”“下一步”,填写图表标题及X轴和Y轴的标题;(6)单击“下一步”单击“完成”。案例:分析我国固定资产投资与GDP的相关性。,相关图描述了两个现象之间的大致关系,比较典型的形态有以下几种:(1)所有点均落在左下右上的一条直线上,表明数据间为完全正相关;(2)所有点均落在左上右下的一条直线上,表明数据间为完全负相关;上述两种情况表明两个事物之间是函数关系,而不是
7、相关关系。(3)数据点杂乱无章,从形态上看不出任何特征和规律,表明现象之间不相关。,(1)数据点大致落在左下右上的一条直线周围,表明数据间存在正线性相关关系;(2)数据点大致落在左上右下的一条直线周围,表明数据间存在负线性相关关系;(3)数据点大致呈现某种曲线形态,如抛物线等,表明现象之间不存在线性相关关系,但存在非线性相关关系。几种主要的相关图形如下:,完全正相关,不相关,几种主要的相关图,完全负相关,直线相关,曲线相关,学习时间,学习成绩,商品价格,购买量,正相关,负相关,几种主要的相关图,第三节 相关系数的计算和分析,一、相关系数的含义二、相关系数的计算三、案例分析,一、相关系数的含义,
8、(一)相关系数的概念 相关表和相关图虽然能够直观展现数据之间的相关关系,但只是大概,不精确。(简单)相关系数是线性相关条件下,用来说明两个变量之间相关关系密切程度和相关方向的统计指标。它通过数字的方式准确描述了数据间线性相关的方向和强弱程度。,相关系数是一个用来度量数值型数据间的线性相关关系的系数,不受变量值计量单位的影响,一般记为 r。其数学定义为:,(二)相关系数r 的取值范围,1r+1,(三)相关系数r 的取值含义,或,0r1,二、相关系数的计算,在EXCEL中,相关系数的计算可通过“数据分析”命令计算。基本操作步骤如下:,(1)选择“工具”菜单中的“数据分析”命令,出现如下对话框:,(
9、2)选择“相关系数”,单击“确定”,出现“相关系数”的复选框:,(3)在“输入区域”框中输入待分析数据所在的单元格地址,并在“输出选项”中进行选择,单击“确定”,即可出现相关系数的计算结果。,三、案例分析,根据我国2010年各地区GDP和固定资产投资、居民消费水平的数据资料,分析固定资产投资、居民消费水平与各地区GDP之间的相关性。,利用EXCEL计算的相关系数结果为:,计算结果表明,各地区固定资产投资与地区生产总值的相关系数为0.8881,说明固定资产投资与地区生产总值之间为高度正相关;各地区居民消费水平与地区生产总值的相关系数为0.4058,说明居民消费水平与地区生产总值之间为低度正相关。
10、上述数据分析结果显示,我国的经济增长方式主要为投资拉动型,固定资产投资是拉动经济增长的主要因素,而居民消费对经济增长的拉动不力。从长远的意义来看,这种状态不利于国民经济的可持续发展,因此,政府应通过制定相应的政策转变经济增长方式,约束投资的数量,提高投资的质量;并进一步采取有效政策,引导和鼓励居民消费,提高居民消费水平和消费质量。,第四节 线性回归分析,一、相关分析与回归分析的关系 二、简单线性回归分析 三、回归分析的EXCEL实现,一、相关分析与回归分析的关系,回归分析就是对具有相关关系的多个变量之间的数量变化进行数量测定,配合一定的数学方程(模型),以便由自变量的数值对因变量的可能值进行估
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- EXCEL 数据 分析
链接地址:https://www.31ppt.com/p-5429873.html