多元数据图表示法.ppt
《多元数据图表示法.ppt》由会员分享,可在线阅读,更多相关《多元数据图表示法.ppt(49页珍藏版)》请在三一办公上搜索。
1、第三章 多元数据图表示法,3.1 轮廓图3.2 雷达图3.3 调和曲线图3.4 星座图3.5 脸谱图,本章学习目标,领会作多元数据图的思想。会作简单的多元数据图形并且会分析图形。,第三章 多元数据图表示法,图形有助于我们对所研究数据的直观了解,如果能把一些多元数据直接显示在平面图上,便可以从图形一目了然地看出多元数据之间的关系。当只有一、二维数据时,可以使用通常的直角坐标系在平面上点图;当有三维数据时,也可以使用空间直角坐标系点图,但是已经不方便;当维数大于3时,用通常的方法已不能点图。但是在许多实际问题中,多元数据的维数都大于3。,例 考察北京、上海、陕西、甘肃四个省市人均生活消费支出情况,
2、选取以下五项指标,具体数据如下表:,多元数据图表示法的分类:一类是使高维空间的点与平面上的某种图形应,这种图形能反映高维数据的某些特点或数据间的某些关系;另一类是在尽可能多地保留原数据信息的原则下进行降维,若能使数据维数降至2或1维,则可在平面上点图。第二类分类方法可用后面介绍的主成分分析、因子分析等去解决。这一章只对第一类方法介绍四种图表示法,更多的方法可在有关专著中找到。,3.1 轮廓图,作图步骤为:(1)作平面坐标系,横坐标取 个点表示 个变量。(2)对给定的一次观测值,在 个点上的纵坐标(即高度)和它对应的变量取值成正比。(3)连接 个高度的顶点得一折线,则一次观测值的轮廓为一条多角折
3、线形。次观测值可画出 条折线,构成轮廓图。,下图画出四条折线为北京、上海、陕西、甘肃五项指标的数据即四个省市五项指标的轮廓。,轮廓图,由轮廓图可以看出:北京、上海的居民生活消费较高且相似;陕西、甘肃生活消费较低且相似。如果考察的样品较多,画折线时图形中可能出现重复点多,不便于区分哪个样品对应哪条折线,这时最好多用几种颜色或长短虚实等标志画出折线。,下表是我国华北地区5个省市2003年城镇居民家庭平均每人全年消费性支出的六项指标数据考虑微机的普及应用,图形的制作则通过电脑实现。轮廓图、矩阵散点图在SPSS中制作,雷达图则在EXCEL中实现。,表 华北5省市城镇居民家庭消费性支出,在SPSS中作轮
4、廓图的方法如下:(1)将原始数据输入SPSS中。把不同地区当成变量,而把支出指标当成观测。,作轮廓图时的数据组织形式,(2)选择菜单项GraphsLine,打开Line Charts对话框,如图。在对话框上方的三个选项用于选择轮廓图的形式,由于是这里是多变量作图,所以选择Multiple。在对话框下面的三个选项中选择Value of individual cases。单击Define按钮,打开Define Multiple Line对话框。,Line Charts对话框,(3)在Define Multiple Line对话框中,将代表不同地区的5个变量移入Lines Represent列表框中
5、,将代表支出指标的变量(variable)移入Variable框中。单击OK按钮,即可作出如图所示的轮廓图。从图中可以清楚地看出北京市几乎各项支出都排在第一,而山西省则几乎每项支出都是最低的。,Define Multiple Line对话框,轮廓图,散点图又称散布图,它是以点的分布反映变量之间相关关系的可视化方法。矩阵散点图则是一种反映多个变量之间相关关系的二维散点图。利用SPSS制作矩阵散点图的步骤如下:(1)在SPSS中按图11.6的形式组织数据,即把支出指标当成变量,而把不同地区当成观测。,图11.6 作散点图时的数据组织形式,(2)选择菜单项GraphsScatter,打开Scatte
6、r plot对话框,如图11.7。该对话框用于选择散点图的形式。选定Matrix,即矩阵散点图,单击Define按钮,打开Scatter plot Matrix对话框,如图11.8。,图11.7 Scatter plot对话框,图11.8 Scatter plot Matrix对话框,(3)在打开的Scatter plot Matrix对话框中,将食品、衣着、居住三个变量移入Matrix Variables列表框中,将标志变量region移入Label Cases by列表框中。(4)点击OK按钮,得到如图11.9所示的矩阵散点图。从图11.9可以看出,河北、山西、内蒙古在居住和食品消费支出方
7、面与北京、天津相比较低,食品与居住支出变量之间存在一定的线性关系。天津在衣着支出方面较低,与最低的河北接近,与最高居住支出形成鲜明对比。北京则除在居住支出方面低于天津外,其他方面支出均高于华北其他省市。内蒙古则在衣着支出方面仅次于北京,显示出某种特殊消费特征。,矩阵散点图,3.2 雷达图,作图步骤:(1)作一圆,并把圆周分为 等分。(2)连接圆心和各分点,把这 条半径依次定义为各变量的坐标轴,并标以适当的刻度。(3)对给定的一次观测值,把它的 个分量值分别点在相应的坐标轴上,然后连接成一个 边形,这个 边形就是 元观测值的图示,次观测值可画出 个 边形。,例如,根据前表中的数据,调用EXCEL
8、图表向导,即可制作出如图17所示的雷达图。图1画出了北京、天津和河北的雷达图,从图可以看出,三省市消费支出结构有较大差异。北京人均消费支出的各项指标都高,对应面积最大的六边形,其次是天津,在三个省市中面积最小的是河北,天津在居住支出方面与北京较为接近,而在衣着和交通、通讯支出方面则与河北接近。其他支出方面三地存在较大差异。利用雷达图的形状、面积大小,可以对样品进行初始分类分析。为了加强雷达图的效果,在雷达图中适当的分配坐标轴是很重要的,具体的分配办法要结合分析的问题而定。例如可将要对比的指标分布在左、右或上、下方,以便于对比分析。,当观测次数n较大和指标较多时,画出的雷达图线段太多,图形的效果
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 数据 图表
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6109258.html