数据分析方法与案例.ppt
《数据分析方法与案例.ppt》由会员分享,可在线阅读,更多相关《数据分析方法与案例.ppt(77页珍藏版)》请在三一办公上搜索。
1、2023-6-29,图并没有说谎,是说谎者在画图。Benjamin Disraeli,统计名言,第 2 章 用图表展示数据,2.1 用图表展示定性数据 2.2 用图表展示定量数据 2.3 合理使用图表,Display,2023-6-29,学习目标,定性数据的频数分布表定性数据的图示方法定量数据的频数分布表定量数据的图示方法用Excel和SPSS作频数分布表和图形合理使用图表,2023-6-29,用哪些图形展示奖牌?,2009年7月26日至8月3日第13届世界游泳锦标赛在意大利罗马举行。美国的泳坛霸主地位难以撼动,中国军团也创造了史上第二的佳绩在本届游泳世锦赛上,中国代表团取得金牌数和奖牌与美国
2、并列第一、奖牌榜排名第二的好成绩,而且中国男子游泳首次夺得世界性大赛的冠军并一举打破世界纪录。本届游泳世锦赛共设有奖牌227枚,其中金牌75枚、银牌75枚、铜牌77枚。下表是本届游泳世锦赛金牌总数取得前三名的国家所获得奖牌的分布情况,2023-6-29,用哪些图形展示奖牌?,根据上面的数据,你认为可以选择哪些图形来展示三个国家所获得的奖牌情况?学完本章的图表展示技术,这样的问题就会迎刃而解,2023-6-29,统计应用把数据画图之后,要用用脑袋,沃德(Abraham Wald)和许多统计学家一样,在第二次世界大战时也处理了战争与相关的问题。他发明的一些统计方法在战时被视为军事机密。以下是他提出
3、的概念中较简单的一种沃德被咨询飞机上什么部位应该加强钢板时,开始研究从战役中返航的军机上受敌军创伤的弹孔位置。他画了飞机的轮廓,并且标识出弹孔的位置。资料累积一段时间后,几乎把机身各部位都填满了。于是沃德建议,把剩下少数几个没有弹孔的部位补强。因为这些部位被击中的飞机都没有返航,资料来源:David S.Mroore,2.1 用图表展示定性数据 2.1.1 生成频数分布表 2.1.2 定性数据的图示,第 2 章 用图表展示数据,2.1.1 生成频数分布表,2.1 用图表展示定性数据,2023-6-29,生成频数分布表(定性数据),1.列出各类别,3.生成频数分布表,2023-6-29,定性数据
4、的描述统计量,频数(frequency):落在各类别中的数据个数比例(proportion):某一类别数据个数占全部数据个数的比值百分比(percentage):将对比的基数作为100而计算的比值比率(ratio):不同类别数值个数的比值,2023-6-29,生成频数分布表(定性数据),【例2-1】为研究人们对不同类型软饮料的偏好情况,一家调查公司在某超市随机调查了50名消费者。右表是顾客性别及其所偏好的饮料类型记录。生成频数分布表,观察不同性别的消费者及其所偏好的饮料类型的分布状况,并进行描述性分析,制作频数分布表,Excel,2023-6-29,使用Excel数据透视表计数(pivot t
5、able),第1步:选择【数据】菜单中的【数据透视表和数据透视图】第2步:确定数据源区域(在操作前将光标放在任意数据单元格 内,系统会自动选定数据源区域)第3步:在【向导3步骤之3】中选择数据透视表的输出位 置,然后选择【布局】第4步:在【向导布局】对话框中,依次将“饮料类型”拖至左 边的“行”(或列)区域,将“顾客性别”拖至“列”(或 行)区域,将“饮料类型”拖至“数据”区域。第5步:单击【确定】,自动返回【向导3步骤之3】对话 框。单击【完成】,用数据透视表生成定性数据的频数分布表,Excel,2023-6-29,生成频数分布表(列联表Excel),不同类型饮料和不同性别消费者的频数分布,
6、用数据透视表生成定性数据的频数分布,Excel,2023-6-29,用SPSS生成定性数据的频数分布表(单变量频数分布表),第1步:选择【分析】【描述统计频率】进入主 对话框第2步:将“饮料类型”或“顾客性别”选入【变量】;选中【显示频率表格】第3步(若需要描述统计量或图形)主点【统计量】或【图表】,并选择相应的选项。点击【确定】,生成频数分布表,SPSS,2023-6-29,生成频数分布表(定性数据SPSS),生成频数分布表,SPSS,2023-6-29,用SPSS生成定性数据的列联表(Crosstabulation交叉表),第1步:选择【分析】【描述统计-交叉表】进入主对话框第2步:将“饮
7、料类型”选入【行】,将“顾客性别”选 入【列】(行列可以互换)第3步:(若需要对列联表进行描述性分析)点击【单元格】,在【百分比】下选中需要的统计 量,如【行】、【列】、【总计】等;(若 需要图形)点击【复式条形图】。点击【确定】,生成交叉频数分布表,SPSS,2023-6-29,列联表的描述性分析(例题分析SPSS),列联表的统计描述,2023-6-29,列联表的描述性分析(例题分析SPSS),列联表的统计描述,2023-6-29,数据透视表(pivot table),可以从复杂的数据中提取有用的信息可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图形成一个符合需要的交叉表(列联表
8、)在利用数据透视表时,数据源表中的首行必须有列标题,数据透视表,Excel,2023-6-29,生成频数分布表(列联表Excel),大学生生活费支出的频数分布,2.1.2 定性数据的图示,2.1 用图表展示定性数据,2023-6-29,条形图(bar Chart),用宽度相同的条形的高度或长短来表示各类别数据各类别可放在纵轴,称为条形图,可以放在横轴,称为柱形图(column chart),2023-6-29,复式条形图(bar Chart),饮料类型和消费者性别的条形图(SPSS的输出),2023-6-29,帕累托图(pareto chart),按各类别数据出现的频数多少排序后绘制的条形图
9、用于展示分类数据的分布,2023-6-29,简单饼图(pie Chart),用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例用于研究结构问题,2023-6-29,环形图(doughnut chart),环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环用于结构比较研究,2023-6-29,环形图(doughnut chart),【例2-2】2011年北京、天津、上海和重庆地区按收入
10、法计算的地区生产总值(按当年价格计算)数据。绘制环形图比较四个地区的生产总值构成,绘制环形图,Excel,2023-6-29,环形图(doughnut chart),北京、天津、上海和重庆地区按收入法计算的地区生产总值,2.2 用图表展示定量数据 2.2.1 生成频数分布表 2.2.2 定量数据的图示,第 2 章 用图表展示数据,2.2.1 生成频数分布表,2.2 用图表展示定量数据,2023-6-29,生成频数分布表(例题分析),【例2-3】某电脑公司120天的销售额数据(单位:万元)。生成一张频数分布表观察销售额分布的特征,2023-6-29,生成频数分布表(例题分析),确定组数:组数的确
11、定应以能够显示数据的分布特征为目的。一般来说,组数大致等于样本量的平方根比较合适。本例可考虑分为10组 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距(最大值-最小值)组数 例如,本例最大值为237,最小值为141,组距=(237-141)109.6。为便于计算,组距宜取5或10的倍数,且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取10 统计出各组的频数。每个组的数据满足axb(上限值不在内(Excel的计数规则是axb),2023-6-29,分组中的几个概念,1.下限(lower li
12、mit):一个组的最小值2.上限(upper limit):一个组的最大值3.组距(class width):上限与下限之差4.组中值(class midpoint):下限与上限之间的中点值,制作频数分布,Excel,2023-6-29,生成频数分布表(例题分析),某电脑公司销售额的频数分布,2023-6-29,使用Excel频数函数(FREQUENCY),Excel的【直方图】工具的缺陷是:频数分布及直方图没有与数据链接,当改变任何一个数据时,频数分布表和直方图不会跟着改变使用统计函数【FREQUENCY】创建频数分布表和直方图可解决这一问题。具体步骤是选择与接受区域相临近的单元格区域,作为
13、频数分布表输出的区域选择统计函数中的【FREQUENCY】函数在对话框【Date-array】后输入数据区域,在【Bins-array】后输入接受区域同时按下“ctrl-shift-Enter”组合键,即得到频数分布,统计函数FREQUENCY,Excel,2023-6-29,用SPSS生成分组数据频数分布表(命令:重新编码为不同变量),第一步:点击【转换】【重新编码为不同变量】第二步:将变量选入【输入变量-输出变量】,并在【输出变量】【名称】中写入输出变量的名称(如“分组区间”),单击【更改】第三步:单击【新值和旧值】。在【旧值】下单击【范围】,并写入分组区间的下限和上限值(注意,计数时每个
14、组包含下限和上限值,即a=X=b)。单击【输出变量为字符串】。在【新值】后输入分组的区间,如140-150等(注意:为了和传统的统计分组相适应,这里不包含上限值。也可以输入140-149等),并单击【增加】重复上一步骤,直至将所有分组区间增加完毕。单击【继续】。单击【确定】(此时“分组区间”变量会保存在SPSS的【数据视图】窗口中)第四步:单击【分析】【描述统计】【频率】。将分组区间变量选入【变量】。单击【确定】(注:在【频率】中选择【图表】可以绘制条形图,修改条形图的宽度至100%即为直方图),2023-6-29,用SPSS生成频数分布表(命令:重新编码为不同变量),2023-6-29,用S
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 方法 案例

链接地址:https://www.31ppt.com/p-5356539.html