[PPT模板]第3章数据的图表展示.ppt
《[PPT模板]第3章数据的图表展示.ppt》由会员分享,可在线阅读,更多相关《[PPT模板]第3章数据的图表展示.ppt(97页珍藏版)》请在三一办公上搜索。
1、第3章 数据的图表展示,数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。,3.1 数据的预处理,3.1.1 数据审核数据整理时,首先需要进行审核,以保证数据的质量,为进一步的整理与分析打下基础。,3.1 数据的预处理,对于通过直接调查取得的原始数据,应主要从完整性和准确性两个方面去审核。(1)完整性。应调查单位是否有遗漏,所有的调查项目或指标是否填写齐全。(2)准确性。主要审查数据资料是否真实地反映了客观实际情况,如内容是否符合实际;检查数据是否有错误;计算是否正确,是否存在异常值等。,3.1.1 数据审核,对于通过其他渠道取得的二手数据,除了对其完整性和
2、准确性进行审核外,还应着重审核数据的适用性和时效性。(1)适用性。有些二手数据可能是为特定目的通过专门调查而取得的,或者是已经按特定目的的需要做了加工整理。对于使用者来说,首先应弄清楚数据的来源、数据的口径以及有关的背景材料,以便确定这些数据是否符合自己分析研究的需要,是否需要重新加工整理等,不能盲目生搬硬套。(2)时效性。对于有些时效性较强的问题,如果所取得的数据过于滞后,可能失去了研究的意义。,3.1.1 数据审核,审核中发现的错误应尽可能予以纠正。如果对数据中发现的错误无法纠正,就需要对数据进行筛选。,3.1.1 数据审核,3.1.2 数据筛选 一是将某些不符合要求的数据或有明显错误的数
3、据予以剔除;二是将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除。,3.1 数据的预处理,例3-1 表3-1是8名学生4门课程的考试成绩数据(单位:分)。试找出统计学成绩等于75分的学生,英语成绩最高的前三名学生,四门课程成绩都大于70分的学生。,EXCEL操作(演示)数据筛选自动筛选统计学下拉三角选75确定数据筛选自动筛选英语下拉三角前10名将“10”改为“3”确定创建条件区域(字段,条件)数据筛选高级筛选选查询数据区域选条件区域确定,3.1.2 数据筛选,3.1.3 数据排序 数据排序是按一定顺序将数据排列,以便于研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线
4、索。排序还有助于对数据检查纠错,以及为重新归类或分组提供方便。,3.1 数据的预处理,在某些场合,排序本身就是分析的目的之一。如美国的财富杂志每年都要在全世界范围内排出500强企业,通过这一信息,不仅可以了解自己企业所处的地位,清楚自己的差距,还可以从一定侧面了解到竞争对手的状况,从而有效制定企业发展的规划和战略目标。排序后的数据称为顺序统计量。,3.1 数据的预处理,3.1.3 数据排序,如对表3-1按总分数从高到低排序。(见例3.1)数据排序主要关键字段中列降序确定(演示),3.1.3 数据排序,3.1.4 数据透视表利用数据透视表可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作
5、图,形成一个符合需要的交叉表(列联表)。在利用数据透视表时,数据源表中的首行必须有列标题。,3.1 数据的预处理,例3.2 在某大学随机抽取30名学生,调查他们的性别、家庭所在地、平均月生活费支出、平均每月买衣物支出和购买衣物时所考虑的首要因素等,得到的数据如表3-2所示。试建立一个数据透视表,在表的行变量中给出性别和购买衣物首选因素,在列变量中给出学生的家庭所在地,对平均月生活费支出和月平均购买衣物支出进行交叉汇总。,3.1.4 数据透视表,数据数据透视表和数据透视图选数据透视表,下一步选输出到新工作表或现有工作表,如选现有,要指定位置选布局,性别拖入行标志,买衣物首选因素拖入行标志,家庭所
6、在地拖入列标志,两个支出数据拖入数据区确定完成。(演示),数据透视表操作步骤:,注意:行字段、列字段、数据项的选择,不同的选择就会得到不同的数据透视表。本例中,性别和买衣物首选因素作为行字段,家庭所在地作为列字段,平均月生活费和月平均衣物支出作为数据字段。,3.1.4 数据透视表,3.2 品质数据的整理与展示,品质数据包括分类数据和顺序数据;不同类型的数据采取不同的处理方法;对品质数据做分类整理,对数值型数据则主要是做分组整理。,分类数据本身就是对事物的一种分类,因此在整理时除了列出所分的类别外,还要计算出每一类别的频数、频率或比例、比率,同时选择适当的图形进行显示,以便对数据及其特征有一个初
7、步的了解。,3.2.1 分类数据的整理与图示,1.频数与频数分布(1)频数(frequency)频数也称次数。频数是落在各类别中的数据个数。我们把各个类别及其相应的频数全部列出,并用表格形式表现出来,就是频数分布。将频数分布用表格的形式表现出来就是频数分布表。,3.2.1 分类数据的整理与图示,频数分布表的作法:第一步,单击“工具”菜单,选择“数据分析”选项。若无数据分析选项,可在工具菜单下选择“加载宏”,在弹出的对话框中选择“分析工具库”,便可出现数据分析选项;第二步,在“数据分析”中选择“直方图”;第三步,“输入区域”,“接收区域”,“输出区域”等的选择;选择“柏拉图”可以在输出表中同时按
8、降序排列频数数据;选择“累积百分率”可在输出表中增加一列累积百分比数值,并绘制一条百分比曲线;,表3-3 顾客性别及购买饮料类型,表3-4 不同类型饮料及顾客性别的频数分布(数据透视表),表3-5 不同类型饮料的频数分布,表3-6 不同性别顾客的频数分布,(2)比例一个样本(或总体)中各个部分的数值占全部数值的比重,通常用于反映总体的构成或结构。假定总体N个数据分成K个部分,每一部分的数据分别为 N1,N2,N3,NK 比例:Ni/N(i=1,2,K)显然,N1/N+N2/N+NK/N=1,3.2.1 分类数据的整理与图示,(3)百分比 将比例乘以100就是百分比或百分数,它是将对比的基数抽象
9、化为100而计算出来的,用%表示。当分子的数值很小而分母的数值很大时,我们也可以用千分数“”表示比例,如人口出生率、死亡率、自然增长率等都用千分数表示。,3.2.1 分类数据的整理与图示,(4)比率比率是各不相同类别数值之间的比值。比率可以是一个样本(或总体)中各不同部分的数量之比。比如,国内生产总值中第一、二、三产业之比等。比率也可以是同一现象在不同时间或空间上的数量之比,比如本年国内生产总值与上年国内生产总值进行对比,可以计算出经济增长率。不同地区国内生产总值进行对比,反映两个地区的经济发展水平差异。,3.2.1 分类数据的整理与图示,2.分类数据的图示用图形来显示频数分布,就会更形象直观
10、。一张好的统计图表,往往胜过冗长的文字表述。,3.2.1 分类数据的整理与图示,(1)条形图条形图是用宽度相同的条形的高度或长短来表示数据多少的。本节中条形图是用矩形的高度和长度来表示各类别数据的频数或频数分布的图形。条形图可以纵置或横置。当分类变量在不同时间或空间上有多个取值时,可以绘制对比条形图。演示例3.14,3.2.1 分类数据的整理与图示,图3-14 饮料类型和顾客性别的复式条形图,(2)帕累托图(Pareto chart)帕累托图是以意大利经济学家V.Pareto的名字命名的。它是按各类别数据出现的频数多少排序后绘制的柱形图。容易看出哪类数据出现的多,主要用于分析各个类别的影响顺序
11、。它的绘制可参见频数分布表中最后一步只需选中柏拉图即可。(演示),3.2.1 分类数据的整理与图示,(2)饼图(pie chart)饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组数据占全部数据的比例,对于研究结构性问题十分有用。,3.2.1 分类数据的整理与图示,图3-16 不同类型饮料构成的饼图,图3-17 按性别绘制的不同类型饮料构成的复式饼图,上面介绍的分类数据的频数分布和图示方法,也都适用于顺序数据的整理和显示。但一些适用于顺序数据的整理和显示方法,并不适用于分类数据。对于顺序数据,还可以计算累积频数和累积频率。,3.2.2 顺序数据的整理与图
12、示,3.2.2 顺序数据的整理与图示,1.累积频数和累积频率累积频数就是将各有序类别或组的频数逐级累加起来。累积频率或累积百分比是将各有序类别或组的百分比逐级累加起来。,向上累积,从小到大(或从低到高)的方向把频数顺序累加。向下累积,从大到小(或从高到低)的方向把频数顺序累加。通过累积频数,可以很容易看出某一类别以下或某一类别以上的频数之和。,3.2.2 顺序数据的整理与图示,【例3.5】在一项有关城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个是问题是:“您对您家庭目前的住房状况是否满意?”要求回答的类别依次如下:1.非常不满意;2.不满意;3.一般;4.满意;5.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- PPT模板 PPT模板第3章 数据的图表展示 PPT 模板 数据 图表 展示
链接地址:https://www.31ppt.com/p-4595807.html