数据的图形展示.ppt
第三章 数据的图形展示,2023/10/14,重庆文理学院,统计学,第三章 数据的图形展示第一节 数据预处理第二节 品质数据的整理与展示第三节 数值型数据的整理与展示第四节 合理使用图表,第三章 数据的图形展示,2023/10/14,3.1.1 数据审核原始数据的审核 完整性。完整性审核主要是检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写齐全等。准确性。准确性审核主要检查数据是否有错误,是否存在异常值等。若异常值属于记录错误,则应予以纠正,若属于正常值,则予以保留。二手数据的审核 适用性。适用性审核主要是依据数据的来源、口径以及有关的背景材料,来确定这些数据是否符合本次分析研究的需要,是否需要重新加工整理等。,3.1 数据的预处理,第三章 数据的图形展示,2023/10/14,3.1.1 数据审核二手数据的审核 时效性。时效性审核主要是检查所取得的数据是否过于滞后,有无失去研究的意义。,3.1 数据的预处理,第三章 数据的图形展示,2023/10/14,3.1.2 数据筛选数据筛选。数据筛选一是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据选出来。筛选的Excel操作 1、自动筛选 选中数据表的第一行标志行,点击工具栏中的“数据/筛选/自动筛选”,Excel会在第一行的所有标志上添加自动筛选下拉复选框。用户可根据需要点击某一标志上的自动筛选下拉复选框,进行数据筛选。取消自动筛选只需要再次点击“数据/筛选/自动筛选”或点击“数据/筛选/显示全部”即可。,3.1 数据的预处理,第三章 数据的图形展示,2023/10/14,3.1.2 数据筛选 2、自定义筛选 先完成自动筛选的操作,然后选择某一标志上的自动筛选下拉复选框中的“(自定义)”来完成自定义筛选。3、高级筛选 首先设置筛选条件,方法是在某空白单元格输入某一标志,在此单元格之下的一个单元格输入选择的条件。其次选中数据区域中任意单元格,点击“数据/筛选/高级筛选”,在列表区域(L)添加被选择区域(包含标志与数据),在条件区域(C)添加筛选条件(包含标志与数据),确定。,3.1 数据的预处理,第三章 数据的图形展示,2023/10/14,3.1.2 数据筛选,3.1 数据的预处理,第三章 数据的图形展示,2023/10/14,3.1.3 数据的排序数据排序是按一定顺序将数据排列,以便于研究者通过游览数据发现一些明显的特征或趋势,找到解决问题的线索。排序也有助于对数据检查纠错,为重新归类或分组等提供依据。在某些场合,排序本身就是分析的目的之一。分类数据排序:如果是字母型数据,排序有升序与降序之分,如果是汉字型数据,排序方式很多。顺序数据排序:和分类变量值类似。数值型数据排序:数据的排序只有两种,即递增和递减。,3.1 数据的预处理,第三章 数据的图形展示,2023/10/14,3.1.3 数据的排序数据排序的Excel操作 选中数据区域任意一单元格,点击工具栏中的“数据/排序”,会出现排序设置对话框。此时对话框中的“主要关键字”中有许多选项可供排序优先选择。对图中的选项进行设置,即可完成排序。,3.1 数据的预处理,第三章 数据的图形展示,2023/10/14,3.1.3 数据的排序 对于定类数据和顺序数据,可进一步点击排序设置对话框中左下角的“选项(O)”,会出现更详细的排序方法。,3.1 数据的预处理,第三章 数据的图形展示,2023/10/14,3.1.4 数据透视表数据透视表。数据透视表是按照使用者的要求对数据进行分类汇总形成的一种交叉表(列联表),制作数据透视图时数据源表必须有标题。,3.1 数据的预处理,第三章 数据的图形展示,2023/10/14,3.1.4 数据透视表数据透视表的Excel操作 选中数据区域中任一单元格,点击“数据/数据透视表和数据透视图”,在出现的对话框中点击“下一步”,确定数据区域,点击“下一步”,选中“新工作表”或“现有工作表”,点击“布局”。,3.1 数据的预处理,第三章 数据的图形展示,2023/10/14,3.1.4 数据透视表数据透视表的Excel操作 在布局对话框中,依次将“性别”和“买衣物首选因素”托至左边的“行”区域,将“家庭所在地”托至上边的“列”区域,将“平均月生活费”和“月平均衣物支出”托至“数据”区域,点击“确定”。,3.1 数据的预处理,第三章 数据的图形展示,2023/10/14,3.2.1 分类数据的整理频数与频数分布 1、频数、频数分布、频数分布表 频数也称次数,是落在某一特定类别或组中的数据个数。把各个类别及其相应的频数全部列出来就是频数分布或称次数分布。将频数分布用表格的形式表现出来就是频数分布表。2、Excel操作 用Excel生成定性数据频数表最简单的方法是使用数据透视表进行计数和汇总。,3.2 品质数据的图形展示,第三章 数据的图形展示,2023/10/14,3.2.1 分类数据的整理频数与频数分布,3.2 品质数据的图形展示,第三章 数据的图形展示,2023/10/14,3.2.1 分类数据的整理分类数据的图示 1、条形图(Bar chart)条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。,3.2 品质数据的图形展示,第三章 数据的图形展示,2023/10/14,3.2.1 分类数据的整理分类数据的图示 2、饼图 圆形图主要用于表示总体中各组成部分所占的比例。,3.2 品质数据的图形展示,第三章 数据的图形展示,2023/10/14,3.2.1 分类数据的整理分类数据的图示 3、环形图 同时显示不同类别中次级类别所占的比例。,3.2 品质数据的图形展示,第三章 数据的图形展示,2023/10/14,3.2.2 顺序数据的数理累积频数和累积频率 1、累积频数 累积频数就是将各类别的频数逐级累加起来。通过累积频数,可以很容易看出某一类别(或数值)以下及某一类别(或数值)以上的频数之和。2、累积频率或百分比 累积频率或百分比就是将各类别的频率或百分比逐级累加起来,有向上累积和向下累积两种方法。,3.2 品质数据的图形展示,第三章 数据的图形展示,2023/10/14,3.2.2 顺序数据的数理累积频数和累积频率 3、Excel操作,3.2 品质数据的图形展示,第三章 数据的图形展示,2023/10/14,3.2.2 顺序数据的数理累积频数和累积频率,3.2 品质数据的图形展示,第三章 数据的图形展示,2023/10/14,3.2.2 顺序数据的数理 向下累积:在单元格H4输入公式“=SUM(B$4:B4)”,回车;选中H4单元格的右下角,将单元格向下拖至单元格H8。根据累计频数或累计频率,可以绘制累积频数分布或频率图。,3.2 品质数据的图形展示,第三章 数据的图形展示,2023/10/14,3.3.1 数据的分组数据分组 数据分组是为了观察数据的分布特征,将原始数据按照某种标准化分成不同的组别,分组后的数据称为分组数据。数据经分组后再计算出各组中数据的频数,就形成了一张频数分布表。单变量值分组是把每一个变量值作为一组,这种分组方法通常只适合于离散变量且变量值较少的情况。组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。在组距分组中,一个组的最小值称为下限(Low limit),最大值称为上限(Upper limit)。,3.3 数值型数据的图形展示,第三章 数据的图形展示,2023/10/14,3.3.1 数据的分组数据分组 组距分组的步骤:第一步:确定组数。一般地,组数k与数据总数n之间有如下经验关系:n20,取k=56;n=2060,取k=68;n=60100,取k=810;n=100500,取k=1020.第二步:确定各组的组距。组距(Class width)是一个组的上限与下限之差。如果各组的组距相等则称为等距分组。等距分组组距(最大值最小值)组数,3.3 数值型数据的图形展示,第三章 数据的图形展示,2023/10/14,3.3.1 数据的分组数据分组 第三步:将数据从小到大排序,并按照各组下限和上限进行分组。统计分组时习惯上规定“上组限不在内”,还可以计算出累积频数或累积频率。计算组中值和组频数 为反映各组内数据的一般水平,通常用组中值作为该组数据的一个代表值。组中值=(下限值+上限值)/2 将各组内的数据的个数称为组频数。组频数占总数据个数的比例称为组频率。,3.3 数值型数据的图形展示,第三章 数据的图形展示,2023/10/14,3.3.1 数据的分组数据分组 例题:,3.3 数值型数据的图形展示,第三章 数据的图形展示,2023/10/14,3.3.1 数据的分组数据分组 最小值为141,最大值为237。因第一组的下限低于最小值,最后一组的上限高于最大值。逐将数据范围扩至140240.分成10各组:140150;150160;160170;170180;180190;190200;200210;210220;220230;230240.上限不再组内,且Excel在制作频数分布表时,上限包含在组内。因此,直方图的接受域:139;149:159:169:179:189:199:219:229:239.,3.3 数值型数据的图形展示,第三章 数据的图形展示,2023/10/14,3.3.1 数据的分组数据分组 生成接受域:任选空白单元格,输入数值139,从该单元格开始,向下拖出一列,点击“编辑/填充/序列:步长值为10,确定”.组的下限和上限也用填充来生成。频数表用“工具/数据分析/直方图”;“图表输出(C)”,来完成。,3.3 数值型数据的图形展示,第三章 数据的图形展示,2023/10/14,数值型数据的图示分组数据:直方图 条形图、圆形图、环形图及累积分布图等都适用于显示数值型数据。直方图。在平面直角坐标中,横轴表示数据分组,纵轴表示频数或频率,这样,各组与相应的频数就形成了一个矩形,即直方图。,3.3 数值型数据的图形展示,第三章 数据的图形展示,2023/10/14,3.3.1 数据的分组分组数据:直方图 Excel操作方法参见频数表!,3.3 数值型数据的图形展示,第三章 数据的图形展示,2023/10/14,3.3.1 数据的分组时间序列数据:线图 线图主要反映现象随时间变化的特征。,3.3 数值型数据的图形展示,第三章 数据的图形展示,2023/10/14,3.3.1 数据的分组时间序列数据:线图,3.3 数值型数据的图形展示,第三章 数据的图形展示,2023/10/14,3.3.1 数据的分组多变量数据的图示 1、散点图 2、气泡图 3、雷达图,3.3 数值型数据的图形展示,第三章 数据的图形展示,2023/10/14,3.4.1 统计表的作用统计表 把搜集到的数字资料,经过汇总整理后,得出一些系统化的统计资料,将其按一定顺序填列在一定的表格内,这个表格就是统计表。统计表的作用 1、能使大量的统计资料系统化、条理化。2、便于比较各项目(指标)之间的关系,而且也便于计算。3、表述统计资料显得紧凑、简明、醒目,使人一目了然。4、易于检查数字的完整性和正确性。,3.4 统计表,第三章 数据的图形展示,2023/10/14,3.4.1 统计表的构成统计表的构成 统计表一般由四个主要部分组成,即表头、行标题、列标题和数字资料,必要时可以在统计表的下方加上表外附加。表头一般放在表的上方,它所说明的是统计表的主要内容。行标题和列标题通常安排在统计表的第一列和第一行,它所表示的主要是所研究问题的类别名称和指标名称。数字资料是对应于行标题与列标题的统计资料(数据)。表外附加通常放在统计表的下方,主要包括资料来源、指标的注释和必要的说明等内容。,3.4 统计表,第三章 数据的图形展示,2023/10/14,3.4.1 统计表的构成统计表的构成,3.4 统计表,第三章 数据的图形展示,2023/10/14,3.4.1 统计表的分类按主词加工方法不同分为类 从统计表的内容来看,可以分为两个组成部分:一部分是统计表所要说明的总体及其分组的名称,这一部分习惯上称为主词;另一部分则是说明总体的统计指标,包括指标名称和指标数值,这一部分习惯上称为宾词。1、简单表 表的主词未经任何分组的统计表为简单表。简单表的主词一般按时间顺序排列,或按总体各单位名称排列。简单表通常是对调查来的原始资料初步整理所采用的形式。,3.4 统计表,第三章 数据的图形展示,2023/10/14,3.4.1 统计表的分类按主词加工方法不同分为类,3.4 统计表,第三章 数据的图形展示,2023/10/14,3.4.1 统计表的分类按主词加工方法不同分为类 2、分组表 表的主词按照某一标志进行分组的统计表称为分组表。利用分组表可以提示不同类型现象的特征,说明现象内部的结构,分析现象之间的相互关系等。,3.4 统计表,第三章 数据的图形展示,2023/10/14,3.4.1 统计表的分类按主词加工方法不同分为类,3.4 统计表,第三章 数据的图形展示,2023/10/14,3.4.1 统计表的分类按主词加工方法不同分为类 3、复合表 表的主词按照两个或两个以上标志进行复合分组的统计表称为复合表。复合表能更深刻更详细地反映客观现象,但使用复合表恰如其分,并不是分组越细越好。,3.4 统计表,第三章 数据的图形展示,2023/10/14,3.4.1 统计表的分类按主词加工方法不同分为类,3.4 统计表,第三章 数据的图形展示,2023/10/14,3.4.1 统计表的分类按宾词指标设计的不同分类 1、宾词不分组表 即宾词各指标根据说明问题的主次先后顺序排列,保持各指标之间的一定逻辑关系。如表313所示。,3.4 统计表,第三章 数据的图形展示,2023/10/14,3.4.1 统计表的分类按宾词指标设计的不同分类 2、宾词简单分组表 即统计指标从不同角度分别按某一标志分组,各种分组平行排列。如表314所示。,3.4 统计表,第三章 数据的图形展示,2023/10/14,3.4.1 统计表的分类按宾词指标设计的不同分类 3、宾词复合分组表 即统计指标同时有层次地按两个或两个以上标志分组,各种分组重叠在一起。如表315 所示。,3.4 统计表,第三章 数据的图形展示,2023/10/14,3.4.2 统计表的设计要求 第一,行标题、列标题、数字资料的位置应安排合理。应使统计表的横竖长度比例适当,避免出现过高或过长的表格形式。第二,表头一般应包括表号、总标题和表中数据的单位等内容。总标题应简明确切地概括出统计表的内容,一般需要表明统计数据的时间(When)、地点(Where)以及何种数据(What),即标题内容应满足3W要求。第三,如果表中的全部数据都是同一计量单位,可放在表的右上角标明,若各指标的计量单位不同,则应放在每个指标后或单列出一列标明。,3.4 统计表,第三章 数据的图形展示,2023/10/14,3.4.2 统计表的设计要求 第四,通常情况下,统计表的左右两边不封口,列标题之间一般用竖线隔开,而行标题之间通常不必用横线隔开。表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一。对于没有数字的表格单元,一般用“”表示,一般填好的统计表不应出现空白单元格。第五,在使用统计表时,必要时可在表的下方加上注释,特别要注意注明资料来源,以表示对他人劳动成果的尊重,方便读者查阅使用。,3.4 统计表,第三章 数据的图形展示,2023/10/14,重点掌握:1、数据排序和筛选的Excel操作2、透视表的Excel操作3、直方图与频率表的Excel操作4、统计表的设计,第三章 小结,