第三章统计整理.ppt
第三章统计整理,1,第三章 统计整理,本章内容 第一节 统计整理的概念 第二节 统计分组与分配数列 第三节 统计图 第四节 统计表与统计汇总,下一页,返回目录,第三章统计整理,2,通过学习,让学生了解统计整理的概念、程序以及统计数据的预处理,了解和掌握统计分组的概念和作用、分组标志的选择、频数分布和累计频率,掌握应用Excel制作统计表和统计图。,第三章统计整理,3,引导案例:统计整理很重要二战前期德军势头很猛,英国从敦刻尔克撤回到本岛,德军每天不定期地对英国狂轰乱炸。后来英国空军发展起来,双方空战不断。为了提高飞机的防护能力,英国飞机设计师们决定给飞机增加护甲,但是设计师们并不清楚应该在什么地方增加护甲,于是请来了统计学家。统计学家将每架中弹之后仍能安全返航的飞机的中弹部位描绘在一张图上,然后将所有中弹飞机的图都叠放在一起,这样就形成了浓密不同的弹孔分布。工作完成了,然后统计学家说没有弹孔的地方就是应该增加护甲的地方,因为这个部位中弹的飞机都没能幸免于难。这个案例说明,学会统计整理有时是性命攸关的大事。,第三章统计整理,4,第一节 统计整理的概念,一、统计整理定义二、统计整理的内容三、EXCEL中统计整理工具,上一页,下一页,返回本章首页,第三章统计整理,5,一、统计整理的定义,统计整理是根据统计研究的任务,对统计调查所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的工作过程。,上一页,下一页,返回本节首页,第三章统计整理,6,二、统计整理的内容,对原始资料进行审核与检查。审核、检查被调查单位的资料是否齐全,有无迟报、不报、漏报的情况;如果报送已齐全,应审查有无差错。审查的办法主要有:逻辑性审查。它是利用逻辑理论检查指标之间或数据之间有无矛盾。例如,人口调查中,少年、儿童年龄段的居民不应有婚姻情况,文化程度不应是大学毕业以上,职务不应是工程师以上等。如果出现已婚、高级工程师,显然在逻辑上是不可能的,要进一步查实、更正。,上一页,下一页,返回本章首页,第三章统计整理,7,比较审查法。它是指标之间进行数据比较方式审查。例如规定某指标的数值必须大于或小于另一指标;某几个指标之和应小于或等于总和等。比如一个地区居民户数不能大于居民人数;固定资产净值必须小于固定资产原值等。凡是不符合上述规定要求的,必然是数据有问题,必须查清。,上一页,下一页,返回本章首页,第三章统计整理,8,设置疑问框审查。一般来说,指标之间存在一定的量值范围与比例关系,利用这种范围与比例关系,可以设置疑问框,从而审查数据是否有疑问。例如规定现价工业总产值与销售收入的比值不小于0.7,不大于1.5;工业净产值与现价总产值的比值不大于0.6,不小于0.2等。疑问框的设置不能相距过大,否则会遗漏有差错的数据;但是也不能过小,过小会使大量无差错的数据被检出来,增加审查的工作量。因此,疑问框的设计必须由对数据资料十分熟悉的人负责,不是随意设置的。,上一页,下一页,返回本章首页,第三章统计整理,9,发现数据差错以后,要分别不同情况及时纠正与处理,属于被调查单位填报错误的,应通知他们重新填报,属于汇总过程中的错误,应根据情况,予以修正。2.录入数据,建立数据表 数据表是指包含相关数据的一系列工作表的数据行。数据表可以作为数据库使用,其中行表示记录,列表示字段。,上一页,下一页,返回本节首页,第三章统计整理,10,3.数据排序与分组 一般来说,录入数据的数据是无序的,不能反映现象之本质与规律性。为了使用的方便,要将其进行排序、分组,以便数据按要求排列,同时使性质相同的数据归为一组,从而让它们之间的差异性显示出来。,上一页,下一页,返回本节首页,第三章统计整理,11,4.编制次数分布表与累计次数分布表 次数分布表可以表明各组间的单位数在总体中所出现的次数或所占比重,从而描述总体的内部结构,揭示总体中的关键因素与本质特征。累计次数分布则能够表明各标志值以上或以下所出现的次数或比重。,上一页,下一页,返回本节首页,第三章统计整理,12,统计图 各种各样的统计图可以形象、直观地表明数据的分布形态与发展变化的趋势。,上一页,下一页,返回本章首页,第三章统计整理,13,三、Excel中的统计整理工具,1.数据排序Excel可以根据用户的要求对数据表的行或列数据进行排序。排序时,Excel 将利用指定的排序顺序重新排列行、列或各单元格,从而使现象的规则性更加简洁地表现出来。,上一页,下一页,返回本节首页,第三章统计整理,14,2.频数分布函数 频数分布函数是Excel 的一个工作表函数,是编制次数分布的主要工具,通过频数分布函数,可以对数据进行分组与归类,从而使数据的分布形态更加清楚地表现出来。3.数据透视表 数据透视表是一种交互式工作表,用于对已有数据表和数据库中的数据进行汇总和分析的一种工具。,上一页,下一页,返回本节首页,第三章统计整理,15,4.统计图Excel可以绘制许多图表,其中大部分是统计图,可用于数据的整理与分析,能够直观形象地描述现象的数量规律性。,上一页,下一页,返回本节首页,第三章统计整理,16,第二节 统计分组与分配数列,一、统计分组的定义和作用二、分组标志的选择三、分配数列,上一页,下一页,返回本章首页,第三章统计整理,17,一、统计分组的定义和作用,统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分成若干组成部分的一种统计方法。在第一章中我们已经讲述过“变异”的概念,就是说在一个总体中,单位的品质标志或数量标志,其标志表现可能是互不相同的,总体内部各个单位间存在许多的变异标志又是人们把总体进一步分为性质不同的几个部分的客观依据。,上一页,下一页,返回本章首页,第三章统计整理,18,统计分组,对总体而言是“分”(分为范围更小的总体),而对总体单位而言是“合”(合为性质相同的组);对分组标志而言是“分”(按分组标志划分总体成为标志表现不同的许多组),而对其它标志来说又是“合”(其它标志表现的差异不考虑了)。,上一页,下一页,返回本章首页,第三章统计整理,19,统计分组的作用划分现象的类型揭示现象内部结构分析现象之间的依存关系,上一页,下一页,返回本章首页,第三章统计整理,20,二、分组标志的选择,按品质标志分组 如按性别分组,见表3-5,上一页,下一页,返回本章首页,第三章统计整理,21,按数量标志分组 单项式分组 见表3-6,上一页,下一页,返回本章首页,第三章统计整理,22,组距式分组 见表3-7,上一页,下一页,返回本章首页,第三章统计整理,23,三、分配数列,分配数列的概念与种类 在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为次数分配(布)或分配数列。分布在各组的个体单位数叫次数或频数,各组次数占总次数的比重叫频率。,上一页,下一页,返回本章首页,第三章统计整理,24,分配数列的种类,按品质标志分组品质数列 一般是单项式分组 见表3-5 按数量标志分组变量数列 可以是单项式 见表3-6 也可以是组距式 等距数列 见表3-7、3-8 异距数列 见表3-9,上一页,下一页,返回本章首页,第三章统计整理,25,上一页,下一页,返回本章首页,第三章统计整理,26,上一页,下一页,返回本章首页,第三章统计整理,27,组距数列的编制,建立频数分布的步骤如下:先对数据进行排序,以了解全部数据的变动范围;选择全部数据的分组组数;确定分组的组限,最后对各组数值所出现的频数进行计数。例:有某班学生英语考试成绩如下,上一页,下一页,返回本章首页,第三章统计整理,28,对数据进行排序,打开“成绩.xls”工作簿,选定“英语成绩”工作表。利用鼠标选定单元格 区域。,上一页,下一页,返回本节首页,第三章统计整理,29,在菜单中选择“数据”中的“排序”选项,则弹出排序对话框。,上一页,下一页,返回本节首页,第三章统计整理,30,在排序对话框窗口中,选择“主要关键字”列表中的“英语”作为排序关键字,并选择按“递增”排序。由于所选取数据中已经包含标题,所以在“当前数据清单”中选择“有标题行”,然后单击“确定”按钮,即可得到 排序的结果。,上一页,下一页,返回本节首页,第三章统计整理,31,确定组距和组数全距=上限-下限=96-48=48组数 一般5-7组组距=全距/组数例 如分6组,组距=48/6=8,上一页,下一页,返回本章首页,第三章统计整理,32,确定组限和组中值 每组两端的数值称为组限 第一组下限=48 第一组上限=48+8=56 第二组下限=56 第二组上限=56+8=64 为避免重复,一般规定:上组限不在内 组中值=(上限+下限)/2,上一页,下一页,返回本章首页,第三章统计整理,33,表示时,可写成组限 组中值4856 52 5664 606472 687280 76 8088 848896 92,上一页,下一页,返回本章首页,第三章统计整理,34,按照习惯,成绩一般分为不及格、及格、中等、良好、优秀即 组限 组中值 60分以下 50 6070 65 7080 75 8090 85 90分 95,上一页,下一页,返回本章首页,第三章统计整理,35,开口组组中值的确定缺下限开中组组中值=上限-邻组组距/2缺上限开中组组中值=下限+邻组组距/2,上一页,下一页,返回本章首页,第三章统计整理,36,确定频数和频率 频数=每组单位数 频率=每组频数/总单位数,上一页,下一页,返回本章首页,第三章统计整理,37,利用Excel频数分布函数进行分组,常用函数 财务函数 日期与时间函数 数学和三角函数 统计函数 查找与引用函数 数据库函数 文本函数 逻辑函数 信息函数 工程函数,统计函数模块中有76个统计函数,这些函数覆盖了统计基本理论与分析方法。频数分布函数是其中的一个。,上一页,下一页,返回本节首页,第三章统计整理,38,频数分布函数(FREQUENCY),可以对一列垂直数组返回某个区域中数据的频数分布。频数分布函数(FREQUENCY)的语法形式为:FREQUENCY(data_array,bins_array)其中:Data_array为用来编制频数分布的数据,Bins_array为频数或次数的接收区间。,上一页,下一页,返回本节首页,第三章统计整理,39,打开“成绩.xls”工作簿文件。在单元格E5中输入“分组”,在单元格F5中输入“频数”。在E6:E10区域中依次输入59,69,79,89,99,作为频数接受区域,它们分别表明成绩在60分以下的人数,成绩在6070 分之间.,90 分以上 的人数等。选定D3:D7区域,在“插入”菜单中单击“函数”选项,打开“粘贴函数”对 话框如图所示。,上一页,下一页,返回本节首页,第三章统计整理,40,在“函数分类”列表中选择“统计”,在“函数名”列表中选择“FREQUENCY”,单击“确定”按钮,Excel弹出“频数分布”对话窗口。,上一页,下一页,返回本节首页,第三章统计整理,41,在数据区域“Data_array”中输入单元格B2:B51数据接受区间Bins_array 中输入单元格E5:E10,在对话窗口中可以看到其相应的频数是5,11,16,13,5,。由于频数分布是数组操作,所以,此处不能直接单 击“确定”按钮,而应按 Ctrl+Shift+回车键,得 到频数分布如图所示。,上一页,下一页,返回本节首页,第三章统计整理,42,四、统计分组体系,在统计研究中,为了全面认识某一社会经济现象,常常运用多个分组标志对总体进行分组,形成一系列相互联系、相互补充的分组体系。就整个国民经济总体而言,通过按所有制、部门、行业、地区、管理等多种分组,形成国民经济分组体系。统计分组体系有两种形式:,上一页,下一页,返回本章首页,第三章统计整理,43,平行分组体系:总体按一个标志进行分组称为简单分组;对同一总体选择两个或两个以上的标志分别进行简单分组,就形成平行分组体系。例如,为了认识人口总体构成,可分别选择性别、民族、文化程度、年龄等四个分组标志进行分组,得到如下分组体系:按性别分组 按文化程度分组按民族分组 按年龄分组平行分组体系的特点:每一个分组只能反映各总体单位在一个标志上的差异,而不能反映在其它标志上的差异,尽管在其它标志上的差异仍然存在。,上一页,下一页,返回本章首页,第三章统计整理,44,复合分组体系:对同一总体选择两个或两个以上的标志层叠起来进行分组,叫复合分组;多个复合分组组成的体系,就是复合分组体系。如:,上一页,下一页,返回本章首页,第三章统计整理,45,建立复合分组体系,应根据统计分组的要求,在选择分组标志的同时,确定它们的主次顺序。首先要按照主要标志对总体单位进行第一次分组,再按次一级标志进行第二次分组,依次将所有标志分组至最后一层为止。复合分组体系的特点是:第一次分组只固定一个因素对差异的影响,第二次分组则同时反映二个标志的影响,最后一次分组时,则所有被选择的标志的影响已全部确定。,上一页,下一页,返回本章首页,第三章统计整理,46,第三节 统计图,一、绘制统计图的基本步骤 二、条形图与柱形图 三、饼形图,上一页,下一页,返回本章首页,第三章统计整理,47,一、Excel绘制统计图的基本步骤,Excel 提供“图表向导”工具,帮助创建适合于数据信息和分析目的的各种图表,下面先简单描述一下图表操作的基本步骤。使用“图表向导”工具制作图表之前,选定数据 所在的单元格,如果希望数据的行列标题显示 在图表中,则选定区域还应包括含有标题的单 元格。,上一页,下一页,返回本节首页,第三章统计整理,48,单击“插入”菜单中的“图表”选项,按照“图表向导”中4个步骤的指令进行操作。第1步“图表类型”:每种类型的图表都有两种以上的子类型,选中所需要的图形以及它的子图形,单击“下一步”按钮。第2步“图表数据源”:选定包含数据和行列标志的工作表单元格,即便工作表包含多个行列标志,也能在图表中显示它们。生成图表时,应将各行列标志包含到选定区域中。若预览图表看去很合适,则表示所选数据区正确。单击“下一步”按钮。,上一页,下一页,返回本节首页,第三章统计整理,49,第3步“图表选项”:为选定的图表设置某些标准选项。修改这些设置时,随时查看预览图表可以帮助我们确定设置是否合适。单击“下一步”按钮。第4步,“图表位置”:可以将图表放置在工作表上,或者单独置于一张新的图表工作表上,在这一步中,我们为图表工作表命名,或者选择现有工作表的名称,单击“完成”按钮。,上一页,下一页,返回本节首页,第三章统计整理,50,二、条形图与柱形图,条形图和柱形图可交换使用。Excel的条形图是水平条形,Excel柱形图为竖直条形。两种图表都可以用来表示与一组或几组分类相关的数值,它可用于不同现象的比较,也可以采用时间顺序描述现象的发展趋势。在条形图或柱形图中,各长条或柱的宽度与各长条间的距离彼此均等,条的长度与所代表的变量值成比例。,上一页,下一页,返回本节首页,第三章统计整理,51,打开“成绩.xls“工作簿,选分组工作表。,在Excel的“插入”菜单中选择“图表”选项,Excel会启动图表向导,弹出“图表向导”对话框窗口。在“图表类型”列表中选择“柱形图”,在“子图表类型”列表中选择“三维簇状柱形图”,单击“下一步”按钮,进入数据源对话框。,上一页,下一页,返回本节首页,第三章统计整理,52,在“数据区域”中选A1:B6在图表选项中输入相应内容图表位置选“作为对象插入”在得到的图表中点其中一个柱,按右键,在“数据点格式”“选项”中将“间隔宽度”设置为0,返回本节首页,上一页,下一页,第三章统计整理,53,三、饼形图,例 中国人如何看WTO。由中国社会调查事务所组织的最近一次问卷调查显示:有58.4%的被调查者对中国加入WTO非常有信心;有19.3%的被调查者没有态度;有9.2%的被调查者表示担心;有13.1%的被调查者反对中国加入WTO试用饼形图描述一下中国人对加入WTO的看法。,上一页,下一页,返回本节首页,第三章统计整理,54,打开“统计整理.xls”工作簿,选择“WTO”工作表。打开Excel“插入”菜单,并单击“插入”菜单中的“图表”选项,Excel会启动图表向导。在步骤1的“图表类型”中选择“饼图”,并在“子类 型图表”中选择“三维饼图”,单击“下一步”按钮,进入向导2。,上一页,下一页,返回本节首页,第三章统计整理,55,如图所示,在步骤2中的数据区域中输入A3:B6单元格,单击“下一步”按钮,进入向导3。,上一页,下一页,返回本节首页,第三章统计整理,56,在步骤3中单击“标题”页面,输入标题“中国人看WTO”;单击“图例”页面,取消显示图例;单击“数据标志”页面,在“数据标志”列表中选择“同时显示百分比及数据标志”。如图所示。,上一页,下一页,返回本节首页,第三章统计整理,57,如果通过图表预览,认为满意,即可单击“完成”按钮。经过修饰后,得饼形图如图所示。,上一页,下一页,返回本节首页,第三章统计整理,58,第四节 统计表,一、统计表的作用 二、统计表的结构 三、统计表的种类四、绘制统计表应注意的问题 五、用EXCEL制作统计表,上一页,下一页,返回本章首页,第三章统计整理,59,一、统计表的作用,使统计资料系统化、条理化便于比较各项目之间的关系,便于计算紧凑、简明、醒目、一目了然易于检查数字的完整性和正确性,上一页,下一页,返回本节首页,第三章统计整理,60,二、统计表的结构,上一页,下一页,返回本节首页,主词,宾词,第三章统计整理,61,三、统计表的种类,简单表:主词未经过分组按总体单位排列,上一页,下一页,返回本节首页,第三章统计整理,62,按时间排列,上一页,下一页,返回本章首页,第三章统计整理,63,简单分组表:主词按某一标志分组,上一页,下一页,返回本章首页,第三章统计整理,64,复合表,上一页,下一页,返回本章首页,第三章统计整理,65,四、制统计表的编制和应注意的问题,统计表的形式设计统计表通常都应设计成纵横线交叉组成的长方形表格。统计表一般采用开口式,表的左右两端不画纵线,表的上下端常用粗线封口,统计表的各栏可用、统一编号。为阅读方便,主词按次序排列的横行数据一般每隔五行要空一行。统计表的注释、数字的资料来源等一般都写在表的下面以便核查,必要时还可附以简要文字说明,以明确统计表所反映的主要情况和问题。,上一页,下一页,返回本章首页,第三章统计整理,66,统计表的内容设计应注意统计表中的数字要说明计量单位,如果全表只有一个统一的计量单位,可列在表的右上角;如各栏的计量单位不同时,则应将计量单位标写在纵栏标题的下方或右侧;当同行资料以同一单位计量,而各行计量单位不同时,则可在横行标题后添加一计量单位栏,用以标明各行的计量单位。表中数字要填写整齐,位数对齐,同栏数字的单位、小数位要一致;如有相同数字应全部填写,不得写上“同上”字样;没有数字的格内要用“”表示;当该栏缺资料或数据不足本表最小单位时,应用点线“”标明,不得空栏,以示不是漏填。,上一页,下一页,返回本章首页,第三章统计整理,67,表的下端必要时还要注明编表及发出日期、制表人及统计负责人签署等,以示对提交的数字负责,便于收表单位查询联系。,上一页,下一页,返回本章首页,第三章统计整理,68,五、用EXCEL制作统计表,例:某学院毕业生情况表,第三章统计整理,69,打开“统计表.xls”工作簿,选定“毕业生分配”工作表。从“数据”菜单中选择“数据透视表和图表报告”选项,得到“数据透视表对话框”窗口。在第1步之中选择“数据清单或数据库”与“数据透视表”,单击“下一步”按钮。在第2步中,确定数据区域A1:D31,单击“下一步”按钮。,上一页,下一页,返回本节首页,第三章统计整理,70,在第3步中,确定数据透视表的位置,如图所示,但将其位置 调整到“H1”单元格。然后,单击“版式”按钮,打开“版式”对 话框如图所示。,上一页,下一页,返回本节首页,第三章统计整理,71,将对话框右边的“分配单位”字段拖到左边的“行”区作为分组变量,再将右边的“性别”和“年龄 字段拖到“列”区,作为交叉分析的变量,最后将右边的“分配单位”字段拖放到“数据”区域中,并选择计数项。最后,单击“确定”按钮,又回到“版式”对话框。,上一页,下一页,返回本节首页,第三章统计整理,72,单击“确定”按钮,回到第3步,要注意数据透视表的位 置,最后,单击“完成”按钮,得到交叉表如图所示。,上一页,下一页,返回本节首页,第三章统计整理,73,练习:有40名患者就诊等候时间如下:,要求:将数据整理成组距数列,绘制次数分布直方图和次数分布曲线图,上一页,下一页,返回本章首页,第三章统计整理,74,答案统计是人类进行的一种调查活动,或者说是一种认识活动;它是人类对一定的总体现象所进行的一种定量认识活动。对统计一词通常有三种解释:统计工作、统计资料、统计学。统计是研究大量社会经济现象的数量方面的,如果总体单位的标志和指标没有差异(变异),其具体表现都一样,那么只要调查一个便可知全体,这样就用不着统计了,只有变异才能统计,变异是统计的前提。,上一页,下一页,返回本章首页,第三章统计整理,75,Thank you very much!,谢谢!,上一页,退出,返回本章首页,