统计数据的整理与显示东北财大徐强.ppt
神奇的google 网上查询信息的首选方式 特色:Google 具有网页快照功能 Google 释义 Google 是由英文单词“googol”变化而来。“googol”表示 1 后边带有 100 个零的数字。Google 使用这个词代表公司想征服网上无穷无尽资料的雄心。,统计整理,统计调查,客观现象数量表现,统计总体数量特征,统计研究的程序,统计研究目的,统计设计,推断分析描述分析,统计学第三章 统计数据的整理与显示,第三章 统计数据的整理与显示,3.1 统计整理与统计分组3.2 分布数列的编制3.3 统计图表,3.1 统计整理与统计分组,一、统计整理的意义和步骤二、统计整理的基本方法 统计分组,统计学第三章 统计数据的整理与显示,制定统计整理方案,对原始资料进行审核,数 据 处 理,制作统计表或统计图,统计整理的步骤,统计学第三章 统计数据的整理与显示,3.1 统计整理与统计分组,一、统计整理的意义和步骤二、统计整理的基本方法 统计分组,统计分组的作用:,总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。,统计学第三章 统计数据的整理与显示,划分社会经济现象的类型反映社会经济现象的内部结构和比例关系揭示社会经济现象之间的相互依存关系,选择分组标志,确定分组体系,总体单位归类,科学性:组间差异大,组内差异小。,完备性和互斥性:每个单位均能且只能归到某个组中。,统计分组的程序与原则,第三章 统计数据的整理与显示,对大学生月生活费支出情况进行分组研究:按家庭收入水平分组;按城乡分组;按性别分组;按年龄分组。,统计分组的程序与原则,对父母亲下岗情况进行分组研究:单亲下岗;双亲下岗;双亲在岗。,不符合科学性,不符合完备性和互斥性,第三章 统计数据的整理与显示,统计分组的程序与原则,各分组标志并列使用,各分组标志交叉结合使用,第三章 统计数据的整理与显示,平行分组体系,对教师的分类,按性别分类,男性,女性,按职称分类,按年龄分类,高级,中级,初级,青年,中年,共计7组 2+3+2,统计学第三章 统计数据的整理与显示,交叉分组体系,按性别分类,按职称分类,按年龄分类,男,女,高级,中级,初级,青年,中年,共计12组232,统计学第三章 统计数据的整理与显示,对教师的分类,第三章 统计数据的整理与显示,3.1 统计整理与统计分组3.2 分布数列的编制3.3 统计图表,3.2 分布数列的编制,一、分布数列的定义及种类二、变量数列的编制三、累计次数与累计频率,分类,统计学第三章 统计数据的整理与显示,3.2 分布数列的编制,一、分布数列的定义及种类二、变量数列的编制三、累计次数与累计频率,同时具备,变量数列的编制,【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。,统计学第三章 统计数据的整理与显示,编制结果如下:,统计学第三章 统计数据的整理与显示,变量数列的编制,变量值变动区间的长度相等,变量值变动区间的长度不完全相等,统计学第三章 统计数据的整理与显示,相关概念,统计学第三章 统计数据的整理与显示,某地区100个百货商店月销售额与流通费用情况,上组限U,下组限L,如:组距d=U-L=100-50=50(万元),如:组中值x=(U+L)/2=(100+200)/2=150(万元),统计学第三章 统计数据的整理与显示,编制等距数列,适用于总体单位的标志值变动比较均匀的情况,实例,己知某地区某年50个商店商品销售额的资料如下(单位:百万元):7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0要求编制组距数列。,统计学第三章 统计数据的整理与显示,编制步骤:,求变异全距,确定组距及组数,R组距(d)组数(m),编制等距数列,统计学第三章 统计数据的整理与显示,计算组数(组数不宜过多,也不宜太少),上例中,取d=5,则有,编制等距数列,统计学第三章 统计数据的整理与显示,确定组限,编制等距数列,统计学第三章 统计数据的整理与显示,计算次数,编制等距数列,编制结果:,统计学第三章 统计数据的整理与显示,(5+(5-5))/2=2.5,(25+(25+5))/2=27.5,统计学第三章 统计数据的整理与显示,茎叶表示 Stem-and-Leaf Display,将每一观测值分解为茎值和叶值(用直线隔开)垂直线左边的数字称为“茎”,确定组别垂直线右边的数字“叶”,确定频数(计数),Xi,开口式组距数列组中值的计算:,首组假定下限首组上限相邻组组距 末组假定上限末组下限相邻组组距,先计算开口组的假定上、下限:,因此有:,3.2 分布数列的编制,一、分布数列的定义及种类二、变量数列的编制三、累计次数与累计频率,累计次数(频率),从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。,从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。,统计学第三章 统计数据的整理与显示,频数表(用SPSS制作),有效数据,频数,频率,有效频率,累计频率,约2/3的人身高不超过165cm,统计学第三章 统计数据的整理与显示,统计学第三章 统计数据的整理与显示,统计学第三章 统计数据的整理与显示,第三章 统计数据的整理与显示,3.1 统计整理与统计分组3.2 分布数列的编制3.3 统计图表,3.3 统计图表,一、统计图二、统计表,一个图只用来显示一种现象的数量特征,统计学第三章 统计数据的整理与显示,几种常用的统计图,条形图(Bar),用于显示离散型变量的次数分布,统计学第三章 统计数据的整理与显示,几种常用的统计图,统计学第三章 统计数据的整理与显示,几种常用的统计图,条形图(Bar),用于显示离散型变量的次数分布,统计学第三章 统计数据的整理与显示,几种常用的统计图,条形图(Bar),用于显示离散型变量的次数分布,统计学第三章 统计数据的整理与显示,条形图(Bar),用于显示离散型变量的次数分布,统计学第三章 统计数据的整理与显示,统计学第三章 统计数据的整理与显示,直方图,条形图,统计学第三章 统计数据的整理与显示,统计学第三章 统计数据的整理与显示,统计学第三章 统计数据的整理与显示,统计学第三章 统计数据的整理与显示,统计学第三章 统计数据的整理与显示,3.3 统计图表,一、统计图二、统计表,统计表的常用结构:,统计学第三章 统计数据的整理与显示,某地区100个百货商店月销售额与流通费用情况,统计学第三章 统计数据的整理与显示,统计表的编制规则,统计学第三章 统计数据的整理与显示,选择合适的总标题;主词栏与宾词栏要各归其位,相互对应;表的上、下端用粗线或双线封口,左右两端一般不封口;可在各列的文字标题下面设置编号加以标识;数据栏不能有空白。,统计学第三章 统计数据的整理与显示,统计表的加工方法,(对主体进行分组),(选择指标及对指标进行分组),对主词栏的单式加工,统计学第三章 统计数据的整理与显示,对主词栏的复式加工,统计学第三章 统计数据的整理与显示,对宾词栏的简单分组,对宾词栏的交叉分组,思考题 Thinking Challenge,我没办法有效率的分配人手销售浮动太大了!生产经理,生产经理的演示图:,营销经理的演示图:,36,39,42,45,J,M,M,J,S,N,0,20,40,60,J,M,M,J,S,N,数据表示中的错误Errors in Presenting Data,1.使用花哨(Junk)图表2.数据比较时没有可靠的相对基准3.压缩纵轴Compressing the Vertical Axis4.纵轴上无零点No Zero Point on the Vertical Axis,花哨图表Chart Junk,不准确的表示,准确的表示,1960:$1.00,1970:$1.60,1980:$3.10,1990:$3.80,最低工资,最低工资,0,2,4,1960,1970,1980,1990,$,花哨图表Chart Junk,在报纸、杂志上的图表里通常都会加上花哨的图标和符号以增加吸引力,这种做法常常会掩盖或曲解数据应传递的准确信息实例1:“人民生活步步高”北京日报1997年9月10日实例2:北大画册(英文版)2001,无相对基准No Relative Basis,准确的表示,按年级统计的A,按年级统计的A,不准确的表示,0,100,200,300,大一,大二,大三,大四,频数,0%,10%,20%,30%,大一,大二,大三,大四,百分比,无相对基准No Relative Basis,通常百分比之间较为可比,而绝对数之间比较却可能产生误解。不适当的图标也会影响数据比较的准确性。实例3:“Liquid Gold:Australians are Changing the World of Wine,”Time,November 22,1999实例4:“工业生产增幅快”北京青年报2000年9月12日,压缩纵轴Compressing Vertical Axis,季度销售,季度销售,不准确的表示,0,25,50,1季,2季,3季,4季,$,0,100,200,1季,2季,3季,4季,$,准确的表示,实例分析 Case Analysis,纵坐标设定不恰当实例5:共同基金宣传资料Investing for Growth:One Group Mutual Funds实例6:“亚马逊公司股票走势图”北京青年报2000年7月31日,纵轴无零点No Zero Point on Vertical Axis,月销售量,月销售量,不准确的表示,0,20,40,60,一,三,五,七,九,十一,$,36,39,42,45,一,三,五,七,九,十一,$,准确的表示,纵轴无零点No Zero Point on Vertical Axis,没有在纵坐标上指出零点实例7:“经济增长速度和物价上涨幅度”人民日报1997年9月11日实例8:“居家过日子那个城市花销大”金融时报2000年9月1日,