统计数据的搜集整理和显.ppt
统计整理,统计调查,客观现象数量表现,统计总体数量特征,统计研究的程序,统计研究目的,统计设计,推断分析描述分析,统计学第二章 统计数据的搜集、整理和显示,第二章 统计数据的搜集、整理和显示,2.1 统计数据的搜集2.2 数据整理2.3 频数分布2.4 数据显示,2.1 统计数据的搜集,一、统计数据搜集的基本理论与方法二、统计调查的组织形式三、统计调查体系,返回,一、统计数据搜集的基本理论与方法,(一)统计数据搜集的概念(二)统计调查的方案设计(三)统计数据的搜集方法,返回,(一)统计数据搜集的概念,统计数据搜集又称为统计调查,是根据统计研究的目的、要求和任务,运用科学的调查方法,有组织地搜集有关现象的各个单位的资料,取得真实可靠的原始资料的工作过程。,指直接从各调查单位搜集的用来反映个体特征的数据资料,统计学第二章 统计数据的搜集,返回,(二)统计调查的方案设计,统计调查方案,用来指导整个调查工作的纲领性文件,是统计设计在统计调查阶段的具体化。,(二)统计调查方案设计,1、确定调查目的2、确定调查对象和调查单位3、确定调查项目4、设计调查表格和问卷5、确定调查时间和调查期限6、确定调查的组织实施计划,1、确定调查目的,明确为什么要进行调查,调查要解决什么样的问题。,2、确定调查对象和调查单位,解决向谁调查,由谁来具体提供资料的问题。(1)调查对象明确规定调查中被研究的总体范围。说明向谁调查问题。(2)调查单位构成调查对象的每一个单位,即总体单位。(3)填报单位(报告单位)是指负责向上级汇报调查内容、提交统计资料的单位。,3、确定调查项目,调查项目要调查的内容,也就是被调查单位的特征,即标志。,4、设计调查表格和问卷,调查表是容纳调查项目的表格。,5、确定调查时间和调查期限,(1)调查时间:调查资料所属的时间(时期或时点)。(2)调查期限:进行调查工作的时间,包括搜集资料和报送资料的整个工作所需要的时间。,6、制定调查的组织实施计划,这是统计过程的总方案。包括明确调查机构、调查地点、选择调查组织形式、调查步骤、日程安排、经费等。,返回,直接观察法,报 告 法,采 访 法,(三)统计数据的搜集方法,登 记 法,实验设计调查法,返回,二、统计调查的组织形式,按调查的范围大小分为,返回,(一)全面调查,全面调查是指对调查对象中的全部单位,都无一例外地进行登记或观察的一种调查方法。包括:普查和全面统计报表。,返回,指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查,作用,局限,由于需要大量的人力、物力和财力,不宜经常进行,普查,统计学第二章 统计数据的搜集,总体单位,调查单位,总体单位,调查单位,普 查,对全部单位进行调查,返回,指按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度,全面统计报表,优点,局限,统计学第二章 统计数据的搜集,总体单位,调查单位,全面统计报表,可以全面调查,但通常是调查限定规模以上的总体单位,统计学第二章 统计数据的搜集,返回,(二)非全面调查,非全面调查是只对调查对象中的一部分单位进行登记或观察的一种调查方法。包括:抽样调查、重点调查和典型调查。,返回,按照 随机原则 从调查对象中抽取一部分单位作为样本进行调查,根据调查结果推断总体的一种非全面调查组织形式,抽样调查,指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会,特点,优点,统计学第二章 统计数据的搜集、整理和显示,抽样调查的应用范围,(1)在实际工作中不可能进行全面调查而又需要了解其全面资料的事物时。(2)有些资料虽可以进行全面调查,但比较困难或并不必要。(3)对普查或全面调查统计资料的质量进行检查和修正。(4)可以应用于生产过程中产品质量的检查和控制。(5)可以用于对总体的某种假设进行检验。,总体单位,调查单位,抽样调查,按随机原则选择调查单位,各单位被选中的机会相同。,返回,在调查对象中只选择一部分重点单位 进行调查的一种非全面调查组织方式,作用,局限,能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料,只适用于客观存在着重点单位的情况;不能推断总体总量。,重点调查,这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况,统计学第二章 统计数据的搜集、整理和显示,总体单位,调查单位,重点调查,只调查重点单位(单位数不多但其标志量占标志总量比重较大的单位),统计学第二章 统计数据的搜集、整理和显示,返回,典型调查,在对调查对象有一定了解的基础上,有意识地选择少数典型单位 进行调查的一种非全面调查组织方式,不能确定推断的把握程度,无法计算和控制推断误差,作用,指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量,局限,统计学第二章 统计数据的搜集、整理和显示,总体单位,调查单位,典型调查,对典型单位进行调查,典型单位的选择并不一定按规模,返回,统计学第二章 统计数据的搜集、整理和显示,三、统计调查体系,建立以周期性普查为基础,以经常性的抽样调查为主体,同时辅之以重点调查、科学推算和少量的全面统计报表综合运用的统计调查方法体系,返回,2.2 数据整理,一、数据整理的内容二、统计分组三、统计指标,返回,一、数据整理的内容,(一)统计数据整理的概念(二)统计整理的步骤,返回,(一)统计数据整理的概念,返回,制定统计整理方案,对原始资料进行审核,数 据 处 理,制作统计表或统计图,(二)统计整理的步骤,统计资料的积累、保管和公布,返回,二、统计分组,(一)统计分组的概念与种类(二)统计分组的方法,返回,(一)统计分组的概念与种类,1、统计分组的概念2、统计分组的目的、性质、原则3、统计分组的种类,返回,统计分组的作用:,划分社会经济现象的类型反映社会经济现象的内部结构和比例关系揭示社会经济现象之间的相互依存关系,1、统计分组的概念,返回,2、统计分组的目的、性质、原则,目的:组内同质性,组间差异性性质:具有分和合双重含义原则:穷尽原则,互斥原则,返回,3、统计分组的种类,(1)按分组标志的多少分类简单分组:按一个重要标志分组。复合分组:按两个或两个以上的标志分组。(2)按分组标志的性质分类品质分组:按品质标志进行的分组。数量分组:按数量标志进行的分组。,返回,(二)统计分组的方法,1、分组标志的选择2、统计分组的方法阐述(1)品质分组(2)数量分组3、组限、组距、组数和组中值的计算,返回,1、分组标志的选择,统计分组的关键:要选择适当的分组标志。,2、统计分组的方法阐述,(1)品质分组,表1 某班学生的性别构成情况,(2)数量分组单项式分组:每一个变量值作为一组。,同时具备,分组条件:,表2 某厂第二季度工人平均日产量,变量值变动区间的长度相等,变量值变动区间的长度不完全相等,组距式分组,每个组的变量值用一个区间来表现。,表3 某厂工人完成生产定额情况表,3、组限、组距、组数和组中值的计算,对于连续变量,相邻组组限必须重叠;为避免重复,一般规定“上限不在内”;,每组的最大标志值与最小标志值之差,组距d,总体中的最大标志值与最小标志值之差。,全距(极差)R,组距d=上限U下限L,组数,一般为57组;也可根据斯特杰斯经验公式确定。,对于等距数列:组距d=全距/组数,各组上下限之间的中点值。,组中值x,闭口组组中值的计算,某地区100个百货商店月销售额与流通费用情况,上组限U,下组限L,如:组距d=U-L=100-50=50(万元),如:组中值x=(U+L)/2=(100+200)/2=150(万元),开口组组中值的计算,可以参照相邻组组距推算。,例题,某地区100个百货商店月销售额与流通费用情况,若按相邻组组距推算出现不可能值时,则按极限值推算。,某厂工人工资分布情况表,返回,三、统计指标,(一)统计指标的概念(二)统计指标的分类(三)统计指标体系,返回,(一)统计指标的概念,统计指标,反映社会经济现象总体数量特征的概念和具体数值。,时间限制,空间限制,指标名称,具体数值,计量单位,计算方法,构成要素:,主要的构成要素:,指标名称和指标数值,标志和指标的区别和联系,(1)区别说明对象不同;表现形式不同;(2)联系许多统计指标是由各单位的数量标志值汇总而来的;指标和标志之间存在转化关系。,返回,(二)统计指标的分类,统计指标,数量指标,质量指标,按反映的内容分类,说明总体规模大小和数量多少。一般用绝对数表示。,说明总体内部数量对比关系和一般水平。一般用相对数或平均数表示。,返回,(三)统计指标体系,统计指标体系,由一系列相互联系的统计指标所组成的有机整体。,指标体系的作用:,财政部制订的企业经济效益评价指标体系:销售利润率总资产报酬率资本收益率资本保值增值率资产负债率流动比率应收账款周转率存货周转率社会贡献率社会积累率,国家统计局制订的工业企业综合经济效益评价指标体系:总资产贡献率资本保值增值率资产负债率全员劳动生产率成本费用利润率流动资产周转率产品销售率,全面、综合地对客观事物进行描述、分析。,返回,2.3 频数分布,一、频数分布的基本概念二、变量数列的编制三、累计次数与累计频率四、频数分布的类型,返回,一、频数分布的基本概念,(一)频数分布(二)分布数列的两个构成要素(三)分布数列的种类,返回,(一)频数分布,在分组的基础上,把总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为频数分布。由此形成的数列又称为分布数列。,返回,(二)分布数列的两个构成要素,返回,(三)分布数列的种类,分类,返回,二、变量数列的编制,(一)组距数列的编制(二)频数和频率,返回,(一)组距数列的编制,1、对数据进行排序,确定全距。2、选择分组组数。3、确定分组的组距和组限。4、对各组数值所出现的频数进行计数。,返回,(二)频数和频率,1、频数(次数)f 分布在各组的个体单位数叫次数或频数,用绝对数表示。2、频率(比率)各组次数占总次数的比重叫频率,用百分数、系数表示。,返回,变量数列的编制案例,例:某班36名同学统计学考试成绩如下:56,79,86,56,80,86,86,80,64,65,81,87,87,82,67,68,83,88,90,84,71,73,84,92,74,85,92,93,85,76,76,85,94,79,97,86。试编制变量数列。,解:1)排队:2)求全距R=9756=41 3)确定组数:m取整为6。4)求组距:h取整为10(实际情况是分数的档次是10分)5)确定上、下限和次数:,例:某班组40名工人日产量资料如下:54,85,83,79,78,92,80,95,62,68,72,83,85,64,73,60,84,108,81,78,99,74,81,70,77,66,71,83,75,34,78,83,88,86,83,74,89,68,74,87。试编制变量数列。,1)排队:2)求全距R=10834=743)确定组数:m取整为74)求组距:h取整为105)确定组限及次数(最终结果),合并成一组60以下,次数为2 可合并也可不合并,视具体情况定,若合并,则为90以上,次数为4,最终结果,例:某电脑公司2007年前四个月各天的销售量数据(单位:台)。试对数据进行分组,等距分组表(上下组限重叠),等距分组表(上下组限间断),等距分组表(使用开口组),三、累计频数和累计频率,从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计频数(频率)。,从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计频数(频率)。,返回,四、频数分布的类型,(一)钟型分布“两头小中间大”(二)U型分布“两头大中间小”(三)J型分布“一边大一边小”,返回,2.4 数据显示,一、统计表二、统计图,返回,一、统计表,(一)统计表的结构,1、从内容上看,统计表由主词栏和宾词栏两部分组成。,2、从表式上看,统计表包括以下三个部分:总标题、分标题和数字资料。,(二)统计表的种类,统计表按照总体分组情况不同,可分为:简单表、分组表、复合表。,中国体育代表团在悉尼奥运会上获金牌的项目,简单表,分组表,复合表,复合表,标题:简明,确切。指标项目:主词栏与宾词栏要各归其位数据对齐:对准位数;数字位置:无数字,缺乏数字计量单位:一种计量单位写在表右上方,多种计量单位写在纵栏标题旁注释:必要时统计表应加注释表式:开口式,(三)统计表编制规则,返回,二、统计图,几种常用的统计图,条形图(Bar),用于显示离散型变量的次数分布,条形图(Bar),用于显示离散型变量的次数分布,直方图(Histogram),用于显示连续型变量的次数分布,直方图与条形图的区别,条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的 直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义 直方图的各矩形通常是连续排列 条形图则是分开排列,在直方图基础上,将每个长方形的顶端中点用折线连接而成,或用组中值与频数(或频率)求坐标点连接而成。,折线图,15,12,9,6,3,105,110,115,120,125,130,135,140,日加工零件数(个),频 数(人),某车间工人日加工零件数的折线图,U型分布是一种刚好与钟型分布相反的分布,其标准是越靠近中心变量值,分布次数越少;越远离中心变量值则分布次数越多。形成“中间小,两头大”的分布特征。J型分布的特征有正反两种情况,一种是次数随变量的增大而逐渐增多,称为正J形分布;若次数随变量值的增大反而减少,则称为反J型分布,象英文的“J”字。,曲线图,几种常见的曲线图,返回,