统计学原理第三章统计整理.ppt
《统计学原理第三章统计整理.ppt》由会员分享,可在线阅读,更多相关《统计学原理第三章统计整理.ppt(66页珍藏版)》请在三一办公上搜索。
1、1,第三章 统计整理,2,主要内容,第一节 统计数据整理的概述第二节 统计分组第三节 分配数列第四节 统计表和统计图,3,一、数据审核(Data Auditing)是指在进行数据整理之前对原始数据的审查与核对。数据整理是按照数据分析的要求进行的,数据分析的思路和目的决定着数据整理的分类或分组。基于人类认识活动的渐进性,往往需要采用不同的分组方式对原始数据进行反复整理,以便得出正确的认识结论。,第一节 统计数据整理的概述,4,二、数据审核的内容,1、时效性的审核检查是否在规定的调查时间内完成数据的搜集工作,采集的数据是否为规定调查时点上或规定的调查时段内的数量特征,以保证统计数据在时间上的准确性
2、和可比性。2、准确性的审核检查是否每一调查单位的特征都无偏差、无失真、准确无误地记录在登记资料中,抽样调查的误差是否有效地控制在规定的范围内.,3、一致性的审核 检查统计数据在时间和空间上的连续性和 可比性。,5,三、数据审核的方式1、逻辑审核检查原始数据中各项数据是否合理的数据审核方式。要求检查人员具备较强的逻辑推理能力和丰富的专业知识及数据审核经验。2、技术审核对调查数据原始登记表和其他原始材料进行机械性核对的数据审核方式。由于技术检查是一种机械性的核对,一般可采用专门的计算机软件来实现。,6,四、数据的排序,数据排序是指将一组数据按照大小、高低、优劣等顺序进行依次排列的过程。数据排序为计
3、算取值范围、最大值、最小值等总体参数提供了便利,有助于人们了解数据大致的分布状态。数据排序也是有效地进行数据分类或分组的前期准备工作。数据排序可以使用计算机软件来实现,Excel就具有很强的数据排序功能。,7,第二节 统计分组,一、统计分组的概念统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个不同类型或性质的部分的一种统计方法。统计分组具有两方面含义:对总体而言是“分”,即将总体分为性质相异的若干部分。对总体单位而言则是“合”,即将性质相同的总体单位组合起来。,8,二、统计分组的作用与原则1、统计分组的作用(P40-42)划分现象的类型;揭示现象的内部结构;分析现象之间的内
4、在关系:正依存关系:现象之间成同向变动负依存关系:现象之间成反向变动2、统计分组的原则穷尽原则:组数有限且不宜过多。互斥原则:组间的差异、界限要分明。,9,三、分组标志的选择,(一)选择分组标志的原则 P421.目的性原则:根据研究问题的目的选择分组标志。2.本质性原则:选择最能反映现象本质特征的标志分组。例如反映家庭生活水平的因素:总收入?平均收入?研究学生的学习状况:成绩?性别?年龄?籍贯?,3.具体条件原则:结合现象所处的具体历史条件或经济条件选择分组标志。,10,(二)统计分组的种类,按分组标志个数不同分为:简单分组与复合分组 P44,简单分组,11,工业企业按经营组织形式和规模大小同
5、时进行分组按经营组织形式分组:按规模分组:大型企业 内资企业 中型企业 小型企业 大型企业 港澳台商投资经营企业 中型企业 小型企业 大型企业 外商投资经营企业 中型企业 小型企业,复合分组,12,2按分组标志性质不同可分为:品质标志分组和数量标志分组,品质标志分组,数量标志分组,13,1)品质标志分组:对总体按照品质标志分组,如人口按性别分组;企业按所有制、行业分组等属于简单分组;复杂分组有国家制定统一的分类目录。(P44)2)数量标志分组:对总体按照数量标志分组,具体又分为以下两种情况:单项式分组:是以一个变量值为一组的分组方法,只适用于离散型变量的分组。,14,组距式分组:是按变量变动的
6、一定区间来分组的方法。既适用于连续型变量,也适用于离散型变量。具体又分为以下两种情况:等距分组与异距分组:根据变量值变动的均匀性来确定。均匀变动的变量适合用等距分组,否则应选择异距分组。说明:离散型变量采用单项式分组还是组距式分组主要取决于变量值的多少和变量值变动范围的大小,变量值少且变动范围小的用单项式分组,反之用组距式分组。,15,一、分配数列的概念和种类(一)分配数列的概念(P46)在数据分组的基础上,将总体的所有单位按组归类整理,并按一定的顺序排列,形成总体中各个单位在各组间的分布就称为分配数列(次数分布)。分布在各组的总体单位数叫次数或频数,各组次数与总次数之比叫比重或频率。,第三节
7、 分配数列,16,(二)分配数列的种类,分配数列,单项式数列,组距式数列,等距分组,异距分组,品质分配数列(品质数列),数量分配数列(变量数列),17,中国2005年人口状况品质分配数列,各组名称,次数或频数,比率或频率,(品质分组标志),(品质分组标志),18,变量数列单项式数列某企业工人平均日产量(离散变量),变量,次数,比率或频率,19,变量数列等距数列某厂工人生产定额完成情况表(连续变量),变量,次数,比率或频率,20,二、单项式数列的编制,1、对变量值排序通常按照由小到大的顺序来排列。,例如,某生产车间21名工人日加工零件数资料如下:117 108 110 117 110 117 1
8、30 114 110 114 128 120 110 120108 117 124 114 120 117 124,21,2、某车间21名工人日加工零件分组表,22,三、组距数列的编制,(一)组距与组数首先对已取得的调查数据进行排序(P48)。1、组、组限和组距的概念在组距数列中用变量变动的一定范围代表一个组。每个组的最小值为该组的下限,最大值为该组的上限,下限与上限合称为组限,每个组上限和下限之间的距离称为组距。,23,2、组数和组距的关系,组数:即整个组距数列中所包含的组的个数组数的多少和组距的大小成反向变动关系:组距大则组数少,组距小则组数多。因此,组距的大小会直接影响组数的多少。确定组
9、距的原则:体现组内资料的同质性和组间资料的差异性。一般取510的倍数为宜。学生按考试成绩分组:,24,某班学生统计学考试成绩统计表,不及格,及格,中等,良好,优秀,体现组内资料的同质性和组间资料的差异性,25,(二)等距分组和异距分组,按组距是否相等可将组距数列分为:1、等距数列:是指各组组距都相等的组距数列。适用范围:适用于变量值变动比较均匀的现象,即各组间性质差异是由变量值均匀增加或减少而引起的。(P50)例如,成绩、身高、体重、计划完成程度等。,26,等距数列可绘制次数分布直方图和次数分布折线图,直方图的面积与折线图所围成的面积相等。折线两端应在直方图的左右两边各延伸一个假想组,并连接至
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 原理 第三 统计 整理
链接地址:https://www.31ppt.com/p-6015745.html