电大社会统计学第三章数据的组织与展示课件.ppt
《电大社会统计学第三章数据的组织与展示课件.ppt》由会员分享,可在线阅读,更多相关《电大社会统计学第三章数据的组织与展示课件.ppt(40页珍藏版)》请在三一办公上搜索。
1、2022/12/20,电大社会统计学第三章数据的组织与展示,电大社会统计学第三章数据的组织与展示,电大社会统计学第三章数据的组织与展示,第三章 数据的组织与展示,电大社会统计学第三章数据的组织与展示,学习目标:1、了解数据的筛选与排序,掌握使用SPSS进行数据的筛选与排序2、了解常用统计图和统计表,明确不同统计图和统计表适用的数据类型。3、能使用SPSS绘制统计图表。,电大社会统计学第三章数据的组织与展示,统计数据的整理:是对统计数据的加工处理过程,以使统计数据系统化、条理化、符合统计分析的需要,它是收集数据与数据分析之间的必要环节。,收集数据,数据分析,数据整理,电大社会统计学第三章数据的组
2、织与展示,第一节 数据的整理,一、数据整理 数据整理是使用数据之前对数据进行必要的处理,包括数据的审核、筛选和排序等。这样可以保证数据的质量,并且选择符合研究要求的数据,为数据的使用与分析打下坚实的基础。,(一)数据审核 数据审核是指从数据的完整性、准确性、适用性及时效性等方面对数据进行检查,保障数据质量,为之后进一步的分析打下基础。,数据审核,数据筛选,数据排序,1 2 3,电大社会统计学第三章数据的组织与展示,数据审核:完整、准确、适用、时效,完整性:数据是否完整、调查单位是否全面覆盖、调查项目问题是否全部回答。 总体不漏人,个体不漏项,准确性:数据是否真实、准确,数据是否真实反映实际情况
3、,数据是否有误。,适用性:审核数据的来源、口径、背景等是否符合研究需要,若不符合研究需要则不应该生搬硬套。,时效性:审核数据是否滞后、是否具有研究意义。,电大社会统计学第三章数据的组织与展示,对于原始数据,只需要从完整性和准确性两方面进行审核。对于二手数据,不仅需要。还需要进行适用性和时效性审核。(二)数据筛选 数据筛选是指将不符合要求的数据或者有明显错误的数据剔除掉,或者将某些不符合研究需要的数据剔除掉,只留下符合需要的数据。数据经过筛选后使其结果符合研究需要,为以后研究打下良好基础。,电大社会统计学第三章数据的组织与展示,(三)数据排序 数据排序是指按照一定顺序对数据进行排列,为数据分组、
4、分析数据提供方便。 不同数据的排序标准不同。对于分类数据,排序方式多种多样,可以按照字母顺序进行排序,如按姓氏首字母对姓名进行排序,也可以按照姓氏笔画进行排序;而对于数值型数据,则只有递增和递减两种排序方式,如按照收入从高到低对某类人进行排序,也可以从低到高排序。,电大社会统计学第三章数据的组织与展示,二、数据分组 针对数值型数据 数据分组就是根据研究需要,按照某种标准将原始数据分为不同的组,分组后的数据叫做分组数据。包括单变量分组和组距分组,其中组距分组又包括等距分组和不等距分组两类。(一)单变量分组 在分组时将每一个变量作为一组。 只适合离散变量。例如,将妇女生育数0,1,2,3,4,5,
5、6,7,8.分别分组。,电大社会统计学第三章数据的组织与展示,(二)组距分组(重点)组距分组是指将全部变量值按照次序划分为多个区间,每一区间里的值作为一组。组距分组适合连续变量且数据较多的情况。上限值:每一组最大的值下限值:每一组最小的值组距:上限值-下限值操作步骤:1、对数据进行排序 2、确定分组数。K=1+lgn/lg2 (其中n为数据总个数) 3、确定组距。 组距=(最大值-最小值)/组数,电大社会统计学第三章数据的组织与展示,(二)组距分组原则不重不漏:一个数据必须属于且仅属于一组,不能重复出现,也不能遗漏。上限值不在组内:当相邻两组的上限值与下限值重叠时,恰好等于某一组上限值的变量值
6、不放在该组内,而放在下一组。当存在极端值,使得最大值和最小值相差悬殊时,我们可以将第一组改为“XX以下”,或将最后一组改为“XX以上”,避免遗漏。,电大社会统计学第三章数据的组织与展示,(三)等距分组和不等距分组在分组时,如果各组组距相等,则称为等距分组;如果各组组距不相等,则称为不等距分组。不等距分组eg:婴幼儿组(06岁) 少年儿童组(717岁) 中青年组(1859岁) 老年人组(60岁及以上),电大社会统计学第三章数据的组织与展示,三、应用SPSS对数据进行整理与分组1、排序 点击DateSort Cases指定需要进行排序的变量到Sort by 框中,同时在Sort Order中选择是
7、升序排列还是降序排列。 升序:Ascending 降序:Descending,电大社会统计学第三章数据的组织与展示,电大社会统计学第三章数据的组织与展示,三、应用SPSS对数据进行整理与分组2、筛选 点击DateSelect Cases 然后选择何种方式筛选个案。if condition is satisfied 是根据某特定条件选择个案 random sample of case 是随机选取个案然后指定未选中个案的处理方式。 filter out unselected cases 表示在那些未选中的个案号码上做一个/标记;delete unselected cases 表示删除未选中的个案;
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电大 社会 统计学 第三 数据 组织 展示 课件
链接地址:https://www.31ppt.com/p-1821699.html