数据的描述统计分析.ppt
《数据的描述统计分析.ppt》由会员分享,可在线阅读,更多相关《数据的描述统计分析.ppt(170页珍藏版)》请在三一办公上搜索。
1、2023/10/1,第二讲 数据的描述统计分析,主讲:张杰,2023/10/1,本讲内容,2.1 定性数据的频数分析2.2 定量数据的描述性统计量2.3 数据的图表展示,2023/10/1,本讲参考教材,贾俊平:统计学(第四版),中国人民大学出版社,2011.6叶向:统计数据分析基础教程-基于SPSS和Excel的调查数据分析,中国人民出版社,2010-02于洪彦,刘金星,张洪利:Excel统计分析与决策(第2版),高等教育出版社,2009,08薛薇:统计分析与SPSS的应用(第3版),中国人民大学出版社,2011.1,2023/10/1,2.1 定性数据的频数分析,一、频数分析概述二、单变量
2、的一维频数分析三、双变量的交叉表分析四、多选变量的频数分析,2023/10/1,一、频数分析概述,频数分布分析主要通过频数分布表和饼图、条形图等图形来描述数据分布特征的方法。频数也称“次数”,对总数据按某种标准进行分组(类),统计出各个组(类别)内含个体的个数。我们把各个类别及其相应的频数全部列出来就是“频数分布”。频数分析是所有问卷调查中最广泛使用的分析技巧。因为它的频数分布表的建表方式最简单,分析阅读最容易,是一般大众最能接受的分析结果。普通报纸杂志上对调查结果通常也只是建立频数分布表而已。因为如果使用其他分析方法,读者也不见得能看懂,如何引起共鸣呢?,2023/10/1,基本统计分析往往
3、从频数分析开始,通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。例如,在问卷数据分析中,通常应首先对本次调查的被调查者的状况(基本信息),如被访者的总人数、性别、学历、职业等进行分析和总结。通过这些分析,能够在一定程度上反映出样本是否具有总体代表性,抽样是否存在系统偏差。这些分析可以通过频数分析来实现。,一、频数分析概述,2023/10/1,一、频数分析概述,频数分析的第一个基本任务是编制频数分布表,第二个基本任务是绘制统计图。统计图是一种最为直接的数据刻画方式。频数分析有一维的和二维(交叉)的:先介绍单变量的一维频数分析,包括调查问卷中常用的单选题(定性变量,分类数据)
4、的一维频数分析和填空题(定量变量,数值型数据)的一维频数分析。然后介绍双变量的交叉表分析(二维频数分析)最后介绍调查问卷中常用的多选题(定性变量,分类数据)的频数分析。,2023/10/1,二、单变量的一维频数分析,例1-1 用SPSS实现品牌支持率的一维频数分析。1菜单:“Analyze”-“Descriptive Statistics”-“Frequencies”,打开一维频数分析对话框2确定进行一维频数分析的变量3选择统计分析结果4根据调查报告所需格式,修改频数分布表5将修改过的频数分布表复制到Word文件中,作为调查报告的一部分,2023/10/1,利用SPSS对单选题进行一维频数分析
5、,例1-1 用SPSS实现品牌支持率的一维频数分析。表1-1 品牌支持率的频数分布表,2023/10/1,利用Excel对单选题进行一维频数分析,调查问卷中常用的单选题的一维频数分布表,可以利用Excel的COUNTIF函数实现。COUNTIF(Range,Criteria)计算区域中满足给定条件的单元格的个数温馨提示:更为方便的方法是利用Excel的“数据透视表”。,2023/10/1,利用Excel对单选题进行一维频数分析,例1-2 利用Excel求“品牌倾向”的一维频数分布表。,2023/10/1,在Excel中绘制一维频数分布统计图,有道是:“文不如表,表不如图”,即所谓的“一图胜千言
6、”。取得一维频数分布表后,在分析上,为方便解释,经常将其绘制成柱形图(条形图)或饼图。绘制统计图表是Excel的专长,所绘制的图表比SPSS或SAS统计软件绘制的图表并不差甚至要好。,2023/10/1,在Excel中绘制一维频数分布统计图,例1-4 根据例1-2求得的品牌支持率的频数分布表,绘制品牌支持率的柱形图,2023/10/1,在Excel中绘制一维频数分布统计图,例1-5 根据例1-2求得的品牌支持率的频数分布表,绘制品牌支持率的饼图。,2023/10/1,利用SPSS对填空题进行一维频数分析,前面所有一维频数分布表的例子,其答案都是非连续型的数字数据(分类数据)。但如果碰上如月费、
7、百分制分数、收入、身高等连续型数据(数值型数据),就得先将数据分成几个区间(即数据分组)。在SPSS中,通过重新编码,将数值型数据转换为分类数据(新变量),然后再对新变量求一维频数分布表。,2023/10/1,利用SPSS对填空题进行一维频数分析,例1-6 用SPSS实现手机平均月费的频数分布分析。请问您平均每个月手机的话费约为 元?重新编码生成新变量菜单:“Transform”-“Recode”-“Into Different Variables”Old and New Values:平均月费-月费分组对新变量进行一维频数分析菜单:“Analyze”-“Descriptive Statist
8、ics”-“Frequencies”新变量:月费分组,2023/10/1,利用SPSS对填空题进行一维频数分析,例1-6 用SPSS实现手机平均月费的频数分布分析。,在191名受访大学生中,有119名同学有手机(占62.3%),而有72名同学没有手机。在有手机的119名受访大学生中,平均每月手机话费在2140元的同学最多,约占三分之一(32.8%);有近五分之一(7.6%4.2%5.9%=17.7%)同学的每月手机话费在60元以上。,2023/10/1,利用Excel对填空题进行一维频数分析,例1-7 用Excel对学生成绩进行处理和统计。有某学院2008级2个班136名同学的某门课程的成绩(
9、包括平时成绩、期中成绩和期末成绩,假设这136名同学各个阶段都有成绩)。因为某大学教务系统对学生的最终成绩有规定:“优秀(90分及以上)率最好不超过20,且一定不能超过30,否则成绩无法提交。”因此,登录(录入)学生成绩前,老师们要先统计各个分数段人数的分布情况。,2023/10/1,利用Excel对填空题进行一维频数分析,例1-7 用Excel对学生成绩进行处理和统计首先,要根据学生的平时成绩、期中成绩和期末成绩,计算最终成绩。可利用“条件格式”将不及格(60分以下)的成绩用红色字体标识出来。然后根据最终成绩,统计各个分数段人数的分布情况。这里介绍两种统计各个分数段人数的方法:(1)用COU
10、NTIF函数进行统计;(2)用FREQUENCY函数进行统计。相比用COUNTIF函数,用FREQUENCY函数更方便些,它采用“数组公式”实现。,2023/10/1,利用Excel对填空题进行一维频数分析,例1-7 用Excel对学生成绩进行处理和统计用COUNTIF函数进行统计,2023/10/1,利用Excel对填空题进行一维频数分析,例1-7 用Excel对学生成绩进行处理和统计最终成绩统计图(饼图),2023/10/1,利用Excel对填空题进行一维频数分析,例1-7 用Excel对学生成绩进行处理和统计用FREQUENCY函数进行统计(采用“数组公式”实现),2023/10/1,三
11、、双变量的交叉表分析,利用SPSS对两个定性变量(两个单选题)进行交叉表分析利用Excel数据透视表实现频数分析交叉表的相关性检验,2023/10/1,双变量的交叉表分析,市场调查或民意调查,经常利用交叉表(又叫列联表)来分析两个分类(定性)变量之间的关系,比如:性别与品牌偏好、教育程度(学历)与使用品牌、收入与是否有数码相机、性别与移动电话类型偏好、地区与移动电话类型偏好,等等。交叉表分析易于理解,便于解释,操作简单,却可以解释比较复杂的现象。交叉表经常用于市场研究,进行市场机会、市场细分分析等。,2023/10/1,利用SPSS对两个定性变量进行交叉表分析,例1-8 分析不同性别(或种族、
12、或居住地区)的美国人对生活方面(幸福感、生活是否充满激情)的认识情况。这个问题可以分解为6个小问题:(1)分析不同性别的美国人对幸福感的认识情况(2)分析不同种族的美国人对幸福感的认识情况(3)分析居住在不同地区的美国人对幸福感的认识情况(4)分析不同性别的美国人对生活是否充满激情的认识情况(5)分析不同种族的美国人对生活是否充满激情的认识情况(6)分析居住在不同地区的美国人对生活是否充满激情的认识情况,2023/10/1,利用SPSS对两个定性变量进行交叉表分析,例1-8 分析不同性别(或种族、或居住地区)的美国人对生活方面(幸福感、生活是否充满激情)的认识情况。1.用SPSS的Crosst
13、abs求交叉表 菜单“Analyze”-“Descriptive Statistics”-“Crosstabs”2.在Excel中修饰交叉表并绘制百分比堆积柱形图3.在Word中撰写交叉表分析报告,2023/10/1,利用SPSS对两个定性变量进行交叉表分析,“性别”与“幸福感”的交叉表,2023/10/1,利用SPSS对两个定性变量进行交叉表分析,男女对幸福感认识的百分比堆积柱形图,2023/10/1,利用SPSS对两个定性变量进行交叉表分析,在Word中撰写交叉表分析报告(男女对幸福感的认识情况)交叉表分析报告,一般包含表格、百分比堆积柱形图(或三维簇状柱形图)和结论(建议)。,此次调查了
14、1517名美国人,其中有1504人对“性别”和“幸福感”这两个单选题都作了回答(占总调查人数的99.1)。关于不同性别的美国人对幸福感认识的交叉表和柱形图如表XX和图XX所示。此次调查的结果显示:受访者中,无论男女,认为“比较幸福”的居最多数(男59.1%,女57.2%),认为“非常幸福”的居中(男32.5%,女30.0%)。此外,就相对程度来看,认为生活幸福(“比较幸福”和“非常幸福”的比例之和)的美国人中,男性比例明显超过女性(91.6%对87.2%),可以看出女性的幸福感低于男性,而感觉“不太幸福”的女性的比例则高于男性。说明女性更渴望生活幸福。,2023/10/1,利用Excel数据透
15、视表实现频数分析,为了解某大学统计学院本科学生对该学院计算机课程教学的看法和意见,设计调查问卷,进行随机抽样调查了85名同学,得到调查数据。根据调查所得数据进行基本统计分析,希望掌握以下几个方面的情况:(1)学生对计算机课程设置的看法。(2)学生对计算机教学方法的看法。(3)学生对计算机选修课程的意见。,2023/10/1,利用Excel数据透视表实现频数分析,利用Excel数据透视表,可以很方便地实现单变量的一维频数分析和双变量的交叉表分析。数据透视表是Excel特色的数据分析功能,只需几步操作,它就能灵活地以多种不同方式展现数据的特征,变换出各种类型的报表,实现对数据背后的信息透视。数据透
16、视表最大的特点是交互性。,2023/10/1,利用Excel数据透视表实现单选题的一维频数分析,例1-9 分析学生对计算机课程设置的看法菜单:“数据”-“数据透视表和数据透视图”学生对计算机课程设置看法的一维频数分布表,2023/10/1,利用Excel数据透视表实现单选题的一维频数分析,例1-9 分析学生对计算机课程设置的看法计算机课程能否满足专业需要的饼图,2023/10/1,利用Excel数据透视表实现两个单选题的交叉表分析,例1-10 分析不同性别的学生对计算机课程设置的看法菜单:“数据”-“数据透视表和数据透视图”男女同学对计算机课程设置的看法,2023/10/1,利用Excel数据
17、透视表实现两个单选题的交叉表分析,例1-10 分析不同性别的学生对计算机课程设置的看法男女同学对计算机课程设置看法柱形图,2023/10/1,利用Excel数据透视表实现两个单选题的交叉表分析,例1-11 分析不同专业方向的学生对计算机课程设置的看法。在例1-10数据透视表汇总结果基础上修改不同专业方向的学生对计算机课程设置的看法,2023/10/1,利用Excel数据透视表实现两个单选题的交叉表分析,例1-11 分析不同专业方向的学生对计算机课程设置的看法。不同专业方向的学生对计算机课程设置看法柱形图,2023/10/1,交叉表的相关性检验,研究交叉表(二维列联表)的一个主要目的是看这两个变
18、量有无相关性。也就是说,在交叉表的基础上作进一步分析,可以得到行变量和列变量之间是否有联系、联系的紧密程度如何等更深层次的信息。交叉表的卡方检验用SPSS进行交叉表的相关性检验用Excel进行交叉表的相关性检验,5.3小节了解即可,2023/10/1,交叉表的卡方检验,例1-12 分析在例1-8的问题(1)中,性别和幸福感是否相关。相关性检验的零假设和备选假设为:H0:性别和幸福感之间无关(即不同性别的美国人在幸福感的分布上没有显著差异,或不同幸福感的美国人在性别的分布上没有显著差异)H1:性别和幸福感之间相关(即不同性别的美国人在幸福感的分布上有显著差异,或不同幸福感的美国人在性别的分布上有
19、显著差异),2023/10/1,用SPSS进行交叉表的相关性检验,菜单:“Analyze”-“Descriptive Statistics”-“Crosstabs”选项:“Statistics”选项中的“Chi-square”,2023/10/1,用SPSS进行交叉表的相关性检验,进行相关性检验后,调查报告中的交叉表就需要增加相应的信息。表59 不同性别的美国人对幸福感的认识情况,相关性检验结果表明,p值为0.021,小于显著性水平0.05,因此拒绝零假设,说明性别和幸福感之间相关(男女两性对幸福感的认识有显著差异),2023/10/1,四、多选变量的频数分析,利用SPSS对多选题进行频数分析
20、利用Excel对多选题进行一维频数分析绘制多选题的一维频数分布统计图,2023/10/1,多选变量的频数分析,调查问卷中经常会存在一定数量的多项选择题(多选题)。多项选择题可以在SPSS和Excel中做成多个内容相同的变量。这些变量称为多选变量。对多选变量进行分析时,不仅希望知道某些选项在第一选、第二选或第三选中分别有多少人选,还希望知道某些选项在多次选择中总共被选择了多少次,这个问题要通过多选变量分析来解决。,2023/10/1,利用SPSS对多选题进行频数分析,在SPSS中有解决多选题的菜单,方法是先将多选题中的若干答案组成一个综合变量(即变量集Set),然后对综合变量的各种取值进行分析。
21、多选题的频数分析在SPSS中是通过“Analyze”-“Multiple Response”菜单实现的。具体子菜单如下:(1)Define Sets:建立多选“二分法”编码变量集或多选“分类法”编码变量集。用一个多选变量集代表多个变量。(2)Frequencies:对多选变量集进行一维频数分析;(3)Crosstabs:对多选变量集与其他多选变量集或与原单选变量进行交叉表分析。,2023/10/1,利用SPSS对多选题进行频数分析,例1-13 用SPSS实现健康状况多选题的一维频数分析hlth1hlth9:“二分法”编码(Dichotomies)菜单:“Analyze”-“Multiple R
22、esponse”-“Define Sets”,建立多选“二分法”编码变量集“$健康”菜单:“Analyze”-“Multiple Response”-“Frequencies”,对多选变量集(“$健康”)进行一维频数分析,2023/10/1,利用SPSS对多选题进行频数分析,例1-13 用SPSS实现健康状况多选题的一维频数分析菜单:“Analyze”-“Multiple Response”-“Define Sets”,建立多选“二分法”编码变量集“$健康”,2023/10/1,利用SPSS对多选题进行一维频数分析,例1-14 撰写有关健康状况多选题的分析报告(1)将多选题一维频数分布表拷贝到
23、Excel中;(2)根据调查报告所需格式,在Excel中修饰多选题一维频数分布表;(3)绘制多选题的一维频数分布条形图;(4)在Word中撰写“健康”状况多选题的一维频数分析报告,2023/10/1,利用SPSS对多选题进行一维频数分析,例1-14 撰写有关健康状况多选题的分析报告表1-5“健康”状况多选题的一维频数分布表,注意:以“回答人数(714人)”为分母,而不是以回答总次数(1108)为分母,按照百分比排名顺序显示更好些,2023/10/1,利用SPSS对多选题进行一维频数分析,例1-14 撰写有关健康状况多选题的分析报告图6-8“健康”状况多选题的一维频数分布条形图,按照百分比排名顺
24、序显示更好些,2023/10/1,利用SPSS对多选题进行一维频数分析,例1-15 用SPSS实现遇到问题多选题的一维频数分析prob1prob4:“分类法”编码(Categories)菜单:“Analyze”-“Multiple Response”-“Define Sets”,建立多选“分类法”编码变量集“$遇到问题”菜单:“Analyze”-“Multiple Response”-“Frequencies”,对多选变量集(“$遇到问题”)进行一维频数分析,2023/10/1,利用SPSS对多选题进行一维频数分析,例1-15 用SPSS实现遇到问题多选题的一维频数分析菜单:“Analyze”
25、-“Multiple Response”-“Define Sets”,建立多选“分类法”编码变量集“$遇到问题”,2023/10/1,利用SPSS对多选题进行一维频数分析,补充:有关遇到问题多选题的分析报告遇到问题多选题的一维频数分布表,2023/10/1,利用SPSS对多选题进行一维频数分析,补充:有关遇到问题多选题的分析报告遇到问题多选题的一维频数分布条形图,2023/10/1,利用Excel对多选题进行一维频数分析,多选题的一维频数分布表,可以利用COUNTIF函数求得。针对多选题的3种不同情况,要分别处理:(1)对于多项限选不排序,并且采用“分类法”编码输入数据的多选题,处理时需要根据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 描述 统计分析

链接地址:https://www.31ppt.com/p-6166868.html