SPSS统计描述和图表.ppt
《SPSS统计描述和图表.ppt》由会员分享,可在线阅读,更多相关《SPSS统计描述和图表.ppt(69页珍藏版)》请在三一办公上搜索。
1、统计描述,2,统计描述中可用的工具,各种初步汇总描述方法分组汇总,最终汇总成相应的分组频数表,可以反应出数据的大致趋势多个百分位数组合起来,也能反应数据的分布特征对信息的利用仍然比较粗糙各种统计描述指标实际上是更复杂的各种描述工具的基础,是针对数据的某种特征进行精确的数字呈现的一系列指标对于样本而言,这些统计描述指标也可被称为统计量均数、标准差、四分位间距,比、率等,3,统计描述中可用的工具,统计表当数据比较复杂,所计算的统计指标较多时,直接观察所计算出的数值比较麻烦,为此人们又会按照一定的排列方式将统计指标组织为一张表格,以方便使用。统计图统计表虽然能做到非常精确,但是不够直观,如果希望结果
2、更为直观一些,则可以按照统计指标的大小将其绘制为一张图形,这就是所谓的统计图。,4,统计描述的模块,SPSS中所有专业的制表过程都能够完成统计描述的任务Reports菜单项:主要输出文本化报表Tables菜单项:输出标准的SPSS结果表格Multiple Response菜单:专门用于多选题数据描述但Descriptive菜单项中提供的是最基本的统计描述过程,5,统计描述的模块,Frequencies过程计算各种常用的描述指标特色是产生频数表对分类资料和定量资料都适用Descriptive 过程一般性的统计描述适用于服从正态分布的定量资料,6,统计描述的模块,Explore 过程用于对数据分布
3、状况不清时的探索性分析功能极为强大Crosstabs过程完成分类资料和等级资料的统计描述完成分类资料各种各样“常规”的统计检验Ratio过程用于两个连续变量计算相对比指标,很少用PP图和QQ图,分类变量的统计描述,8,分类变量的常用描述指标,基本的描述方式原始数据:频数列表百分比累计频数累计百分比集中趋势众数,9,分类变量的常用描述指标,比:任意两个变量之比,这两个变量可以是性质相同的两个指标,如两个地区相同时期内某病新发病例数之比;也可以是性质不相同的两个指标之比 性别比,货物/销售人员比构成比:部分占总体的比例,分观察对象为k个部分(A1、Ak),其中某一个部分观察对象数与观察对象总数之比
4、为构成比率:某个时期内某个事件发生的频率或强度,实际上有速度的概念在里面,可以和物理中速率的定义相对照,10,分类变量的联合描述,列联表常见的是二维,但三维及更高维列联表的使用原理是完全相同的频数行、列、总百分比行、列、总合计,11,多选题的描述,对多选题进行分析时所遇到的最大困难就是各选项间存在着关联,将它们单独进行分析并不恰当。单独分析的结果仅反映选项自身情况,不能完全代表整个题目的情况因此在描述时就需要采用基于频次的百分比等一些特殊指标,12,常用分析指标,应答人数与应答人次Case&Response应答人数百分比(Percent of Cases)选择该项的人占总人数的比例用于反映选项
5、自身被选择的情况应答次数百分比Percent of Responses选择该项的次数占总次数(总反应数)的比例用于选项间受欢迎程度的比较,13,统计描述的SPSS实现,Frequencies过程专门为产生频数表而设计,默认选项即可给出需要的结果Crosstabs过程生成二、三维交叉表默认只输出频数,计算百分比需要更改选项Multiple Response菜单专门为多选题数据的描述而设计输出格式较为简单,但使用方便Tables模块为制表提供了全面的支持仍然只涉及数据描述,连续变量的统计描述,15,频数表 Frequency,是一种非常直观的方法,但比较粗糙,如果希望进行深入的分析,则必须要使用一
6、些严谨的统计指标对各方面特征加以描述操作步骤:确定组数;确定组距;确定各组段的上下限 各步骤的操作都存在着一些主观性,但因为只是进行初步的观察,这并无大碍,16,观察到的信息,集中趋势离散趋势分布形状(是否对称,分布曲线的形状)分布特征(单、双峰,有无极端值等),17,集中趋势 Central tendency,均数mean描述一组数据在数量上的平均水平,总体均数和样本均数用不同符号表示适用范围:对称分布,特别是正态分布资料几何均数G针对正偏态资料集中趋势的描述而提出适用范围:对数正态分布资料,但往往被进一步扩大到等比资料,18,集中趋势 Central tendency,中位数median
7、适用范围:万金油和均数相比较为迟钝,只有样本量较为充足时结果才稳定下来 众数mode所有数值中出现次数最多的一个适用范围:国外,19,离散趋势Dispersion tendency,全距Range适用范围最广,但是也最不稳定方差Variance离均差描述个体变异离均差和直接相加必然为0离均差绝对值之和数学推导困难离均差平方和,20,离散趋势Dispersion tendency,标准差 std.deviation解决了阅读时量纲的问题变异系数(coefficient of variation)解决了不同资料间变异程度对比的问题测量尺度相差太大:比较蚂蚁和大象的体重变异量纲不同:比较身高和体重的
8、变异程度,21,百分位数,一般的教科书上传统将其列为集中趋势的描述指标,但实际上不仅限于此,单独列为一类可能更为妥当适用于各种分布P2.5 P5 P10 P25 P50 P75 P90 P95 P97.5使用条件:只有样本量较大时结果才比较稳定,对位于两端的百分位数而言更是如此100例时,P95右侧只有5例!,22,百分位数,四分位数实际上是P25、P50和P75分位数的总称,他们正好能够将全部总体单位按标志值的大小等分为四部分的三个数值上(P75)、下(P25)四分位数的差值被称为四分位间距,23,其他描述指标,分布形状描述指标Distribution针对某种分布进行进一步的特征描述,主要是
9、用于正态分布偏度系数Skewness 正态峰 正偏态 负偏态峰度系数Kurtosis 正态峰 平阔峰 尖峭峰离群值与极端值列表,24,Frequencies过程,Statistics 子对话框Percentile Values组:输出的百分位数四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cut points for equal groups)、或直接指定某个百分位数(Percentiles)Central tendency组:描述集中趋势均数(Mean)中位数(Median)众数(Mode)总和(Sum)。,25,Frequencies过程,Statistics 子对话框D
10、ispersion复选框组:描述离散趋势标准差(Std.deviation)方差(Variance)全距(Range)、最小值(Minimum)最大值(Maximum)标准误(S.E.mean)。Distribution复选框组:描述分布特征偏度系数(Skewness)和峰度系数(Kurtosis)。分析实例信心指数的统计描述,26,Descriptive 过程,概述用于正态分布的连续型变量可直接计算标准化Z值分析实例同上,27,Explore 过程,概述可对变量进行更为深入详尽的描述性分析主要用于对资料的性质、分布特点等完全不清楚时常用描述性统计指标/图形更加详细、全面可分组进行描述,28,
11、Explore 过程,Statistics 子对话框Descriptives复选框输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数及其标准误、偏度系数及其标准误,以及指定的均数可信区间。M-estimators复选框作中心趋势的最大似然估计,输出四个不同权重的最大似然估计值。Outliers复选框输出五个最大值与五个最小值。Percentiles复选框输出第5%、10%、25%、50%、75%、90%、95%位数。,29,Explore 过程,plot子对话框Boxplots单选框组:确定箱图的绘制方式按组别分组绘制(Factor leve
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 统计 描述 图表

链接地址:https://www.31ppt.com/p-5449292.html