统计学ppt课件(含SPSS软件教程).ppt
《统计学ppt课件(含SPSS软件教程).ppt》由会员分享,可在线阅读,更多相关《统计学ppt课件(含SPSS软件教程).ppt(614页珍藏版)》请在三一办公上搜索。
1、统 计 学(含SPSS)实 验 室 机 房 版,建议在WindowsXP操作系统下安装SPSS11.0或SPSS11.0以上的版本,以便于全面展开本课程的学习。,课程简介 统计是搜集、分析、表述和解释数据的一门艺术和科学。研究随机现象的数量规律性。它在许多学科领域都有着重要的应用。它是解决社会经济实践活动中各种问题的有力工具之一。 统计学概念体系十分繁杂,大体可区分为基础统计与高级统计两个层次。基础统计主要研究截面数据中单变量数据的搜集、描述与推断,以及两个变量之间协变关系的描述与推断。高级统计则主要研究多变量数据的描述与推断,此外还包括序列数据的描述与推断。高级统计具体应包括:多元统计、非参
2、数统计、时间序列等。 无论是基础统计还是高级统计,都贯穿着描述与推断两条基本线索。本课程集中介绍基础统计的内容。这将为同学们今后的学习打下一个基础。 基础统计的内容主要包括:图表描述、统计量描述、参数估计、假设检验、方差分析、卡方分析、回归分析。其中:图表描述和统计量描述属于描述统计的内容;参数估计、假设检验、方差分析、卡方分析和回归分析属于推断统计的内容。同学们在本课程的学习中,要紧紧抓住描述与推断这两条线索,重点理解和掌握各种统计方法的原理。 统计实践活动要与大量的数据打交道,涉及十分繁杂的计算。统计软件在人们日常的统计工作中扮演着不可缺少的关键性角色。学会一两种统计分析软件的实际操作,是
3、十分必要的。目前的统计软件有:SAS、SPSS、S-PLUS、MINITAB、EXCEL等。其中,SAS与 SPSS是最为流行的两种统计软件。特别是SPSS,在各类院校以及科研机构中更为流行。 本课程根据SPSS自身的特点,以实际数据为纽带,将统计方法基本思想的理解与SPSS的实际操作做了有机的结合,力求使同学们在理解常用统计分析方法原理的同时,能够将统计软件灵活运用到实际的统计分析工作中去。,浏览向导 为充分体现统计学概念体系的内在关联性,本课程中的课件制作,打破了传统教材和课件中“章”、“节”、“目”的编排体例,而采用了“图形链接”的编排方法。在浏览课件的过程中,同学们要善于运用这些图形的
4、链接规律,以便展开整个课程的学习。现将本课程“课程讲解”课件的浏览方法简介如下: 一、 “概述”中出现了4个图形。第一图-“统计基本程序图”,概括了统计的基本程序和基础统计学的全部内容,是本课程的总图。图中的每一个对象,都设有链接。您将“鼠标箭头”指向某一对象,如果出现“小白手”,就表明此处设有链接,点入浏览就可获得有关此对象的内容讲解,这些都是统计学中处于核心地位的重要概念。 第一图中的“抽样”字样链接第二图-“抽样方法构成图”,概括了样本抽取的基本方法。根据课程大纲的要求,本课程并未对此展开介绍。第一图中的“描述”字样链接第三图-”统计描述方法构成图“,概括了统计描述的基本方法,包括两类方
5、法,图表描述与统计量描述。统计描述的具体方法由此图展开介绍。 第一图中的“推断”字样链接第四图-“统计推断方法构成图”,包括“参数估计”、“假设检验”、“方差分析”、“回归分析”等项。统计推断的具体方法由此图展开介绍。 二、本课程的课程讲解由8个部分构成(不包括“指数”和”时间序列”)。“1概述”、“2图表描述”、“3统计量描述”、“4参数估计”、“5假设检验”、“6列联分析”、7“方差分析”、“8回归分析”。每一部分中的第一张幻灯片中都设有一个“SPSS操作方法”链接。您可在学习了本部分所介绍的方法原理之后,再点击浏览“SPSS操作方法”。 三、每一张幻灯片中的有关链接都是“隐藏着的”,这主
6、要是为了保持版面的清晰和整洁。建议您在浏览每一张幻灯片时,经常用“鼠标箭头”去寻找设有链接的“小白手”, “小白手”会引导您看到更多的内容。“返回”的链接都设在幻灯片的左上角。右上角,左下角没有设置链接。右下角偶尔设有“继续”的链接。幻灯片的左上角或右下角以及版面中的各个对象如果没有设置链接,空点“鼠标箭头” 即可进入下一张幻灯片。 课件中 “图形链接” 和”链接暗设 “的编排方法,开始可能会使您觉着不习惯,但我们相信这一定难不着您。我们采取这种编排方法,还有另一个用意,就是希望您在对“图形”和“链接”的浏览过程中,能够玩索而有得。,用SPSS作数据集,概 述,从总体中抽取样本,由样本测得变量
7、的观测值,从而获取样本数据,根据样本数据计算有关的统计量,并由此来推断总体参数。 样本数据的整理过程与统计量的计算的过程同时也是对样本数据的描述过程,因此统计方法包括抽样、描述与推断三个方面的内容。,一个典型的统计问题 某电子公司采用新技术生产出一批高亮度灯泡。这批灯泡的使用寿命多长?合格率是多少?与传统技术相比,灯泡的使用寿命是否有所提高?,总 体,总体参数,样 本,图 表,统计量,样本数据,描述,推断,抽 样,统计的基本程序图,描述,推断,总体由我们所感兴趣的所有个体的集合构成。,个体,总体,200只灯泡样本的可使用小时数,某电子公司从其灯泡产品中随机抽取二百只,测得其使用小时数数据如下:
8、,我们对总体中众多个体某一个或几个方面的属性感兴趣,这些属性称为变量(variable) 。如本例中灯泡的“使用小时数”就是一个变量。,样本数据是就某一个或某几个变量,对样本中的个体集得到的数据。本例表中的数据就是一个典型的样本数据。,np项观测值(observation)。,数据阵列的一般结构,10青少年身高体重表,编码,为方便计算机操作可对品质型变量的取值进行编码。,10名青少年身高体重表,关于投票选举一次抽样调查的数据阵列,关于投票选举一次抽样调查的数据阵列,数据的误差,登记性误差,代表性误差,调查者造成的登记性误差,被调查者登记性误差,系统误差,随机误差,理论上可以避免,理论上不可避免
9、,背离随机原则的样本会造成数据的系统误差。抽样的随机性造成随机误差。,好的样本,总体,背离随机原则的坏的样本会造成数据的系统误差。,抽样误差(sampling error),抽样随机性造成的随机误差。,5种软饮料购买频数原始记录,三十名学生的身高与体重数据,某地一星期申请结婚女性年龄原始数据,11名学生各科成绩,食物中热量与脂肪两个变量的样本数据,10家饭店附近学生人数与季销售收入,行驶里数、运货次数和行驶时间样本数据,关于改革方案调查结果的样本数据,关于计算机课程教学意见的样本数据,四种颜色饮料销售量样本数据,男性与女性饮者啤酒偏好的样本数据,国籍与对等陌生人的态度样本数据,原料等级与产地分
10、布抽样数据,数据的计量有四种尺度,定类尺度nominal scale,定序尺度ordinal scale,定距尺度interval scale,定比尺度ratio scale,按照某属性对事物进行平行的分类。(=、),对事物类别间等级或顺序差别的测度。(、),对事物类别或次序之间差距的测度。(+、-),对事物类别或次序之间差距及差别程度的测度。(、),变量,变量值,编码,性别,男 女,1,2,人种,白 黄 棕 黑,1,2,3,4,定类尺度数据没有顺序和大小区别。,定类尺度,变量,编码,定序尺度数据不能测量差别的多少。,定序尺度,产品等级,一等品,二等品,三等品,1,2,3,对事物的态度,很满意
11、,满 意,中 立,不满意,反 对,1,2,3,4,5,变量值,定距尺度数据不能计算比值。,定距尺度,3点,6点,定比尺度数据可以计算比值。,定比尺度,6枚,3枚,变量类型的划分,品质型变量,数量型变量,10青少年身高体重表,品质型变量,品质型变量,数量型变量,关于投票选举一次抽样调查的数据阵列,某城市家庭对住房状况评价频数分布表,定序,数量型变量,定类,品质型变量,数量型变量,200只灯泡使用寿命频数分布表,表格使大量零散的原始数据更容易理解。,200只灯泡的使用寿命频数分布表,除表格和图形外,我们还可以计算有关的描述性统计量对样本数据加以概括,如:通过计算可得二百只灯泡使用小时数均值为 76
12、.1,用以概括地说明灯泡使用寿命的一般水平。,关于灯泡总体平均使用寿命的统计推断过程,随机抽样,非随机抽样,简单抽样,复杂抽样,重复抽样,不重复抽样,分层抽样,整群抽样,系统抽样,样 本,抽 样,样本数据,抽样方法构成图,图表描述,统计量描述,条形图,直方图,盒形图,饼形图,品质型变量,数量型变量,集中趋势,离散趋势,分布形态,均值,极 差,中位数,众数,方 差,偏度,峰度,总体,样本,统计描述方法构成图,分类型变量与分类型变量,数量型变量与数量型变量,顺序型变量与顺序型变量,分类型变量与数量型变量,数量型变量与分类型变量,分类型变量,顺序型变量,数量型变量,参数估计,逻辑斯蒂分析,假设检验,
13、回归分析,秩的方法,列联分析,方差分析,统计推断方法构成图,结 束,用SPSS作数据集,Statistical package for the social science (简写spss)是美国spss公司在20世纪80年代开发的大型统计学软件包。在全世界的范围内的科研活动中应用十分广泛。Spss for windows 11.0是其在90年代未推出的新版本。与其它统计软件相比,spss不用记忆繁琐、枯燥的语句和命令,只要用户具有一般的计算机和统计学知识,就能运用鼠标进行操作,得到所需要的统计分析结果。以下简明扼要地介绍定的具体使用方法。,Spss 对环境的要求,Spss 的安装,Spss
14、的界面,建立数据集,编辑数据集,数据运算,Spss for windows 版具有如下特点:,Sample data 1MBHelp files 11MBBasic scripting 2MBProduction mode facility 1MBStatistics coach 2MBSyntax guide 16MB,Spss 对环境的要求,启动计算机,将Spss 11.0光盘插入光驱,第一步,在“我的电脑”中点击“E”或“F”盘,找到spss文件夹,点击“ setup.exe”,启动安装程序,第二步,根据安装程序的提示向导,依次进行安装, 并输入软件系列号码、用户姓名和单位名称,第三步,
15、退出安装程序,第四步,SPSS安装步骤,SPSS的安装,Spss的主窗口- Data view 数据浏览界面,SPSS的界面,Spss的主窗口- variable view变量浏览界面,SPSS的界面,File: 文件操作完成文件的调入、存储、显示和打印等操作。,SPSS的界面,edit: 文件编辑完成文本或数据内容的选择、拷贝、剪贴、寻找 和替换等操作。,SPSS的界面,view: 浏览编辑完成文本或数据内容的状态栏、工具栏、字体、网格线和数值标签等功能的操作。,SPSS的界面,data: 数据管理完成数据变量名称和格式的定义,数据资料的选择、排序、加权、数据文件的转换、连接和汇总等操作。,
16、SPSS的界面,transform: 数据转换完成数据值的计算、重新编码和缺失值替代等操作。,SPSS的界面,analyze:统计分析完成一系列统计分析的选择和应用。,SPSS的界面,graphs:统计图表完成统计图表的建立和编辑。,SPSS的界面,utilities:实用程序有关命令解释、字体选择、文件信息、定义输出标题和窗口设计等。,SPSS的界面,window: 窗口控制可进行窗口的排列、选择和显示等操作。,SPSS的界面,Help: 帮助帮助文件的调用、查询和显示等。,SPSS的界面,Spss的结果输出窗口,输出Spss的统计分析程序的结果,SPSS的界面,三十名学生的身高与体重数据,
17、建立数据集,数据集1,Spss的主窗口有两个界面:数据浏览界面(data view)与变量浏览界面(variable view)建立数据文件首先要定义变量。,建立数据集,Name: 变量名 在该栏输入变量名(只能用字母)本例定义5个变量:NumberSexAgeHeightweight,建立数据集,type: 变量类型 系统默认为数值型有8种类型可供选择:1.Numeric:数值型变量2.Comma:带逗号的数值型变量3.Dot:带圆点的数值型变量4.Scientific:科学记数法5.Date:日期型变量6.Dollar:货币型变量7.Custom currency: 自定义型变量8.Str
18、ing:字符型变量,为便于统计,本例全部定义为数值型。,建立数据集,width: 宽度本例中各变量的宽度:Number 2Sex 1Age 2Height 5Weight 4,建立数据集,decimals: 小数位数本例中各变量的小数位数:Number 0Sex 0Age 0Height 1Weight 1,建立数据集,label: 变量标签本例中各变量的标签:Number编号Sex 性别Age 年龄Height 身高Weight 体重,建立数据集,value: 数值标签本例定义“sex”数值标签:“男”“1”“女”“0”,建立数据集,missing: 缺失值本例选择无缺值。,建立数据集,co
19、lumns: 列宽本例中各变量数据管理器纵列宽全部定义为8。,建立数据集,align: 字符排列方向有三项选择:left 左对齐right 右对齐center 居中本例中全部选择右对齐。,建立数据集,measure: 数据量度有三项选择:scale 连续型变量ridinal 有序分类变量nominal 名义型变量本例中除 “sex”选为名义型变量外,其余均选连续型变量。,建立数据集,编辑数据集,1、插入变量,3、按体重排序,2、插入观测,4、行列互换,5、(按性别)数据拆分,6、分类汇总,编辑数据集,激活变量“age”点击“data”菜单点击子菜单“ insert variable” 系统自动
20、插入一个默认名为“var00001”的新变量。,编辑数据集,激活第3个观测点击“data”菜单点击子菜单“ insert case” 系统自动插入一个默认为第3的新观测。,编辑数据集,点击“data”菜单点击子菜单“ sort case”打开 sort case 对话框点击weight进行右侧框内选定ascending(升序) ok。,编辑数据集,点击“data”菜单点击子菜单“ transpose”打开 transpose对话框选中左侧框内的所有变量,点击进入右侧框ok。,编辑数据集,点击“data”菜单点击子菜单“ split file”打开split file对话框选中compare g
21、roups 选中sort the file by grouping variables 点击sex进入右侧groups based on框ok。,编辑数据集,点击“data”菜单点击子菜单“ aggregate”打开aggregate对话框将sex和age选入break variables框 作出相关的选择 ok。,编辑数据集,数据运算,1、计算:体重指数=体重/身高2,2、清点:身高160以下的人数,3、分组:按身高将观测分为4组,数据运算,点击“transfom”菜单点击子菜单“ compute”打开compute variable对话框在target variable中指定一个变量(可以
22、是新变量) 在typelable中定义生成数据的类型或标签在numeric expression框中键入公式ok。,供选择的100余种函数,数据运算,点击“transfom”菜单点击子菜单“ count”打开count occurrences of values within cases对话框在target variable中指定一个变量(如h) 将height点入numeric variables框再点击define values打开count values within cases:values to count对话框,来确定清点对象数值ok本例选择range中lowest through
23、160.0为清点范围ok。,数据运算,数据运算,点击“transfom”菜单点击子菜单“ categorize variables”打开categorize variables对话框在target variable中指定一个变量(如h)确定分组数(系统默认4组)ok。,数据运算,结 束,关键术语,统计学(statistics)搜集、分析、表述和解释数据的艺术和科学,总体(population)研究对象的全体,由个体构成,个体(elements)构成总体的基本单位,是搜集数据的直接对象,样本(sample)总体的一个子集,数据(data)被搜集、分析和解释的事实与数字,统计量(statistic
24、)从样本数据中计算出来的数,参数(parameter)对应于总体的常数,常数(constant)相对于变量而言的不变的数,描述统计学(descriptive statistics)用表图数值汇总数据的方法,统计推断( statistical inference)用从一个样本获得的数据对总 体参数进行估计或假设检验的过程,结 束,图表描述,用SPSS作图表描述,定类数据的图表描述,定序数据的图表描述,尺矩数据的图表描述,图表描述,多变量数据的图表描述,5种软饮料购买频数原始记录,定类数据的图表描述,频数是落在各类别中的数据个数。各类别频数与总频数之比称频率。频数和频率分别从绝对数和相对数上,反映
25、出数据在各变量值上的分布状况。,0,10,20,可口可乐,雪碧,杏仁露,新 骑士,醒目,条形图(bar chart),定类数据频数分布的图示可采用饼形图或条形图,饼形图(pie chart ),用饼形图表示频率分布,频数,38%,10,0%,10,0%,16,0%,26,0%,38,0%,定类数据的图表描述,饼形图的组数不宜太多,38%,10,0%,10,0%,16,0%,26,0%,38,0%,定类数据的图表描述,可口可乐,雪碧,杏仁露,新 骑士,醒目,0,10,20,0,10,20,可口可乐,雪碧,杏仁露,新 骑士,醒目,阿拉伯人的观赏习惯,中国人的观赏习惯,0,10,20,雪碧,新 骑士
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 ppt 课件 SPSS 软件教程
链接地址:https://www.31ppt.com/p-1435418.html