应用统计学(第三版)马立平等ppt课件.ppt
《应用统计学(第三版)马立平等ppt课件.ppt》由会员分享,可在线阅读,更多相关《应用统计学(第三版)马立平等ppt课件.ppt(225页珍藏版)》请在三一办公上搜索。
1、,应用统计学(第三版),首都经济贸易大学出版社,北京高等教育精品教材,目录,CONTENTS,第一章 统计学与统计数据第二章 统计数据收集的方法与数据质量第三章 数据的图表展示第四章 数据的统计量描述第五章 概率抽样与抽样分布第六章 参数统计第七章 参数的假设检验,第八章 方差分析第九章 非参数的假设检验第十章 相关分析与回归分析第十一章 主成分与因子分析第十二章 列联分析与对应分析第十三章 聚类分析与判别分析第十四章 时间数列分析与预测,第一章 统计学与统计数据,第一节 统计学的产生与发展第二节 统计学的性质与特点第三节 统计数据与统计规律第四节 经济管理实践中的统计统计应用的领域之一,1,
2、第一节,统计学的产生与发展,一、统计学的产生,17世纪中叶,西方社会首次出现了有意识地用数字语言说明问题, 从数量的角度探索客观事物变化规律的研究活动。当时,最具有代表性 的主要有政治算术学派和国势学派。政治算术学派的代表人物是英国的学者威廉配第(),著作政治算术。在统计史的研究中,一般把以威 廉配第为代表的关于社会经济现象“算术”式的研究,称为“政治 算术”。政治算术学派还有一位重要的人物约翰格 朗特()关于死亡表的自然观 察与政治观察。“国势学”主要研究有关国家兴衰强弱的重大问题以及治理国 家必备的方法。统计学的另一个重要起源是概率论。真 正意义上的概率论是从 世纪开始的。拉普拉斯是古典概
3、率论的集大成者。,第一节,统计学的产生与发展,二、统计学的发展,凯特勒()是统计学发展史上承前启后的重要人物。把概率论全面引进“政治算 术”、“国势学”以及其他社会问题的研究。世纪后半期,统计学在生物遗传学、农业田间试验等领域取得了 创新性的成果。进入 世纪,新的统计思想和统计方法大量涌现,带有归纳性质的 统计推断逐渐占据了主流地位。总体上说,世纪以来,传统意义上的统计学的发展有三个明显的 趋势:首先,随着数学的发展,统计学依赖和吸收数学方法的程度越来越 深;其次,统计学方法向其他学科领域广泛渗透,以统计学为基础的边缘 学科不断形成;最后,随着统计学应用的日益广泛和深入,特别是随着计 算机的发
4、展和大数据的形成,统计学正发挥着越来越大的作用。,第一节,统计学的产生与发展,三、统计学科体系,(一)理论统计学统计估计。假设检验。抽样调查。试验设计。非参数统计。时间序列。统计决策。序贯分析。多元统计。统计诊断。稳健统计。探索性分析。,(二)应用统计学统计计算方法。应用统计学的理论基础。应用统计学。其他。统计学与其他应用数学学科结合,形成新的应用数学方法的基础学科,如博弈论、多目标决策、随机规划等。,第二节,统计学的性质与特点,一、什么是统计学,“统计学是收集、分析、表述和解释数据的科学。”不列颠百科全书,统计学研究的是客观现象的数量方面,统计离不开数据。,第二节,统计学的性质与特点,二、统
5、计学的研究方法,(一)大量观察法大量观察法是指在客观事物的研究中,从总体出发,对其全部单位或足够多的单位进行观察和分析研究的方法。(二)综合指标法综合指标法是表明事物总体数量特征的数据,它是统计学研究事物总体数量方面的基本手段或工具。(三)归纳推断法归纳推断法是指以一定的置信标准,根据样本数据来判断总体数量特征的归纳方法。,第二节,统计学的性质与特点,三、统计学的性质与研究对象,第一,统计学是一门关于数据的科学,统计研究的是客观事物的数量特征,包括数量状态、数量关系和数量变化规律,统计的基本语言是数据。第二,统计学对大量同类现象的数量方面进行综合反映与研究,也就是说,统计学的研究对象是客观现象
6、总体的数量,单个数据的分析与 研究不是统计学的研究对象。第三,统计学的研究对象是不确定的现象,即随机性的变量。第四,统计的基本方法是归纳推断。,第三节,统计数据与统计规律,一、数据的计量尺度,第三节,统计数据与统计规律,二、数据的类型,第三节,统计数据与统计规律,三、统计规律,统计学是收集、分析、表述和解释数据的科学。通过对大量现象的观察或重复进行多次相同的实验并获取大量的数据后,我们就可以利用统计方法找到其内在的数量上的规律性。,之所以可以通过大量的数据认识事物变化的规律性,是因为客观事物本身是必然性与偶然性的对立统一,必然性反映了事物的本质特征和规律,而偶然性则反映了事物之间具体表现上的差
7、异。,第四节,经济管理实践中的统计统计应用的领域之一,经济管理统计应用中既包括宏观领域的经济统计分析;也包括微观领域中的企业商务管理统计的应用,即管理统计学等。此外,还有经济学家常被要求对未来的经济或对未来经济的某一方面提供预测,他们在进行这种预测时,要使用各种统计信息。,第二章 统计数据收集的方法与数据质量,第一节 统计数据的来源第二节 数据收集的方法第三节 问卷的设计第四节 统计数据的质量,2,第一节,统计数据的来源,一、数据的间接来源,二手数据主要是公开出版或公开报道的数据。有些是尚未公开出版的数据,这类数据的收集一般称作文案调查。,文案调查通常按以下几个步骤进行:,第二节,统计数据的来
8、源,二、数据的直接来源,数据的直接来源主要有两个渠道:一是统计调查或观察,二是基于实验设计基础上的实验。,(一)统计调查方式普查抽样调查()主观抽样调查()概率抽样调查,(二)实验设计方式实验设计一般包括五个相互关联的环节:一、根据实验的目的,设计实验方案,以保证每一个非被实验因素对被实验因素的作用相同,以突出被实验因素的效应,合理优化实验的次数;二、方案的实施;三、对实验结果进行测量,取得实验数据资料;四、运用统计方法,对实验数据进行分析,形成相应的结论;五、根据数据分析的结果,得出实验的结论。,第二节,数据收集的方法,一、访问法,第二节,数据收集的方法,二、报告法,第二节,数据收集的方法,
9、三、观察法,观察法是指调查者通过直接观察、跟踪和记录被调查者的情况来收 集资料的一种调查方法。观察法不同于日常生活中的观察,它具有目的性、计划性和系统性,而且要求观察者对所观察到的事实作出实质性的结论。,选择具体的方法时,需要综合比较各种方法的调查范围、调查对象的可控性、影响回答的因素、回收率、回答速度、回答质量和费用等,从而选择最适合的方法。,第三节,问卷的设计,一、问卷的概念和作用,问卷是现代调查中使用最为普遍的用于收集数据的一种表述调查项目的形式。问卷是指按询问提纲及要求填选答案的调查表。问卷不但有利于调查内容的系统化、标准化,便于对所取得的数据进行统计处理和定量分析,而且还可以节省调查
10、时间,提高工作效率。设计一份科学、完善的问卷,是调查得以成功的重要保证。,第三节,问卷的设计,二、问卷的基本内容与格式,第三节,问卷的设计,三、问卷设计中的询问技术,(一)问题的主要类型及询问方式根据所提问题性质的不同,可将问题分为直接性问题、间接性问题和假设性问题。根据对问题的作答方式不同,问卷中的问题可分为开放性问题、封闭性问题等。封闭性问题例如: 您的家庭目前收支情况总体上是( )。 有较多的节余 略有节余 收支基本平衡 入不敷出半开放、半封闭性的问题例如: 您目前最迫切需要解决的问题是( )。 购买住房 子女入学及教育 提高收入 医疗保障 就业 带薪休假 其他(请写出) 根据所提问题内
11、容的不同,问卷中的问题可分为事实性问题、行为性问题、动机性问题和态度性问题。行为性问题例如: 以下社区文化设施中,您最经常去的是( )(限选三项)。 图书馆 文化站 社区文化室 文化广场 影剧院 博物馆 健身运动场所 其他(请注明),第三节,问卷的设计,三、问卷设计中的询问技术,(二)设计问句时应注意的几个问题,第三节,问卷的设计,四、封闭性问题答案的设计技术,(一)答案选项设计的基本方法二选一。多项选择。第一,由于所设答案选项不一定能表达出被调查者所有的看法,所 以,在问题的最后通常可设“其他”选项,以便使被调查者表达自己的看法; 第二,多项选择中,由于选项较多,选项的顺序可能会影响被调查者
12、 的选择,从而使调查结果发生偏差,因而选项的顺序既可以随机排列,也 可以按字数的多少顺序排列。排序法。例如: 您认为目前对北京城市环境威胁最大的因素是( )(请按程度大 小顺序排列)。 塑料包装等白色污染物 废电池等电子垃圾 噪声污染 机动车污染物排放 工地扬尘 水污染 生活垃圾 其他(请注明)两两比较法。例如: 请比较下列每一对文化产业园区,哪一个是您更喜欢的?(每一对 中只选一个划) 中国(怀柔)影视基地 艺术区 798艺术区 潘家园古玩艺术品交易园区 潘家园古玩艺术品交易园区 宋庄原创艺术与卡通产业区 宋庄原创艺术与卡通产业区 琉璃厂历史文化产业园区 琉璃厂历史文化产业园区 北京(房山)
13、历史文化旅游区 北京(房山)历史文化旅游区 前门传统产业区 ,(二)答案选项设计的要求例如: 您经常看哪个栏目的电视节目? 经济生活 道德观察 新闻联播 其他(请注明) 经常看 偶尔看 根本不看,第三节,问卷的设计,五、问卷的编排设计和要求,(一)问卷的顺序容易回答的问题放在前面,较难回答的问题放在中间,敏感性的 问题放在后面。 封闭性的问题放在前面,开放性的问题放在后面。这是由于封闭 性的问题有现成的答案,较易回答; 而开放性的问题需要被调查者花费 一些时间考虑并填写,放在前面容易让人产生畏难情绪,从而不利于调 查的顺利进行。 要注意问题之间的逻辑顺序,如可按时间顺序、类别顺序等进行 排列。
14、 (二)问题的衔接例如: “您家有汽车吗?”( ) 有 如果有,您家的汽车是:()国产 ()进口 ()合资 无例如: 您看过导报这份报纸吗?( ) 经常看 偶尔看 从没看过(跳转到 )您对导报的总体评价是( )。 满意 一般 不满意,第四节,统计数据的质量,一、统计数据的质量,调查阶段的数据质量最为重要。评价数据质量的标准或对数据的基本要求是准确、及时、全面、系统。其中,对数据准确性的评价,往往可以从统计数据误差的角度进行。 为使数据质量检查有一个定量的描述依据,我们把统计数据质量的准确性解释为获得的观察值与客观现象实际数量水平之间的离差。离差大, 说明数据的准确性即数据的质量较差;离差小,说
15、明数据的准确性即数 据的质量较好。,第四节,统计数据的质量,二、统计数据的误差,(一)抽样误差即使所收集的样本数据完全正确可靠,它和总体真值之间也往往会存在差异,这种差异是由样本对总体的代表性所导致的,所以称为抽样误差。如果我们用 表示总体的均值,随机抽样得到样本的均值为x,则 x 就定义为抽样误差。采用计算标准差的方法来计算平均误差,并因而称其为抽 样 标 准 误 差 (后 面 简 称 为 抽 样 误 差),其定义用公式表示,则为 。(二)非抽样误差未响应导致的误差,也称为无回答误差。有意无回答现象对总体数据估计 推断可能产生的影响有:第一,由于无回答而使有效的样本量减少,从而使抽样误差增大
16、,达 不到原抽样设计时调查精度的要求。第二,由于无回答而带来估计量的偏误,而且这种偏误并不会由于 样本量的增大而减少。抽样框导致的误差。所谓抽样框,就是在抽样时,用以从中抽取 样本单位的包括全部总体单位的一个名单或框架。根据研究目的所确定的理想总体称为目标总体,抽样框所代表的总 体通常称为抽样总体。,第四节,统计数据的质量,二、统计数据的误差,抽样误差:属于代表性误差,在随机抽样中有时抽中偏小的单位,有时则抽中偏大的单位,这种误差没有系统性的方向。随着样本量的增大,其抽样误差会由于相互抵消而缩小。,非抽样误差:有系统性,根据不同的情况会偏向于某一方向,不会因样本量的增大而减少。,第四节,统计数
17、据的质量,三、统计数据质量的检查与要求,(一)后验方法后验方法是在调查工作已经完成后,不用亲临调查现场,而是通过对数据进行逻辑关系分析和计算比较,以及将调查数据与独立来源的资 料加以对比,以确定调查数据的质量。后验方法仅适用于对最后 调查结果的检查,不能用于单项数据误差的评估。(二)抽样检查抽样检查是指在一次调查之后,在尽量短的时间内再从这些被调查 单位中随机抽取一定数量的单位组成样本进行重新调查,将两次调查结果进行比较,以分析调查数据的质量,并对所收集的数据进行修正。抽样检查,必须是在一次调查之后不久就要进行,以免 调查对象及调查环境已发生较大的变化而导致评估无效。由于样本数据是检查的标准,
18、因而样本数据的抽取、收集与核查,需要安排专业 的统计人员进行。此外,样本单位的确定要考虑到随机性的要求,而且, 在考虑预算费用约束的条件下,要保证有合理的样本量。,第三章 数据的图表展示,第一节 定性数据的图表展示第二节 定量数据的图表展示第三节 统计图表应用中的几个问题,3,第一节,定性数据的图表展示,一、统计分组,(一)平行分组体系,(二)复合分组体系,第一节,定性数据的图表展示,二、定性数据的频数分布表,定性数据包括分类数据和顺序数据。定性数据本身就是对事物的一种分组,因此,只要先把所有的类别都列出来,然后统计出每一类别的数据个数(即频数),就可以进一步形成分组列表,也称频数分布表。,【
19、例3-1】我们将 年某地区城镇从业人员按其所在企业的登记 注册类型分组,并进行统计,形成下面的频数分布表。,第一节,定性数据的图表展示,三、定性数据的统计图示,(一)条形图与柱形图,条形图是用宽度相同的条形来表示数据多少的图形,主要用于观察不同类别数据的多少和进行各项信息的比较等。反映数据分布特征多用柱形图,而用数量观察各项信息的大小可以采用条形图。,第一节,定性数据的图表展示,三、定性数据的统计图示,(二)帕累托图,帕累托图是按各类别数据出现的频数的多少排序后绘制的条形图。,(三)饼图,饼图一般用来描述和表现各类数据或某一类数据占全部的百分比。,第一节,定性数据的图表展示,三、定性数据的统计
20、图示,(四)环形图,饼图只能显示数据集合中各类数据所占的比例。环形图与饼图类似,但又有区别。环形图可显示多个数 据集合各部分所占的相应的比例,有利于对各数据集合构成的比较。,第二节,定量数据的图表展示,一、定量数据的频数分布表,定量数据(包括定距数据和定比数据)在生成频数分布表时,需要先将原始数据按照某种标准分成不同的组别,然后再统计出各组别的数据频数,形成频数分布表。,需要如下三个步骤:,(一)确定组数组数的确定方法有两种。一种是首先确定总体各单位在所选定的数量分组标志下的差别,有几种质的差别就分几组,要尽量保证组间数据资料的差异性与组内数据资 料的同质性。另一种方法是根据数据的多少、数据差
21、异的大小来确定,一般数据越多,差异越大,组数就越多;而数据越少,差异越小,则组数就越少。(二)确定组距(三)确定组限组限是组与组之间的界限,组限 包括上组限和下组限,其中各个组的起点值为下组限,终点值为上组限。确定组限时,一般要求:第 组的下限应小于或等于所有数据中 的最小值,最后一组上限应大于或等于所有数据中的最大值。组限值 应尽量取整数;对于连续型变量,相邻两组的 组的上下限要重叠,避免出现遗漏的现象。,第二节,定量数据的图表展示,二、定量数据的统计图示,(一)直方图直方图是用矩形的宽度和高度来表示频数分布。,(二)折线图,折线图又称为多边形图,是把直方图中各长方形顶端的中点顺次用线段连接
22、起来,得到的表示频数(或频率)分布情况的一种统计图。,第二节,定量数据的图表展示,二、定量数据的统计图示,(三)曲线图曲线图用一条光滑的曲线近似地描绘频数分布折线图, 得到频数分布图。,(四)茎叶图,茎叶图,是指把每个观察数据划分为两个部分,并分别用茎或叶表示,然后把数据的茎按从小到大的顺序排列,再在每个茎的后面列出数据的叶的部分,由此所得到的图形称为茎叶图。,利用Excel无法绘制出茎叶图。如果使用茎叶图,可以借助于SPSS软件。,第二节,定量数据的图表展示,二、定量数据的统计图示,(五)箱线图,(六)雷达图,雷达图是从一个点出发,用每一条射线代表一个变量;将多个变量的数据点连接成线,即围成
23、一个区域;多个数据集合围成多个区域,即形成雷达图。,是由一组数据的最大值、最小值、中位数、两个四分位数等个值绘制而成的。,第二节,定量数据的图表展示,二、定量数据的统计图示,(七)散点图,散点图一般用来表现两个变量之间的相互关系。两个变量的任何一对取值都在平面直角坐标系上代表一个点。在平面坐标系上将所有这样的点绘制出来,便形成了散点图。,第三节,统计图表应用中的几个问题,一、合理使用统计图,第一,要画什么样的图,首先要看数据的类型。第二,注意统计图坐标轴的刻度。第三,绘制统计图时,要在标志和说明里表示清楚图里面画的是什 么、单位是什么等信息,要让数据很醒目。第四,注意不同类型统计图的作用,选用
24、恰当的统计图。第五,我们眼睛所看到的,除了高度之外还有面积。当所有长 条的宽度一样时,面积(高度乘宽度)和高度成正比,所以,我们眼睛接收到的信息是正确的印象,因而我们画柱形图时,每个长条都要一样宽。,第三节,统计图表应用中的几个问题,二、统计图的绘制,(一)利用Excel绘制统计图,第三节,统计图表应用中的几个问题,二、统计图的绘制,(二)利用SPSS软件绘制统计图,第四章 数据的统计量描述,第一节 数据集中趋势的测度第二节 数据离散程度的测度第三节 数据分布形状的度量第四节 描述数据特征的统计量的计算与应用,4,第一节,数据集中趋势的测度,一、平均数,反映一组数据集中趋势水平的指标包括平均数
25、、中位数和众数等。,(一)算术平均数简单算术平均数。若有个数据 ,则该组数据的平均数为:,加权算术平均数。,加权算术平均数受两个因素的影响: 一是各组变量值的大小,二是各变量值出现的频数的多少。,当各组频数都相等,即在 的情况下,加权算术平均数与简单算术平均数存在下面的关系:,简单算术平均数是加权算术平均数的一个特例,即简单算术平均数是权数相等条件下的加权算术平均数。,将各组变量值 乘以相应的频率后求和,即得到加权算术平均数,其计算公式为:,第一节,数据集中趋势的测度,一、平均数,计算算术平均数的权数主要有两类:客观权数和主观权数。()客观权数。客观权数是指与被平均的变量存在客观联系的指标。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 第三 平等 ppt 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1826777.html