《《统计学基础》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《统计学基础》PPT课件.ppt(92页珍藏版)》请在三一办公上搜索。
1、统计学基础,第一讲,主讲教师:王本玉,学时:32学时,教材与主要参考书,教材:统计学原理段雪妍 肖智明 主编上海财经大学出版社主要参考书:统计学基础刘美荣编 中国人民大学出版社 或经济管理出版社,统计学原理,段雪妍 肖智明 主编上海财经大学出版社,高职高专系列教材,课程教学基本内容,第1章 总 论第2章 统计调查第3章 统计整理第4章 综合指标第5章 时间数列第6章 统计指数第7章*抽样推断第8章*相关分析第9章*Excel在统计中的应用(*为简介内容 以自学为主),结束,第1章 总 论,统计学(STATISTICS)是处理和分析数据的方法和技术,几乎被应用到所有的学科及领域。(When yo
2、u analyze any topic,you are involved in statistics.)本章首先介绍统计学的含义和应用领域,然后介绍统计学的特点和研究方法,最后介绍统计学中常用的一些基本概念。,statistics:the science of collecting,analyzing,presenting,and interpreting data.Copyright 1994-2000 Encyclopaedia Britannica,Inc.(不列颠百科全书),1.1 统计的三种含义1.2 统计学的特点和研究方法1.3 统计学中的基本概念,主要内容,目录,第1章 总 论,
3、1.1 统计的三种含义,统计包含三种含义,两重关系,1.统计工作:调查研究。资料收集、整理和分析。,2.统计资料:工作成果。包括统计数据和分析报告。,3.统计学:研究如何搜集、整理、分析数据资料的一 门方法论科学。,统计工作统计资料统 计 学,工作与工作成果关系,实践与理论关系,4.统计学的内容,(1)描述统计,指搜集、整理、分析并提供统计资料的理论和方法。使反映客观事物的统计数据可以一目了然,条理清晰,使用方便,可以说明现象的数量特征和数量关系。,(2)推断统计,指依据样本资料推断总体特征的技术和方法,包括参数估计和假设检验的方法。,描述统计是推断统计的前提,推断统计是描述统计的发展。,1.
4、2.1 统计学的特点,1.2统计学的特点和研究方法,(1)数量性(2)总体性(3)具体性(4)应用性,2.统计分组法:就是根据研究目的和任务,将调查所获得的原始资料按照一定的标志区分为不同类型或者不同性质的组。,3.综合指标法:就是运用各种综合指标对现象的数量特征、数量关系进行对比分析的方法。它是统计分析的基本方法。统计指标在统计分析中广泛应用。,1.大量观察法:是指对所研究的事物的全部或足够数量进行观察的方法。,1.2.2 统计学的研究方法,1.3 统计学中的基本概念,无限总体:含无限多个单位,范围,有限总体:含有限个单位。,同质性:总体中各个单位具有某种共同的性质。,大量性:总体总是包含大
5、量的单位。,特点,同质性:总体中各个单位具有某种共同的性质。,同质性:总体中各个单位具有某种共同的性质。,同质性:总体中各个单位具有某种共同的性质。,同质性:总体中各个单位具有某种共同的性质。,范围,同质性:总体中各个单位具有某种共同的性质。,无限总体:含无限多个单位,范围,同质性:总体中各个单位具有某种共同的性质。,特点,无限总体:含无限多个单位,范围,同质性:总体中各个单位具有某种共同的性质。,大量性:总体总是包含大量的单位。,特点,无限总体:含无限多个单位。,范围,总体,1.统计总体和总体单位,具有共同性质的许多单位组成的整体。,总体单位:组成总体的最小单位(或元素)。,同质性:总体中各
6、个单位具有某种共同的性质。,特点:具体性;综合性。,构成:指标名指标数值。,指标:综合反映总体数量特征的概念和数值。,3.指标和指标体系,可变标志:各单位具体表现不同。,不变标志:各单位具体表现相同。,数量标志:用数值表示特征。,品质标志:用文字表示属性。,分类,概念:说明总体单位的属性特征的名称。,2.标志,基本概念实例,例子:要统计某学院学生的相关情况。总体和总体单位:该学院所有学生构成的整体为总体,其中每个学生是一个总体单位。标志:每个学生(个体或总体单位)的特征。如:性别、年龄、民族、来源地、专业、年级等。指标:全院学生(总体)的数量特征。如:学生总数、男女生比例、某一学年某门公修课平
7、均成绩、学生月平均生活费等。,指标体系:具有内在联系的一系指标构成的整体。,标志与指标的联系与区别:,联系:(1)一些数量标志汇总可以得到指标的数值。,区别:(1)标志是说明总体单位特征的,而指标是说明统计总体数量特征的。,(2)数量标志与指标之间存在变换 关系。,(2)标志的具体表现,有的用数值有的用文字 表示,而指标都是用数值表示的。,指标体系:具有内在联系的一系指标构成的整体。,在推断统计中:说明总体的指标也称参数。说明样本的指标称统计量。,绝对数指标;相对数指标;平均数指标。,分类:数量指标;质量指标。,4.变量和变量值,确定性变量,分类,随机性变量,离散性变量,连续性变量,变量值:即
8、变量的具体数值,包括标志值和指标数值。,社会经济现象中许多变量,既受确定性因素影响,又受随机性因素影响。要根据具体情况加以认定。,可变的数量标志和统计指标。,变量,本章小结,一.学习建议注意本章小结中所涉及到的相关内容的学习。配合课后的实训题进行学习。【作业】本章主要内容和学习要点要重点学习。本章各节的主要内容和学习要点如下表所示。,二、主要术语,统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。描述统计:研究数据收集、处理和描述的统计学分支。推断统计:研究如何利用样本数据来推断总体特征的统计学分支。,总体:包含所研究的全部个体(数据)的集合。总体单位:构成总体的各个单位(个体或元素
9、)。指标:说明总体数量特征的概念和数值。标志:说明总体单位属性和特征的名称。变量:说明现象某种特征的概念。离散型变量:只能取可数值的变量。连续型变量:可以在一个或多个区间中取任何值的变量。,统计学基础,第二讲,主讲教师:王本玉,学时:32学时,第2章 统计调查,统计调查是统计整理和统计分析的基础。本章首先介绍统计调查的意义和组织形式,然后介绍统计调查方案和统计调查问卷的设计要求。,2.1 统计调查的意义和组织形式2.2 统计调查方案2.3 统计调查问卷,主要内容,目录,第2章 统计调查,2.1 统计调查的意义和组织形式,一、调查组织方式,统计调查,二、调查方案设计,报表制度,普 查,重点调查,
10、典型调查,抽样调查,方案内容,调查表、问卷设计,制度化的经常性调查,专门组织调查,全面调查,非全面调查,统计报表制度,由政府部门组织,采用统一的表格,自上而下 布置,自下而上 报告。,任务:,搜集国民经济和社会发展基本情况的资料,为制订国民经济和社会发展计划和检查计划执行情况服务。,优点:,1.精心周密设计、高度统一、规范。2.回收率高,内容相对稳定,便于资料积累、对比。3.层层上报、逐级汇总,可以满足各部门需要。,特点:,普 查,特点:,工作量大,时间性强,需要大量人力和财力。,任务:,搜集重要的国情国力和资源状况的全面资料,为政府制定规划、方针政策提供依据。,方式:,建立专门机构,配备专门
11、人员调查。,利用基层单位原始记录和核算资料发表调查。,原则:,规定统一的标准时点。,规定统一的普查期限。,规定调查的项目和指标。,重点调查,特点:,在总体中选择个别或部分重点单位进行调查。,任务:,及时了解总体基本情况,为主管部门指导工作服务。,方式:,一次性调查:专门设计和配备人员现场调查。,重点单位指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重。,经常性调查:同报表制度结合,用统计报表调查。,典型调查,特点:,在全面分析的基础上,有意识地选择代表性的典型单位进行现场调查。,任务:,为研究某种特殊的社会经济问题,搜集详细的第一手资料,借以认识事物的本质特征、因果关系、变
12、化趋势。为理论和政策性问题研究提供依据。,作用:,适宜于研究处于萌芽状态事物和倾向性问题。,适宜于分析事物的类型,它们之间的差别和关系。,方法:,解剖麻雀;划类选典;抓两头。,抽样调查,特点:,1.按随机原则从总体中抽取样本;,2.以样本指标(统计量)为依据推断总体参数 或检验总体的某种假设;,3.抽样误差可以事先计算并加以控制。,调查误差,登记性误差,代表性误差,编 差,随机误差,抽样平均误差,实际误差,统计推断中的抽样误差就是抽样平均误差。它是统计调查所固有的,是对抽样推断精确度的量度。优点:a.经济性;b.时效性强;c.适应面广;d.准确性高。,常见的统计调查形式一览表,统计学基础,第三
13、讲,主讲教师:王本玉,学时:32学时,2.2 统计调查方案,调查方案的主要内容,1.确定调查目的(why),2.确定调查对象与调查单位(who),3.拟订调查提纲(what),4.确定调查时间(where/when),5.编制调查的组织计划(how),2.3 调查问卷设计,调查表,单一表,一览表,例:工业企业统计报表,问卷结构:说明词+主题词句+作业记录,例:人口普查登记表,问卷设计,基本要求:,主题明确,形式简明,文字通俗,容易理解,便于回答。词句编排,层次分明,先易后难。,问卷形式:,自由回答式词句两项选择式词句多项选择式词句赋值评价式词句,调查问卷的设计是市场调查方案设计的核心内容,尊敬
14、的先生、女士:我们是上海学院的学生。为了积极参与贯彻国家关于扩大内需推动经济增长的方针和理论与实践相结合的教育原则,在老师指导下我们组织了这次千户居民的社会调查。请您给予支持。调查不记名,全部资料用计算机处理,绝对保密和安全,您只需在符合您的情况的答案上打个勾,化费几分钟时间。谢谢!,返回,下页,上海市城市居民消费与投资倾向调查问卷,(1)您家是否已经拥有下列耐用家电设备:1.彩电 2.组合音箱 3.VCD(DVD)4.冰箱 5.空调 6.电脑(2)您家的住房是:1.租赁公房 2.有产权公房 3.新商品房 4.其他(请注明)(3)您家今明两年是否准备以下项目支出:1.购买家电设备 2.购买成套
15、家具 3.购买汽车 4.购买(或置换)房屋 5.现有住房装修 6.支付子女教育费 7.国内或国际旅游,返回,下页,上页,(4)您今明两年不准备上列大项目支出的主要 原因是:(选填3项)1.没有必要 2.经济不宽裕 3.品牌不中意 4.质量信不过 5.售后服务差 6.价格不合理 7.其他(请注明)(5)您购买商品考虑的主要因素是:1.实用价值 2.商品质量 3.价格 4.品牌 5.售后服务(请按您认为的重要性在中写上位序),返回,下页,上页,(9)您收入节余用于以下哪些项目?各项约占多大比重?1.银行储蓄()%3.国债(国库卷)()%3.基金()%4.其他债券()%5.股票()%6.保险()%7
16、.其他()%(10)您存钱的主要目的是:1.购买设备 2.购买住房 3.结婚 4.子女教育 5.养老防病 6.旅游(请按你认为的重要性在中写位序),返回,下页,上页,(6)您家平均每月总收入是:1.500元以下 2.5001000元 3.10001500元 4.15002000元 5.20003000元 6.30005000元 7.50008000元 8.8000元以上(7)您家平均每月日常生活费开支是 元,其中用于吃(食品)支出大约是 元。(8)您认为您家近几年生活水平是:1.提高很多 2.略有提高 3.没有变化 4.略有下降 5.下降很多,返回,下页,上页,(11)您是否了解现在推行的信贷
17、消费 1.不了解 2.了解一点 3.了解 4.很了解(12)您是否打算参加信贷消费:1.是 2.不(跳过第13题)(13)您信贷消费的项目是()1.购买家电设备 2.购买成套家具 3.购买汽车 4.购买(或置换)房屋 5.现有住房装修 6.支付子女教育费 7.国内或国际旅游,返回,下页,上页,(14)您是否同意下列看法:很同无不很同意所同不意 谓意同 意 1.信贷消费不合中国国情 2.信贷消费是资本主义国家的做法 3.信贷消费是先甜后苦 4.借债享受有风险 5.借债消费不光彩 6.信贷消费是现代通行的做法 7.只要量力借贷,有利无害 8.发展信贷消费能促进经济增长,返回,下页,上页,(15)最
18、后,了解一下您的基本情况:A.您的性别:1.男 2.女 B.您的年龄:周岁 C.您的文化程度:1.不识字或识字不多 2.小学 3.初中 4.高中或中专 5.大专或大学以上 D.您家庭人口数 人 其中:1.在业 人;2.离退休 人;3.失业、下岗 人 4.在校学生 人。E.您的职业(见卡片)F.职务,返回,上页,第2章 统计调查,本章小结学习目的与要求:本章要求掌握统计调查的主要几种组织形式及其特点(统计报表、普查、抽样调查 重点调查和典型调查)了解统计调查方案的设计要求,能够具体设计调查问卷。注意学习本章小结中的相关内容。重点学习本章各节的主要内容并掌握学习要点。配合习题训练来学习。,主要术语
19、,统计调查:简单说就是收集数据的工作过程。按组织形式分类:统计报表制度:以全面调查为主的调查方式,以统计表格形式逐级下达与逐级汇总上报的报告制度。普查:为特定目的而专门组织的一次性全面调查。,抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。重点调查:对部分重点单位进行的非全面调查。目的为据此掌握总体情况。典型调查:选取代表性的典型单位深入调查,适用于对新事物的取得试点经验。统计方案设计要求:5W(why,who,what,where,when,how),即:目的、对象、内容、地点、时间、方式。,统计学基础,第四讲,主讲教师:王本玉,学时:3
20、2学时,第3章 统计整理,统计整理是统计分析的基础和前提。本章首先介绍统计整理的意义和方法,然后重点介绍统计分组的方法,以及常用的统计图表本章要求:了解统计整理的意义和基本方法,掌握统计分组方法,熟悉统计表的构成与绘制,会绘制常用的统计图。(掌握统计分组方法,会编制分布数列和绘制常用的统计图,如条形图、饼图、线图和直方图),3.1 统计整理的意义和方法3.2 统计分组3.3 分布数列3.4 统计表3.5 统计图,主要内容,目录,第3章 统计整理,主要任务,资料审核、分组、汇总、制表、制图等。,分组,频数分布,统计表,统计图,3.1 统计整理的意义和方法,统计数据的整理和展示方法,统计数据的整理
21、,统计数据的展示,排序,统计分组,频数分布编制,统计表,统计图,3.2 统计分组,分组前,分组后,25,33,42,1.划分现象类型,作用:,例:按所有制性质划分,我国现有8种经济类型:国有经济;集体经济;私营经济;个体经济;联营经济;股份制经济;外商投资经济;港澳台投资经济,2.研究总体结构,例:上海市按GDP计算的三次产业结构(%)1980年 1990年 1996年 1997年 GDP100 100 100 100 第一产业 3.2 4.3 2.5 2.3 第二产业75.7 63.8 54.5 52.2 第三产业21.1 31.9 43.0 45.5,3.研究现象之间的依存关系,例:中国农
22、民家庭按收入分组的恩格尔系数(1984年),按收入分组(元)200 300 400 500 600 800 1000恩格尔系数(%)64.9 60.2 56.7 54.4 50.5 49.9 43.6,统计分组的种类,1.关键:服从研究任务需要,反映总体本质特征,2.形式,按分组标志性质分,品质标志分组,数量标志分组,按分组标志个数分,简单分组,复合分组,分组体系,3.3 频数分布(分布数列),分布数列是一种重要的分组资料,反映总体单位在各组的分布状态。,分组,频数(单位个数),频率,合计,100,频数分布,频率分布,1.频数和频数分布,频数与频率:,频数分布:,把各个类别及其相应的频数全部列
23、出来就是频数分布或次数分布(Frequency distribution)。,频数分布表:,就是将各类别的频数或频率逐级累加起来。,也称次数,是落在各组中的数据个数。频率是各组的次数占总次数的百分比。,向上累积:自前向后逐组累积,2.累计频数与累计频率,两种累积 方法,向下累积:自后向前逐组累积,(Cumulative frequencies/percentage),将频数分 布用表格的形式表现出来就是频数分布表。,分类,品质数列,变量数列,单项数列,组距数列,等距数列,异距数列,例1,例2,例3,例4,变量数列的编制,1.计算极差,2.确定形式,单项数列:离散型且取值不多。,组距数列:离散型
24、且取值多或连续型。,3.组距数列:组距;组数;,4.计算各组频数,频率,累计频数,累计频率等。,5.组中值的计算:闭口组;开口组。,继续,某厂职工人数统计表,按性别分组,男 职 工,女 职 工,合 计,人数(人),(频数),比率(),(频率),253,115,368,68.75,31.25,100.00,返回,某厂职工家庭人口分组统计,按家庭人口分组,1,合 计,职工户数,(频数),比率(),(频率),7,返回,2,3,4,5,6,38,105,54,31,20,2.9,15.2,41.3,20.5,12.1,8.0,255,100,某车间职工人数统计表,按工龄分组(年),05,610,合 计
25、,人数(人),(频数),比率(),(频率),5,12,23,10,24,46,返回,1115,20,1620,50,100,10,某地区2009年农户年均收入分布,年均收入(元),2000元以下,农户数百分比(%),3,返回,3000 4000,4000 5000,5000 7000,7000 10000,1000020000,20000以上,7,15,25,35,15,10,合 计,100,例.某生产车间 50 名工人日加工零件数(单位:个),试按单变量分组讲其进行分组。,为便于分组,可先对上面的数据进行排序,结果如下:,表22.1*,变量数列的编制(一),(一)单变量值分组。单变量值分组就
26、是把每一个变量值作为一组,它一般只适用于离散变量且变量值较少的情况。,采用单变量值分组形成的频数分布表如下表所示。,表22.3*,表22.2*,(二)组距分组:当续变量或变量值较多的情况下,可采用组距分组。1.概念:组距分组就是将全部变量值一次划分为若干个区间,并将这一区间的变量值作为一组。上限 下线与组距:一个组的最小值称为下限,最大值称为上限。每个组上限和下限之间的距离称为组距。,变量数列的编制(二),2.步骤:1)确定组数 组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组中,可以按 Sturges 提出的经验公式来确定组数K:K=1+lgn/lg2式中 n 为数据的个数,对结
27、果用四舍五入的办法取整数即为组数。2)确定各组的组距 组距(最大值最小值)组数。3)根据分组整理成频数分布表 比如对上面的数据进行分组,可得到下面的频数分布表,见下表。,表 2-2.4*,3“不重不漏”原则。采用组距分组时,一定要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现“不漏”是指在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。统计分组时习惯上规定“下限在内而上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而算在下一组内。,对于连续变量可以采取相邻两组组限重叠的方法,根据“上组限不在内”的规定解决“不
28、重”的问题。(类似于表2-2.4*的分法),表2-2.5*,对于离散变量也可以采用相邻两组组限间断的办法解决“不重”的问题。例如,对例 2-2*的数据做如下的分组,见下表。,4.开口组分组中,如果全部数据中的最大值和最小值与其他数相差悬殊,为避免出现空白组(即没有变量值的组)或个别极端值被漏掉,第一组和最后一组可以采取“XX 以下”及“XX 以上”这样的开口组。开口组通常以相邻组的组距作为其组距。例如,例子2-2*假定将最小值改为 94,最大值改为 160,采用上面的分组就会出现“空白组”,这时可采用开口组,见下表,表22.6*,5.等距分组和不等距分组 等距分组:在组距分组时,如果各组的组距
29、相等则称为等距分组,如上面的几种分组就是等距分组。特点:等距分组由于各组的组距相等,各组频数的分布不受组距大小的影响,它同消除组距因素影响的频数密度(即单位组距内分布的特征和规律,也称次数密度)的分布是一致的,因此可直接根据绝对频数来观察频数分布的特征和规律。,不等距分组:各组组距不等的组距分组称为不等距分组。特点:不等距分组因各组组距不同,各组频数的分布受组距大小不同的影响,因此各组绝对频数的多少并不能反映频数分布的实际情况。为消除组距不同对频数分布的影响,需要计算频数密度,即 频率密度=频率 组距。频数密度能准确反映频数分布的实际情况。,6.组中值组距分组掩盖了各组内的数据分布状况,为反映
30、各组数据的一般水平,我们通常用组中值(Class midpoint)作为该组数据的一个代表值,即 组中值=(上限+下限)2。这种代表值有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组中值两侧呈对称分布。如果实际数据的分布不符合这一假定,用组中值作为一组数据的代表值会有一定的误差。,统计学基础,第五讲,主讲教师:王本玉,学时:32学时,3.4 统计表,构成,总 表 题,横行标题:统计研究的对象,也称主词。,纵栏标题:说明主词的指标名称,也称宾词。,数字资料,分类,主词,简单表,分组表,复合表,宾词,平行形式,交叉形式,上海市总人口数(19801991),年 份,1980,年末总人口,11
31、46.52,年 份,年末总人口,1981,1982,1983,1984,1985,1986,1987,1988,1989,1991,1990,1162.84,1180.51,1194.01,1204.78,1216.69,1232.33,1249.51,1262.42,1276.45,1283.35,1287.20,统计表的设计,(一)统计表的构成统计表一般由四个主要部分组成,即表头、行标题、列标题和数字资料,必要时可以在统计表的下方加上表外附加。表头应放在表的上方,它所说明的是统计表的主要内容。行标题和列标题通常安排在统计表的第一列和第一行,它所表示的主要是所研究问题的类别名称和指标名称,通
32、常也被称为“类”。如果是时间序列数据,行标题和列标题也可以是时间,当数据较多时,通常将时间放在行标题的位置。表的其余部分是具体的数字资料。表外附加通常放在统计表的下方,主要包括资料来源、指标的注释和必要的说明内容。,(二).统计表的设计 统计表的设计应符合科学、实用、简练、美观的要求。,3.5 统计图,1.条形图(Bar chart)条形图是用宽度相同的条形的高度或长短来表示数据变动的图形,可以横置或纵置。(对比条形图2.圆形图/饼图(pie chart)(条形图示意例)2.圆形图也称饼图(pie chart)是用圆形及圆内扇行的面积来表示数值大小的图形。圆形图主要用于表示总体中各组成部分所占
33、的比例,对于研究结构性问题十分有用。(环形图用于对比)饼图示例3.累积频数分布图 根据累积频数或累积频率,可以绘制累积频数或频率分布图。累积频数图 环形对比图实例所有这些图形都可以借助EXCEL做出图示。(下图为条形图和饼图示例。),继续,条形图示例,图2-1.1*,返回,图3 2,饼图示例,图2-1.2*,返回,例.住房问题的研究中,研究人员在甲、乙两个城市各抽样调查 300 户家庭,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”(1)非常不满意;(2)不满意;(3)一般;(4)满意;(5)非常满意;调查结果经整理如下表 所示,相应的累积频率图以及环形对比图图示如下(累积频数图 环
34、形图),表 2-9,表 2-10,环行图:和圆形图相比,环行图可以同时绘制多个总体的数据系列,从而有利于进行多个总体的比较研究。图2-16 是甲乙两城市居民住房满意度的环形对比图,图216,图2-15 甲城市居民住房满意度累积频数图,返回,(注意:用EXCEL做出的直方图需要经过调整,才可成为形成合乎要求的直方图),图 22.1*,4.直方图 通过数据分组后形成的频数分布表,可以初步看出数据分布的一些特征和规律。如果用图形来表示这一分布的结果,会更加形象和直观。显示分组数据频数分布特征的图形有直方图、折线图和曲线图等 直方图(Histogram)。直方图是用矩形的宽度和高度来表示频数分布的图形
35、。直方图的做法 在平面直角坐标中,横轴表示数据分组,纵轴表示频数或频率,这样,各组与相应的频数就形成了一个矩形,即直方图。例如,根据表 2 2.4*频数分布绘制成的直方图如下图。,(二)时间序列数据:线图 如果数值型数据是在不同时间上取得的,即时间序列数据,还可以绘制线图。线图是在平面坐标上用折线表现数量变化特征和规律的统计图。线图主要用于显示时间序列数据,以反映事物发展变化的规律和趋势。例:1991 1998 年我国城乡居民家庭的人均收入数据如下表所示。试绘制线图。,对于等距分组的数据,可以用矩形的高度直接表示频数的分布。如果是不等距分组数据,可用矩形的面积来表示各组的频数分布,或根据频数密
36、度来绘制直方图。(直方图下的总面积等于 1)在直方图中,实际上是用矩形的面积来表示各组的频数分布。直方图和条形图不同,条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,因此其高度与宽度均有意义。此外,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。,根据上图数据绘制的线图如图所示:,图225*,表2-18*,统计图小结,直方图,等距数列:(变量,频数),异距数列:(变量,频数密度),折线图,曲线图,等距数列:(组中值,频数),异距数列:(组中值,
37、频数密度),单项数列:(变量,频数),向上累计分布:(变量上限,累计频数),向下累计分布:(变量下限,累计频数),变量的组数无限增多时,折线便趋于一条光滑的曲线。,图形,直方图,返回,本章小结,一.学习建议注意本章小结中所涉及到的相关内容的学习。配合课后的练习题进行学习。要重点学习本章主要内容和学习要点,掌握使用EXCEL做各种常用的统计图形的方法。本章各节的主要内容和学习要点如下表所示。,二、主要术语,频数:落在某一特定类别(或组)中的数据个数。频数分布:数据在各类别(或组)中的分配。频率:一个样本(或总体)中各个部分的数据与全部数据之比。累积频数:将各有序类别或组的频数逐级累加起来得到的频数。统计分组、单变量值分组与组距分组。条形图、饼图、直方图、线图。,数据分组:根据统计研究的需要,将原始数据按照某种标准(标志)划分成不同的组别。单变量值分组:将一个变量值分为一组。组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。组距:一个组的上限与下限的差。组中值:每一组的下限和上限之间的中点值,即 组中值(下限值+上限值)/2。直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。,
链接地址:https://www.31ppt.com/p-5590016.html