统计学厦门大学版第一章绪论.ppt
1,统,学,教,程,计,中南民族大学,郝茵茵,2,课程规划,学习统计学的几个基本环节:掌握统计分析的理论原理掌握资料搜集、整理的基本方法了解1种专业统计软件理解统计分析结果的经济含义本课程的学习目标:熟练利用统计学分析方法分析经济问题,3,第一章 总论,第一节 统计的含义和研究对象第二节统计学的基本概念 第三节统计学与其他学科的关系,4,第一节 什么是统计,一、无处不在的统计在诺贝尔经济学获奖者中,三分之二以上的研究成果与统计和定量分析有关。因此,著名经济学家萨缪尔森在其经典的教科书,经济学12版中特别提到:“在许多与经济学有关的学科中,统计学是特别重要的”。,5,美国杜邦公司的总经理理查德曾经指出“现代公司在许多方面是根据统计来行事的。”美国总统布什的年薪已经达到40万美元,在各国元首中名列首位,但根据美国工作等级年鉴一书的排名,总统一职并未进入最好工作之列。根据该书的统计,在美国,工作环境最好的工作是:统计学家。,6,1981年,首届国际红楼梦研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为从词汇上的统计论红楼梦作者的问题的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对红楼梦后40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作。,7,统计数字,大仲马的作品多曲折感人,而大仲马又多私生子,所以,取笑讥讽他的人,往往把他的 作品比作他的私生子。最使他头痛的是巴黎统计学会的秘书长李昂纳,这人是大仲马的朋友,每次举统计数字 的例子,总是说大仲马私生子有多少。有一年该统计学会开年会,大仲马估计,李昂纳又要大放厥词,说他的坏话了。于是他 请求参加年会,获得了批准,果然不出大仲马所料,李昂纳又举他的私生子的例子。李昂纳报告完毕,请大仲马致词。一向不愿在大庭广众之下发表演讲的大仲马,这次却 破例登台说:“所有统计数字都是撒谎的,包括有关本人的数字在内。”听众哄堂大笑。,8,数学家的幽默统计学家调侃数学家:你们不是说若且,则吗!那么想必你若喜欢一个女孩,那么这个女孩喜欢的男生你也喜欢吧?数学家反问道:那么你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里想来也没事吧!因为它们平均不过是五十度而已!”由上可知,统计与数量有关,同时它已经渗透到社会经济活动和科学研究的方方面面,统计无处不在。那么究竟何为统计?统计是如何开展研究的?作为一门科学的统计学与其他学科有何区别与联系?这些正是本章所要介绍的主要内容,9,二、统计(Statistics)的涵义,统计是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是认识客观世界的有力工具。统计的研究对象的特点:(一)数量性。统计数据是客观事物量的反映。(二)总体性。统计的数量研究是对现象总体中各单位普遍存在的事实进行大量观察和综合分析。(三)变异性。总体各单位的特征表现存在着差异,而且这些差异并不是事先可以预知的。,10,日常生活中,“统计”的3种含义,统计工作(又称统计实践)是搜集、整理、分析和提供关于社会经济现象的数字资料工作的总称。英文中的统计statistics与“国家”同一词根,可以说,自从有了国家,就有统计实践活动。统计数据是统计实践活动的成果。如:经济增长速度、价格指数等。对统计数据要求:客观性、准确性和及时性。,11,统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。统计学与统计实践活动的关系是理论与实践的关系,理论源于实践,理论又高于实践,反过来又指导实践,12,三、统计数据,(一)变量与变量值说明现象的某一数量特征的概念也被称为变量,变量的具体取值是变量值,统计数据就是统计变量的具体表现。例如,固定资产是一个变量,各企业固定资产的具体数值是变量值。为了区别,在本书中,凡是变量均用大写的英文字母表示,而变量值则用小写英文字母表示。,13,连续型变量是指变量的取值在数轴上连续不断,无法一一列举,即在一个区间内可以取任意实数值。例如,气象上的温度、湿度,零件的尺寸等。离散型变量是指变量的其取值是整数值,可以一一列举。例如,企业数,职工人数等。,14,确定性变量是受确定性因素影响的变量,即影响变量值变化的因素是明确的,是可解释和可控制的。随机变量则是受许多微小的不确定因素(又称随机因素)影响的变量。变量的取值无法事先确定。社会经济现象既有确定性变量也有随机变量。统计学所研究的主要是随机变量。,15,(二)数据的计量尺度统计数据是总体单位标志或统计指标的具体数量表现。根据对研究对象计量的不同精确程度,人们将计量尺度由低到高、由粗略到精确分为四个层次:定类尺度、定序尺度、定距尺度和定比尺度。,16,1.定类尺度是按照客观现象的某种属性对其进行分类。这一场合的所使用的数值只是作为各种分类的代码,并不反映各类的优劣、量的大小或顺序。例如,人口按性别分为男女,用“1”表示男性,用“0”表示女性。定类尺度的主要数学特征是“=”或“”。在统计处理中,对于不同的类别,虽然可以计算单位数,但它不能表明第一类的一个单位可以相当于第二类的几个单位。,17,2.定序尺度是对客观现象各类之间的等级差或顺序差的一种测度。利用定序尺度不仅可以将研究对象分成不同的类别,而且还可以反映各类的优劣、量的大小或顺序。例如,学生成绩可以分为优、良、中、及格和不及格等五类。在这里,定序尺度虽然无法表明一个优等于几个良,但却能确切地表明优高于良,良又高于中。定序尺度的主要数学特征是“”。,18,3.定距尺度是对现象类别或次序之间间距的测度。定距尺度不但可以用数表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异。定距尺度使用的计量单位一般为实物单位(自然或物理)或者价值单位。定距尺度的主要数学特征是“+”或“”。统计中的总量指标就是运用定距尺度计量的。,19,4.定比尺度。定比尺度是在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数加以对比而形成相对数(或平均数),用于反映现象的结构、比重、速度、密度等数量关系。例如,将一个企业创造的增加值与该企业的职工人数对比,计算全员劳动生产率,以此反映该企业的生产效率。定比尺度的主要数学特征是“”或“”。,20,四个测定层次的比较,1,2,3,4,量化等级,功能包容,1,2,3,4,21,测定层次,特征,运算功能,举例,1、定名测定2、序列测定3、间距测定4、比率测定,分类分类;排序分类;排序;有基本测量单位分类;排序;有基本测量单位;有绝对零点,计数计数;排序计数;排序;加减计数;排序;加减乘除,产业分类企业等级产品质量差异商品销售额,22,(三)数据的观察时间,横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据又称为动态数据,它是指在不同时间对同一总体的数量表现进行观察而获得的数据。例如,2005年全国各省市自治区的国内生产总值就属于横截面数据。而“十五”期间我国历年的国内生产总值就属于时间序列数据。,23,(四)数据的表现形式,绝对数。现象的规模、水平一般以绝对数形式表现。绝对数的计量单位一般为实物单位或价值单位,有时也采用复合单位。实物单位可以是自然计量单位,也可以是物理计量单位,如人口数用人计量,机器数用台计量,对于一些化工产品和燃料,常常还折合成标准实物单位计量。复合计量单位是由两种或两种以上计量单位复合而成的,如以“吨公里”为货物周转量的计量单位,以“千瓦时”为用电量的计量单位。,24,相对数。相对数由2个互相联系的数值对比求得。常用的相对数包括:结构相对数、动态相对数、比较相对数、强度相对数、利用程度相对数、计划完成相对数等。平均数。平均数反映现象总体的一般水平或分布的集中趋势。,25,第二节 统计学的基本概念,一、总体与总体单位统计总体是根据一定目的确定的所要研究的事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。例如要研究全国城镇居民的收支情况,就以全国城镇居民作为一个总体。同质性是确定统计总体的基本标准,它是根据统计的研究目的而定的。,26,研究目的不同,则所确定的总体也不同,其同质性的意义也随之变化。例如,研究城镇居民贫困户的生活状况,那么,贫困线下的城镇居民户则构成了统计总体,贫困线下的城镇居民户是同质的,而贫困线上的城镇居民户是非同质的。统计总体还应具备大量性。统计总体应该由足够数量的同质性单位构成。,27,总体单位(简称单位)是组成总体的各个个体。根据研究目的的不同,单位可以是人、物、机构等实物单位,也可以是一种现象或活动等非实物单位。总体和单位的概念是相对而言的,随研究目的不同,总体范围不同而变化。同一研究对象,在一种情况下为总体,但在另一情况下又可能变成单位。根据总体所包含的单位数量,总体可以分为有限总体和无限总体两类。有限总体是由有限量的单位构成的总体。当总体单位数难以确定,其数量可能是无限时,便构成无限总体。,28,二、样本当总体单位数量很多甚至无限时,不必要或不可能对构成总体的所有单位都进行调查。这时,需要采用一定的方式,从由作为研究对象的事物全体构成的总体(又称母体)中,抽取一部分单位,作为总体的代表加以研究。这种由总体的部分单位组成的集合称为样本(又称子样)。样本也由一定数量的单位构成的,样本所包含的总体单位数称为样本容量。三、标志总体各单位普遍具有的属性或特征称为标志。例如每个工人都具有性别、工种、文化程度、技术等级、年龄、工龄、工资等属性和特征,这些就是工人作为总体单位的标志。,29,标志分为品质标志和数量标志两种。品质标志表明单位属性方面的特征,品质标志的表现只能用文字、语言来描述如工人的性别。数量标志表明单位数量方面的特征,可以用数值来表现,如年龄。如果一个总体中各单位有关标志的具体表现都相同,称之为不变标志。例如在工人这一总体中,职业是不变标志。在一个总体中,当一个标志在各单位的具体表现有可能不同时,这个标志便称为变异标志。例如各人的工龄可能表现不同,因而是可变标志。,30,一个总体至少要有一个不变标志,才能够使各单位结合成一个总体。不变标志是总体同质性的基础。作为总体,同时必须存在变异标志,这表示所研究的现象在各单位之间存在着差异,才需要进行统计研究。,31,四、统计指标与指标体系,统计指标是反映统计总体数量特征的概念和数值。如2002年我国国内生产总值104790.6亿元。统计指标由两项基本要素构成,即指标的名称和指标的取值。指标的名称是对所研究现象本质的抽象概括,也是对总体数量特征的质的规定性。指标的数值反映所研究现象在具体时间、地点、条件下的规模和水平。,32,指标与标志的关系,标志反映总体单位的属性和特征,而指标则反映总体的数量特征。标志和指标的关系是个别和整体的关系。需要通过对各单位标志的具体表现进行汇总和计算才能得到相应的指标。,33,总体和单位的概念会随着研究目的不同而变化,因此指标与标志的概念也是相对而言的。例如,所要研究的是全国工业企业的情况,则各企业的职工人数、固定资产、工业增加值等都是总体单位(即各个企业)的标志,如果研究目的变成研究某一企业的职工状况,则该企业变成一个总体,企业职工人数变成了统计指标,每个职工的文化程度、技术等级、性别等就成为标志。,34,统计指标可以分为数量指标和质量指标。凡是反映现象总规模、总水平的统计指标称为数量指标。例如人口总数、企业总数、商品进出口总额等等,这些指标反映现象或过程的总规模和水平,所以也称为总量指标,用绝对数来表示。凡是反映现象相对水平和工作质量的统计指标称为质量指标,例如职工平均工资、人口密度、工人出勤率等等。质量指标是总量指标的派生指标,用相对数或平均数来表示,以反映现象之间的内在联系和对比关系。统计指标体系是由一系列相互联系的统计指标所组成的有机整体。用以反映所研究现象各方面相互依存相互制约的关系。例如,工业企业统计指标体系。,35,统计学的内容,1、描述统计,指搜集、整理、分析并提供统计资料的理论和方法。,主要任务:使反映客观事物的统计数据可以一目了然,条理清晰,使用方便,可以说明现象的数量特征和数量关系。,2、推断统计,是只依据样本资料推断总体特征的技术和方法,包括参数估计和假设检验的方法。,描述统计是推断统计的前提,推断统计是描述统计的发展。,36,练习题,1、以实例说明总体与单位概念的相对性。2、以实例说明总体的同质性与变异性的具体表现,并阐述两者的辩证关系。,37,3、为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该研究中,研究者感兴趣的总体是()A100所中学 B20个城市C 全国的高中生 D 100所中学的高中生4、为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该研究中,研究者感兴趣的变量是()A100所中学的学生数 B20个城市的中学数C 全国的高中生的身高 D 全国的高中生数,38,5、为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该研究中,样本是()A100所中学 B20个城市C 全国的高中生 D 100所中学的高中生6、一个研究者应用有关车祸的统计数据估计在车祸中死亡的人数,在此例中使用的统计属于()A 推断统计 B 描述统计 C 既是描述统计,又是推断统计 D 既不是描述统计,也不是推断统计,39,7、统计有三种含义,其基础是()A统计学 B统计活动 C统计方法 D 统计资料8、一个统计总体()A 只能有一个标志 B 只能有一个指标C 可以有多个标志 D 可以有多个指标9、构成统计总体的必要条件是()A 差异性 B 综合性 C 社会性 D 同质性10、统计研究的量必须是()A 抽象的量 B 具体的量 C 连续不断的量 D 可直接相加的量,40,判断题1、统计学是一门研究现象总体数量方面的方法论科学,所以它不关心、不考虑个别现象的数量特征。()2、三个同学的成绩不同,因此存在三个变量。()3、统计数字的具体性是统计学区别于数学的根本标志。()4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。(),41,5、变量是指可变的数量标志。()6、运用大量观察法,必须对研究对象的所有单位进行观察调查。()7、单位产品原材料消耗量是数量指标,其值大小与研究的范围大小有关。(),42,统计研究的基本环节,统计设计,收集数据,整理与分析,资料积累开发应用,统计学理论与相关实质性学科理论,描述统计推断统计,统计调查、实验,43,图1-2 统计学学科体系,44,第三节、统计学与有关学科的联系与区别,数学与统计学。数学与统计学都是研究数量规律的,都要利用各种公式进行运算。数学中的概率论,为统计学提供了数量分析的理论基础。统计学中的理论统计学以抽象的数量为研究对象,其大部分内容也可以看作是数学的分支。,45,统计学与数学的区别。从研究对象看,数学以最一般的形式研究数量的联系和空间形式。统计学特别是应用统计学则总是与客观的对象联系在一起的。从研究方法看,数学主要是逻辑推理和演绎论证的方法。而统计本质上是归纳的方法。统计学家特别是应用统计学家需要深入实际,进行调查或实验去取得数据,研究时不仅要运用统计的方法,而且还要掌握某一专门领域的知识。,46,统计学与经济学,统计学与相关的实质性学科如经济学等,有密切的联系。统计学是开展经济研究不可或缺的重要工具。通过统计的实证研究,可以帮助人们认识有关的数量规律,同时检验经济学理论的真实性和完善程度。经济学等实质性学科对经济统计学起着重要的指导作用。不仅统计指标的设定离不开实质性学科的指导,而且应用统计方法也在很大的程度上受所研究对象性质的影响。,47,统计学与相关实质性学科的区别。实质性学科研究该领域现象的本质关系并对有关规律作出合理的解释和论证。而统计学只是为实质性学科研究和认识数量规律提供专门的方法和工具,并不直接对规律产生的原因和机理作进一步的分析。,48,统计学家未必是经济学家,经济学家也未必是统计学家。但经济统计学家应当既是统计学家又是经济学家。,49,补充:统计学的产生与发展,产生,原始社会后期:统计萌芽于计数活动;奴隶制国家产生:使统计日显重要;封建社会时期:统计已具规模;资本主义的兴起:统计扩展到社会经济各方面。,统 计学应运而生,统计学作为一门系统的科学,距今只有300多年的历史。,50,统计学的产生与发展,发展(三个时期),(一)统计学的萌芽期(17世纪中18世纪中),1、德国的记述学派(国势学派 康令(16061681)阿痕瓦尔(17191772;1764年首创统计学一词),他们在大学中开设“国势学”采用记述性材料,讲述国家“显著事项”,籍以说明管理国家的方法。特点是偏重于事物质的解释而忽视量的分析。,51,(二)统计学的近代期(18世纪末19世纪末),1、数理统计学派 代表人物:法国的拉普拉斯,比利时的凯特勒。拉普拉斯把古典概率论引进统计学,发展了概率论,推广了概率论在统计中的应用。,2、政治算术学派代表人物:英国的威廉配第、约翰格朗特等。威廉配第的代表著政治算术对当时的英、荷、法等国的“国富和力量”进行了数量的计算和比较;格朗特写出了第一本关于人口统计的著作。他们开创了从数量方面研究社会经济现象的先例。,52,凯特勒把德国的国势学派、英国的政治算术学派和意大利、法国的古典概率论家以融合改造为近代意义的统计学。他是数理统计学派的奠定人,有“统计学之父”之称。,2、社会统计学派 代表人物:德国的克尼斯、恩格尔、梅尔等。他们强调统计学是研究社会现象的科学,包括统 计资料的搜集、整理和分析研究,目的是要揭示现象内部的联系。,53,(三)统计学的现代期(20世纪初至今),统计学的主流从描述统计学转向推断统计学。20世纪30年代R费希尔的推断统计理论标志着现代数理统计学的确立。,60年代以后统计学发展有三个明显的趋势:,1统计学依赖和吸收数学更多;2以统计学为基础的边缘学科不断形成;3与电子计算机技术相结合,应用范围更广,作用更大。,