《大学统计学第1章绪论.ppt》由会员分享,可在线阅读,更多相关《大学统计学第1章绪论.ppt(63页珍藏版)》请在三一办公上搜索。
1、统计学,主 讲:xxx 联系方式:1385xxxxx182 E-mail:,你相信这样的一些统计结论吗?,吸烟对健康是有害的,吸香烟的男性减少寿命2250天不结婚的男性会减少寿命3500天,不结婚的女性会减少寿命1600天身体超重30%会使寿命减少1300天每天摄取500毫升维生素C,生命可延长6年身材高的父亲,其子女的身高也较高第二个出生的子女没有第一个聪明,第三个出生的子女没有第二个聪明,依此类推学生们在听了莫扎特钢琴曲10分钟后的推理测试会比他们听10分钟娱乐磁带或其他曲目做得更好上课坐在前面的学生平均考试分数比坐在后面的学生高,数字(信息),说话(表明),确定,搜集,说什么,为谁说,方
2、法或数学计算,奥运奖牌榜 排名各有道在众所周知的北京29届奥运奖牌榜上,中国以51枚金牌位居首位。从不同角度和不同国家利益出发,有的统计奖牌总数,有的算起历史老账,甚至提出按人头和GDP计算,奥运会奖牌榜出现了多种版本。,1、金牌榜计算方法:北京奥组委统计的奖牌榜是根据所获得的金、银、铜牌数量排名次。如果金牌数一样,就看银牌数,如果银牌数一样,就看铜牌数。中国 51枚金牌 美国 36枚金牌俄罗斯 23枚金牌点评:目前,全球大部分国家都采用这种方法,金牌的竞争还是最引人注目的。,2、总数榜计算方法:在前几届奥运会上,美国在金牌榜上一直位居第一,这次美国金牌数落后于中国。为了不让自己“降级”,美国
3、有媒体改变了排名策略。美国 110枚 中国 100枚 俄罗斯 72枚点评:美国在总奖牌榜上以微弱优势超越中国,避免将世界体育最强国的地位拱手相让的局面。,3、老账榜计算方法:美国广播公司(ABC)还出台了一种更“新颖”的算法,他们将1896年以来历史上获得过的所有奖牌总数相加,美国算下来遥遥领先第二名400多枚金牌。美国 933枚金牌 2307枚奖牌 俄罗斯 463枚金牌 1194枚奖牌 13中国 163枚金牌 386枚奖牌点评:这样,美国足可以高枕无忧,俄罗斯和中国望尘莫及。注:俄罗斯数据包括苏联和独联体,4、地域榜计算方法:在排名问题上,欧洲人也不服气。据美国商业周刊今晨报道,根据欧洲国际
4、组织欧洲青年联邦的古怪计算方法,欧盟20多个国家货币都统一了,奥运会奖牌也该统一计算。欧盟 87枚金牌 中国 51枚金牌 美国 36枚金牌点评:中国和美国被拥有20多个成员国的欧盟远远甩在后面。,5、GDP榜计算方法:澳大利亚经济学家BillMitchell提出一种新算法,根据国内生产总值(GDP)看奖牌榜。1 朝鲜 2 津巴布韦 3 蒙古 44中国 72美国 点评:按金牌榜排列在前五名的中、美、俄、英、德在GDP榜上掉的不见影了。,6、积分榜 计算方法:纽约时报提出为了以示公允,把奖牌转换成分数,铜牌1分,银牌2分,金牌4分,然后按总分排序。按这种方法,中国的总积分仍然以明显优势排在第一位。
5、中国 274分美国 206分俄罗斯 162分 点评:事实上,这种做法在1908年的伦敦奥运会上就采用过,当时的金银铜比例是531。,7、人头榜计算方法:据纽约每日新闻报道,美国奥组委内部开始用挂上金牌的队员来统计金牌,因为集体项目“含金量高”。在三大球中,美国男篮、女篮、女足和男排上共获得4枚团体金牌。点评:本届奥运会上,中国的三大球都无缘金牌。如果按人头算,参赛运动员人手一枚金牌,美国显然远远超过中国代表团所获的51枚金牌。,8、人均榜计算方法:洛杉矶时报在奥运期间发布了一个“人均奖牌榜”,澳大利亚人西蒙福赛斯也采用类似的方法。他公布了自己计算的“人口奖牌榜”,以这个国家或地区每百万人口产生
6、的金牌数、奖牌数等排名。拥有30多万人口的巴哈马群岛名列榜首,他们在本届奥运会上获得了1枚银牌和1枚铜牌,每百万人口产生6.51枚奖牌。而中国每百万人口仅产生0.08枚奖牌,排在第68位。1巴哈马群岛 2牙买加 3冰岛 68中国点评:在人均奖牌榜中,中美显然都没有优势。福赛斯说,自己的国家赢得更多奖牌,人们理所应当感到骄傲。同样,“你的国家人均赢得奖牌数比别国更多,你也应当感到骄傲。”,为什么要学统计学?,教育部社教司司长、中国人大教授博导顾海良说:语言学、心理学和统计学是二十一世纪最有发展前途的三大学科。二十一世纪是一个信息经济时代。信息是如何得到的?经济如何衡量?如何评价?如何比较?日常生
7、活中又如何?,在诺贝尔经济学获奖者中,三分之二以上的研究成果与统计和定量分析有关。从1969年至今,共评出了40届诺贝尔奖,其中与统计和计量分析直接有关的28届。著名经济学家萨缪尔森在其经典的教科书,经济学12版中特别提到:“在许多与经济学有关的学科中,统计学是特别重要的”。,美国总统布什的年薪已经达到40万美元,在各国元首中名列首位,但根据美国工作等级年鉴一书的排名,总统一职并未进入最好工作之列。根据该书的统计,在美国,工作环境最好的工作是:统计学家。(转引自2002年3月7日扬子晚报),1981年,首届国际红楼梦研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为从词汇上的统计论红
8、楼梦作者的问题的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对红楼梦后40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作。,亲爱的YX-03,你好!我们是2005年1月9日22时30分在网上认识的,说来还挺有缘。截至此时此刻,我们已经认识了整整5个月时间。在此期间,我们共上网聊天150次,平均一天一次。合计聊天时间7500分钟,平均每次50分钟。其间,我们累计见面10次,平均15天见面一次。在这10次见面中,我约你9次,占总数的90%。我主动吻你34次,占我们接吻总数的82.5%。请你吃饭10次,共消费人民币2011元,平均每次201.1元。另外我送你礼物4件,
9、去你家拜访3次,花费人民币2755元。综合各方面的情况,我爱你的程度比你爱我的程度高出22个百分点,我的爱情投资比你多出了52个百分点。,精确到小数点的爱情-统计学博士的求婚信,虽然如此,你爱我的程度也达到了婚姻所要求的基准线以上,并超出了17个百分点。也就是说,我对你的满意度为84%,你对我的满意度为78%,通过电脑分析计算,恋爱双方满意度达到如此程度的只占恋爱总数的42%。因此,根据电脑给出的结论,我们可以考虑结婚。现在,根据电脑指令,我向你提出书面结婚请求,请你在接到此信后7日内,作出正式答复,逾期不予回复,则视为拒绝。如果拒绝的话请提出书面意见书,详细表述原因。如提供不出有效原因而予以
10、拒绝,本人有权要求一定的经济赔偿。想念你的KFO2005年6月10日晚,19,第一章 绪论,第一节 什么是统计第二节 统计学的种类及其性质第三节 统计学的基本概念,20,第一节 什么是统计,一、统计(Statistics)的涵义统计是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是人们认识客观世界的一种有力工具。统计的研究对象具有以下特点:(一)数量性。(二)总体性。(三)变异性。,21,“统计”的3种含义,统计工作(又称统计实践)是搜集、整理、分析和提供关于社会经济现象的数字资料工作的总称。英文中的统计statistics与“国家”同一词根,可以说,自从有了国家,就有统计实践活动。
11、统计数据是统计实践活动的成果。如:经济增长速度、价格指数等。对统计数据要求:客观性、准确性和及时性。统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。三者关系:理论与实践的关系;过程与结果的关系。,22,二、统计研究的基本环节,统计设计,收集数据,整理与分析,资料积累开发应用,统计学理论与相关实质性学科理论,描述统计推断统计,统计调查、实验,23,统计研究的全过程包括以下基本环节:,(一)统计设计根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度
12、等。(二)收集数据统计数据的收集有两种基本方法。自然科学:实验法社会经济现象:调查观察,24,(三)整理与分析运用的方法包括:描述统计和推断统计。,描述统计(descriptive statistics),研究数据收集、处理、汇总、图表描述、概括与分析等统计方法 内容搜集数据整理数据展示数据描述性分析 目的描述数据特征找出数据的基本规律,推断统计(inferential statistics),研究如何利用样本数据来推断总体特征的统计方法内容参数估计假设检验目的对总体特征作出推断,描述统计与推断统计的关系,(四)统计资料的积累、开发与应用二个方面:数据的积累、共享及管理 进一步开发应用,第二节
13、 统计学的种类及其性质,一、统计学的产生与发展,1、古代中国的情况五千年的文明古国,统计有四千年的发展史。公元前2000多年的夏禹时代:人口、土地的记载,如中国分为九州,人口约1355万人,耕地约2438万顷。周易中有:上古结绳而治,事大,大结其绳;事小,小结其绳。,秦汉有:地方田亩与户口资料记载。唐宋有:计口授田、田亩鱼鳞册等土地调查和计算。明清有:经常的人口登记和保甲制度。由于当时社会生产力发展缓慢,统计实践活动与内容仍很简单狭小,主要目的是为统治者实现赋税、徭役、征兵等需要而进行的。仅作为一种工具,故没有形成理论体系,2、国外古希腊和古罗马时代,就有了人口和财产的统计数字。17世纪,欧洲
14、资本主义发展,工业、商业、农业、外贸等进入了一个空前发展的阶段(文艺复兴、产业革命时期),统计也得到了相应的发展,开始形成了不同的学派:,33,(一)政治算术学派(有实无名)创始人:英国威廉配第(William Patty,16231687年)代表作:政治算术(1676年)主要思想:应用大量观察和数量分析等方法(二)国势学派(有名无实)创始人:德国的阿亨瓦尔(GAchenwall,1719-1772)。代表作:在大学讲授欧洲最近国势学 近代欧洲各国国势学概论主要思想:用文字记述的方法对国情国力进行研究,34,(三)数理统计学派,创始人:比利时统计学家凯特勒(Adolphe Quetelet,1
15、7961874年)。代表作:概率论书简、社会物理学等主要思想:将概率论引入社会经济方面的研究。从19世纪中叶到20世纪中叶,数理统计学得到迅速发展。英国生物学家高尔顿提出并阐述了“相关”的概念;皮尔逊提出了计算复相关和偏相关的方法。戈塞特建立了“小样本理论”,即所谓的“t分布”;费歇 样本相关系数的分布、方差分析、实验设计等方面的研究中做出了重要贡献。,3、现代统计学时期:统计学走向成熟主要内容:在随机抽样的基础上建立起来的推断统计学如:1890年英国K.皮尔逊-卡方检验、抽样理论、多变量分析等。现代企业管理理论的创始人松下幸之助,就是在企业质量控制中成功应用统计方法而成名。,4、新中国195
16、2年各级政府成立了统计局(建立在MPS核算体系上,学前苏联)1983年颁布了中华人民共和国统计法1995年建立了新的国民核算体系(博采众长,结合了MPS与SNA的优点)1996年修改了中华人民共和国统计法,37,二、统计学学科体系,经济学,管理学,医学,工程学,社会学,统计学,三、统计学与有关学科的联系与区别,39,数学与统计学。联系:都是研究数量规律的,数学中的概率论,为统计学提供了数量分析的理论基础。区别:从研究对象看:数学抽象的数量规律 统计学具体的数量规律从研究方法看:数学主要是逻辑推理和演绎论证的方法。统计本质上是归纳的方法。不仅要运用统计的方法,而且还要掌握某一专门领域的知识。,4
17、0,统计学与经济学,联系:统计学:开展经济研究的重要工具;认识有关的数量规律,同时检验经济学理论的真实性和完善程度。获得诺贝尔经济学奖的学者三分之二以上与统计有关。经济学:实质性学科:重要的指导作用。不仅统计指标的设定,而且应用统计方法区别:经济学研究该领域现象的本质和规律作出合理的解释。统计学只是为实质性学科研究和认识数量规律提供专门的方法和工具。,41,第三节 统计学的基本概念,一、总体与总体单位统计总体:是由客观存在的、具有某种共同性质的许多个别事物构成的整体。特点:同质性、大量性、变异性。例如,研究城镇居民贫困户的生活状况,那么,贫困线下的城镇居民户则构成了统计总体,贫困线下的城镇居民
18、户是同质的,而贫困线上的城镇居民户是非同质的。,42,总体单位(简称单位)是组成总体的各个个体。根据研究目的的不同,单位可以是人、物、机构等实物单位,也可以是一种现象或活动过程等非实物单位。总体和单位的概念是相对而言的,随研究目的不同,总体范围不同而变化。根据总体所包含的单位数量,总体可以分为有限总体和无限总体两类。,43,二、样本由总体的部分单位组成的集合称为样本(又称子样)。样本也由一定数量的单位构成的,样本所包含的总体单位数称为样本容量。三、标志总体各单位普遍具有的属性或特征称为标志。例:每个工人都具有性别、工种、文化程度、技术等级、年龄、工龄、工资等,44,标志分为品质标志和数量标志两
19、种。品质标志表明单位属性方面的特征,只能用文字来描述数量标志表明单位数量方面的特征,用数值来表现标志分为品不变志和变异标志两种。不变标志:一个总体中各单位有关标志的具体表现都相同变异标志:一个标志在各单位的具体表现有不相同变异标志是进行统计研究的前提。,例:张月芳:大学生,一年级,女,汉族,19岁,410分王云龙:大学生,一年级,男,回族,20岁,398分,例:总体:一年级全体在校大学生。总体单位:每个一年级大学生。,46,四、统计指标与指标体系,统计指标是反映统计总体数量特征的概念和数值。如2007年我国GDP246619亿元,江苏25046亿元,连云港615亿元。统计指标由六项基本要素构成
20、:即指标的名称、指标的数值、时间状态、空间范围、计量单位、计量方法。注意:可比性问题。,47,指标与标志的关系,标志反映总体单位的属性和特征,而指标则反映总体的数量特征。标志和指标的关系是个别和整体的关系。需要通过对各单位标志的具体表现进行汇总和计算才能得到相应的指标。由于总体和单位的概念会随着研究目的不同而变化,因此指标与标志的概念也是相对而言的。,48,统计指标可以分为数量指标和质量指标。数量指标(总量指标);反映现象总规模、总水平。例如人口总数、商品进出口总额等,用绝对数来表示。质量指标:反映现象相对水平和工作质量例如职工平均工资、人口密度等等。用相对数或平均数来表示,以反映现象之间的内
21、在联系和对比关系。统计指标体系是由一系列相互联系的统计指标所组成的有机整体。例:小康水平评价指标体系。,50,五、统计数据,(一)变量与变量值说明现象的某一数量特征的概念也被称为变量,变量的具体取值是变量值。例如,固定资产是一个变量,各企业固定资产的具体数值是变量值。连续型变量是指变量的取值在数轴上连续不断,无法一一列举,即在一个区间内可以取任意实数值。例如,气象上的温度、湿度,零件的尺寸等。离散型变量是指变量的其取值是整数值,可以一一列举。例如,企业数,职工人数等。,51,确定性变量是受确定性因素影响的变量,即影响变量值变化的因素是明确的,是可解释和可控制的。随机变量则是受许多微小的不确定因
22、素(又称随机因素)影响的变量。变量的取值无法事先确定。统计学所研究的主要是随机变量。,52,(二)数据的计量尺度计量尺度由低到高、由粗略到精确分为四个层次:定类尺度、定序尺度、定距尺度和定比尺度。1.定类尺度是按照客观现象的某种属性对其进行分类。例如,人口按性别分为男女,用“1”表示男性,用“0”表示女性。定类尺度的主要数学特征是“=”或“”。2.定序尺度是对客观现象各类之间的等级差或顺序差的一种测度。利用定序尺度不仅可以将研究对象分成不同的类别,而且还可以反映各类的优劣、量的大小或顺序。例如,学生成绩可以分为优、良、中、及格和不及格等五类。、定序尺度的主要数学特征是“”。,53,3.定距尺度
23、是对现象类别或次序之间间距的测度。定距尺度不但可以用数表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异。定距尺度的主要数学特征是“+”或“”。统计中的总量指标就是运用定距尺度计量的。4.定比尺度。定比尺度是在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数加以对比而形成相对数(或平均数),用于反映现象的结构、比重、速度、密度等数量关系。定比尺度的主要数学特征是“”或“”。,54,(三)数据的类型,横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据又称为动态数据,它是指在不同时间对同一总体的数量表现进
24、行观察而获得的数据。例如,2007年世界部分国家的国内生产总值就属于横截面数据。而“十五”期间我国历年的国内生产总值就属于时间序列数据。,2007年部分国家的GDP表,58,(四)数据的表现形式,绝对数:现象的规模、水平一般以绝对数形式表现。绝对数的计量单位:实物单位、价值单位。实物单位:自然计量单位、物理计量单位、标准实物单位、复合计量单位相对数:相对数由二个互相联系的数值对比求得。常用的相对数包括:结构相对数、动态相对数、比较相对数、强度相对数、利用程度相对数、计划完成相对数等。将在第八章作详细介绍。平均数:平均数反映现象总体的一般水平或分布的集中趋势。将在第三章作详细介绍。,几种常用的统
25、计软件(Software),SAS系统全称为Statistics Analysis System,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS是用于决策支持的大型集成信息系统,但该软件系统最早的功能限于统计分析,至今,统计分析功能也仍是它的重要组成部分和核心功能。,几种常用的统计软件(Software),SPSS是Statistical Package for the Social Sciencesr 的缩写,即“社会科学统计软件包”。它是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生于20世纪60年代末研制,同时成
26、立了SPSS公司,并于1975年在芝加哥组建了SPSS总部。应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。,几种常用的统计软件(Software),Minitab是国际上流行的一个统计软件包,其特点是简单易懂,特别是它的试验设计及质量控制等功能。MiniTab目前的最高版本为V14.1,它提供了对存储在二维工作表中的数据进行分析的多种功能,包括:基本统计分析、回归分析、方差分析、多元分析、非参数分析、时间序列分析、试验设计、质量控制、模拟、绘制高质量三维图形等,从功能来看,M
27、initab除各种统计模型外,还具有许多统计软件不具备的功能矩阵运算。,几种常用的统计软件(Software),Statistica为一套完整的统计资料分析、图表、资料管理、应用程式发展系统;以及对其他技术、工程、工商企业资料挖掘应用等进阶分析之应用程式。此系统不仅包含统计上一般功能及制图程序;还包含特殊的统计应用(例如:社会统计人员、生物研究员或工程师);全新的Statistica在功能上,更提供了四种线形模型的分析工具,包括VGLM、VGSR、VGLZ与VPLS。,几种常用的统计软件(Software),Excel的统计功能虽然不像专业统计软件那样强大,但能够满足基本应用的需要;(2)只要有计算机,一般都装有现成的Excel软件,而那些专业统计软件则需专门购买,而且价格昂贵;(3)大学一般会开设Office软件应用课程,学生具备一定的Excel应用基础;(4)最重要的是Excel软件易学易用,比起那些专业性的统计软件来更受欢迎。,
链接地址:https://www.31ppt.com/p-5955489.html