统计学院原理课件-第三章.ppt
第三章 综 合 指 标,统计学原理,引入:1、在有关大学生学习成绩影响因素调查中,假如搜集到了2000名学生上学期期末各科考试成绩,则 如何考察每位学生成绩的一般水平?如何比较男生和女生的学习成绩?2、我国20092011年国内生产总值(GDP)这些数据如何的来的?从这些数据,你能发现什么?,3、问题:从2006年到2011年,我国总人口有什么变化?自然增长率呢?,统计学原理,本章学习主要内容:,总量指标相对指标平均指标标志变异指标,第一节 总 量 指 标,总量指标的含义和作用总量指标的种类(重点)总量指标的计算方法和计量单位,统计学原理,总量指标的含义和作用,概念,反映社会经济现象一定时间、地点、条件下的总规模、总水平的统计指标。我国近年来人口统计 表现形式:绝对数、有名数。,作用:课本P29,统计学原理,种类(重点),统计学原理,总量指标的计算主要是理论和实际问题。同类总体和现象统计口径一致(范围)计量单位一致,总量指标计算原则(方法),计量单位,实物单位:自然单位、度量衡单位、双重或多重 单位、复合单位价值单位:也称为货币单位劳动单位:如工时、工日等。,第二节 相 对 指 标,相对指标的含义和作用相对指标的表现形式(重点)相对指标的种类(种类)计算和应用相对指标应注意的问题,统计学原理,概念,两个有联系指标对比的比值,反映事物的数量特征和数量关系,又称相对数。例如:我国2011年全国总人口是为134735万人,城镇人口为69079万人,比重达到51.27%,作用 说明社会现象和过程的联系程度;便于比较和分析研究对象;是经济管理、绩效考核的重要工具,相对指标的含义和作用,相对指标的表现形式,有名数:具有计量单位。如元/人,元/公斤等;无名数:无计量单位,具体表现为表示为系数、倍数、成数、百分数、千分数等;,常用相对指标类型 计划完成相对指标;结构相对指标;比例相对指标;比较相对指标;强度相对指标;动态相对指标,统计学原理,结构相对指标:总体内部组成状况,一般用百分数形式表示,运用十分广泛,如合格率、及格率、恩格尔系数、就业率、失业率等都是结构指标。,统计学原理,强度相对指标:现象的强度、密度、普遍程度,有时,强度相对指标的分子分母可以互换,形成:正指标:比值越大,密度越大;逆指标:比值越大,密度越小。,例如,国土面积与总人口数是有联系的两个总量指标,两个指标对比形成强度相对指标:,强度相对指标常用两种方法表示:复名数。如人均GDP、百人手机拥有量、人均住房面积等,统计学原理,计划完成相对数:用来检查、监督计划执行情况的相对指标。一般用百分数表示。,相对指标的计算,基本公式:,运用中分为四种情况:,计划是以总量指标形式下达。计划以相对指标形式下达 计划执行进度检查(短期计划)长期计划检查,超额完成(或未完成)绝对数=实际完成数计划数,统计学原理,例:某企业计划2008年第一季度实现产值为100万元,实际实现产值80万元.则:,该企业差20%完成计划产值计划,欠产20万元。,计划以总量指标形式下达:采用基本公式,统计学原理,计划数以相对指标形式下达 对基本公式进行变换,形成两种公式:,倾向于较大(多、高),表述为“计划提高、计划增长“等,倾向于较小(少、低),表述为“计划降低、计划减少”等,统计学原理,例:某企业计划本年度利润增长20,实际增长50;产品单位成本减少10,实际减少7。,该企业利润比计划多完成25%,而单位成本差3.33%未完成计划。注意:计划完成程度不一定超过100%就是完成任务。如果计划规定了最低限额(如利润,产量等),则计划完成程度大于100%为好;如果计划规定了最高限额(如成本,费用等),则计划完成程度小于100%为好,动态相对指标:同一指标不同时间上的动态比较,即速度。例如,某地区2010年末职工人数为1419.4万人,2011年末职工人数为1428.6万人,则 动态相对指标=1428.6/1419.4=100.65%就是说该地2011年末职工人数是2010年末职工人数的100.65%。,统计学原理,比较相对指标(类比相对数):不同空间的静态对比关系,比例相对指标:总体内部的比例关系,一般用X:Y或者X:Y:Z多个部分数值连比的形式百分数形式表示,如性别比例、三次产业比例、轻重工业比例等。,统计学原理,计划执行进度检查(一般计划期未结束),例 某企业计划年度实现利润320万元,19月已实现利润256万元,则某企业能顺利完成任务吗?计划完成程度=256/320X100%=80%,长期计划的检查(计划期已结束),出于不同的目的,有两种计算方式:,水平法,累计法,例:某企业按五年计划规定最后一年的产量应达到7200万件,实际执行情况如下表,则该企业产量计划完成情况如何?有提前完成任务吗?提前了多长时间?企业产量计划完成程度=8100/7200X100%=112.5%,第三节 平 均 指 标,统计学原理,概 述,概念 将同质总体内各单位某数量标志的差异抽象化,用以反映总体在具体条件下的一般水平。平均指标反映同类现象的一般水平,是总体内各单位参差不齐的标志值的代表值,也是对变量数量集中趋势的测定。,如果你想知道你在一年里平均每个月的生活费大概是多少,你会怎么做?,统计学原理,数据集中区,变量x,特点 数量差异抽象化:反映总体一般水平、普遍水平;具体条件下同类现象计算;反映总体单位变量值的集中趋势:代表值。,统计学原理,种类,统计学原理,算术平均数,算术平均指标与强度相对指标的区别 算术平均数分子分母总体范围一致,两者存在从属关系;而强度相对指标不存在标志值与各单位的对应问题;强度相对指标分子分母可互换,算术平均数则不可。,算术平均是计算平均指标最基本的方式,它表明同一总体各单位标志值的一般水平。基本公式如下:,统计学原理,简单算术平均:应用于未分组的绝对数形式资料,数学符号规定:,统计学原理,例 张三期末考试成绩微积分 55分,毛概63分,英语51分,体育69分,宏观经济学65分,数理统计45分,求张三的平均成绩。,张三期末平均成绩为58分。这个成绩是张三同学这个学期学习业绩的代表值或一般水平。,统计学原理,加权算术平均:对于已经分组整理的资料,权数:表示重要性、影响力高低。根据表现形式分为两种:,绝对数形式:次数、频数等绝对数形式;相对权形式:比重、频率等相对数形式。,对于组距数列,应该用组中值作为变量值。,加权算术的一般形式为:,统计学原理,例 某班统计学期末考试成绩如下表,计算此班统计学平均成绩。,统计学原理,算术平均的特点,优点:应用广泛,是平均数计算的基础,适合于代数运算;缺点:1)易受极端值影响,代表性降低,并且受极大值影 响大于受极小值影响。2)对于开口组,组中值未必准确,使平均数代表性 不可靠。,前面的权都是根据分组或数据本身得到的。实践中,有些数据并没有分组,数据本身也没有体现出显著的重要性高低,这时常常用主观赋权方式或者其他赋权方式给数据赋予不同的重要性。,统计学原理,例 张三期末考试成绩微积分 55分,毛概63分,英语51分,体育69分,宏观经济学65分,数理统计45分。人们常常认为各科的重要性不同,如何求张三的平均成绩?有人认为微积分、英语重要性最高,赋予权数5;数理统计、宏观经济学其次,赋予权数3;体育、毛概最低,赋予权数1。这样就要采用加权算术平均的方式计算张三同学的平均成绩。,也可以采用权重形式赋权。显然不同的赋权,计算的平均数肯定是有差异的。,引例:如果某商场出售三种苹果,每千克单价分别为0.5元,0.8元和1元,若各买1元钱的苹果,试问平均每千克的价格是多少?如果每种苹果分别买了3元、4元和5元,则平均每千克的价格是多少?,统计学原理,简单调和平均数,加权调和平均数,调和平均,经济统计中,一般要求计算过程有实际的经济含义。因此简单调和平均很少使用,加权调和平均则常作为加权算术平均的变形,计算相对指标或者平均指标的平均值。,统计学原理,算术平均数与调和平均数,计算相对指标和平均指标的平均值时,由于掌握的资料不同,有时候采用加权算术平均方便,有时候采用调和平均方便。,=,=,i,i,i,i,i,i,i,i,i,i,x,m,m,x,x,f,x,f,x,f,x,计算,即,,则采用加权调和平均,和,如果已知,;,计算,即,,则采用加权算术平均,和,如果已知,m,统计学原理,算术平均:,调和平均:,例 某种商品三个地区的销售价格不同,假设取得有关三个地区的所有资料,即销售额、销售量和销售价格,据此计算此种商品平均销售价格。,统计学原理,众数,众数是总体中出现次数最多的标志值。,存在条件:只能用于分组资料中,总体中单位数较多,各标志的分配有明显的集中趋势。,计算方法:对于单项数列可直接观察出众数,组距数列需要采用公式计算出众数。,上限公式:,下限公式:,两个公式等同,建议采用下限公式。,统计学原理,众数的特点,不受极端值和开口组的影响,增强了代表性;分布数列没有明显的集中趋势以及对于异距数列时,不容易确定众数。,例 单项式数列的众数。,可直接观察出众数为4分,统计学原理,人数最多为第三组,所以众数组为 7080,例 组距数列计算众数:,统计学原理,中位数,总体中各标志值排序后,处于中间位置的标志值。,计算方式(未分组资料、单项数列和组距数列),未分组资料,排序,计算中位数所在位置,确定中位数,n为奇数:中间位置对应的标志值。,n为偶数:两个中间位置对应标志值的简单算术平均值。,统计学原理,单项数列,计算中位数所在位置:,计算向上累计次数或向下累计次数(推荐向上累计),累计次数刚刚大于中位数位置的组对应的标志值就是中位数。,组距数列,前面三步与单项数列的一样,只不过找到是中位数所在组,然后需要用插值法计算中位数近似值:,下限公式(向上累计),上限公式(向下累计),统计学原理,中位数特点,不受极端值和开口组影响,具有稳健性;与中位数的离差绝对值之和最小;可运用于不具有数字特点或不能用数字测定的现象。,例 未分组资料计算中位数,统计学原理,例 单项数列计算中位数,向上累计,5,9,15,22,26,28,统计学原理,中位数组为 7080,例 组距数列计算中位数:,统计学原理,位置平均数与算术平均数的关系,对称分布,右偏分布,左偏分布,当偏斜不大时:,第四节 标志变异指标,概述极差平均差标准差离散系数,统计学原理,概 述,说明总体各单位标志值差异程度的指标,又称标志变异度、离散程度或离中程度。,衡量平均指标代表性的大小(一般来说),作用:,标志变异指标越大,平均数代表性越小;标志变异指标越小,平均数代表性越大。,衡量现象稳定性、协调性和均衡性的程度。,种类:,全距、平均差、标准差和离散系数。,统计学原理,标志变异度的计算,特点:,又称“全距”,它是总体各单位标志的最大值和最小值之差,用以说明所有标志值变动范围的大小,常用R表示。,计算方便,易理解。常用于检查产品质量的稳定性和进行质量控制;只考虑数列两端数值差异,不反映中间数值的差异情况,故不能全面反映总体各单位标志的差异程度;,极差(range),有甲乙两组工人,每组有工人7名,其工资资料如表7-1,表7-1 两组工人工资资料 单位:元,甲组全距:R=1300-1100=200(元)乙组全距:R=1500-900=600(元),统计学原理,平均差,各单位标志值与平均数的离差(deviation)绝对值的平均数,以A.D.表示。,特点根据全部变量值计算,较前两个指标的代表性更大;采用绝对值消除离差,不适合于代数方法的演算,故其应用受到限制;,未分组资料,分组资料,某车间50名工人日产量资料见表7-3,表7-3 某车间工人日产量加权平均差计算表,(件),(件),统计学原理,标准差(Standard deviation),标准差是各单位标志值与算术平均数的离差平方和的算术平均数的开放,又称“均方差”,以表示。标准差的平方即为方差(Variance),用2表示。,未分组资料,分组资料,表7-4 甲乙两组工人日产量标准差计算表,(件),(件),统计学原理,例 某班学生统计学考试成绩分组资料如下:,475.62,953.11819.3473.681201.481650.74,x f,11084516501530475,4610,60505492512375013005045125,359900,43.66153.7940.26147.0690.85,5698.34,统计学原理,离散系数,离散系数也称为标志变动系数,用以反映各单位标志值的离散程度;离散系数可消除不同计量单位或不同水平数列之间的差异程度;,离散系数的形式:,最常用的标准差系数:,统计学原理,例 甲、乙两地农户年人均纯收入资料如下:,试比较两地农户年人均收入代表性的大小。,v甲 v乙,故甲地农户年人均收入代表性更大。,