第五章+集中趋势和离中趋势的度量课件.ppt
第五章 数据分布特征的描述,第一节 集中趋势指标概述 第二节 数值平均数第三节 位置平均数第四节 离中趋势的度量,明确平均数和标志变异指标的概念和作用熟练掌握数值平均数和标准差计算方法了解众数、中位数的概念、特点及计算方法了解几种平均数之间的关系了解计算平均数和离中趋势指标应注意的问题。,学习目的和要求,1,平均数和标志变异指标的概念数值平均数和标准差的特点及其计算方法,学习重点,2,众数、中位数、数值平均数(算术平均数、调和平均数、几何平均数)等度量方法的选择问题,学习难点,3,集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势即要寻找数据一般水平的代表值或中心值。,第一节 集中趋势指标概述,集中趋势指标即统计平均数,是反映若干统计数据一般水平或集中趋势的综合指标。它可能表现为总体内各单位某一数量标志的一般水平,也可能表现为总体在某一段时期内的数量一般水平。,一、集中趋势指标及特点,统计平均数的特点统计平均数是一个代表值统计平均数是一个抽象值,数据集中区,变量x,二、集中趋势指标的作用 1、比较两个不同总体同类现象的一般水平。2、比较同一总体、同一性质的平均数在不同时间的一般水平,反映现象发展变化的过程、趋势、规律性。3、和统计分组结合,揭示现象之间的依存关系。,动态平均数,静态平均数,统计平均数,数值平均数,位置平均数,算术平均数,调和平均数,几何平均数,众数,分位数,三、集中趋势指标的类型,一、算术平均数(一)基本公式,第二节数值平均数,资料未分组时可以采用简单算术平均数的方法。,1、简单算术平均数,(二)算术平均数的计算,例:某车间有五名工人,某天产量分别为10件、20件、30件、40件和50件,则五名工人平均日产量?,和,算术平均数,变量值,变量值的个数,2、加权算术平均数 当资料已经分组则采用加权算术平均数的方法,式中:算术平均数 X 各组变量值 f 各组变量值出现的次数(即权数),某厂工人按日产量分组后所得组距数列如下,求平均日产量。,某厂工人按日产量分组后所得组距数列如下,求平均日产量。,例:某厂工人按日产量分组后所得组距数列如下,求平均日产量。,例:某厂工人按日产量分组后所得组距数列如下,求平均日产量。,设某厂工人按日产量分组后所得组距数列如下,求平均日产量。,计算工人平均日产量。,计算工人平均日产量。,计算工人平均日产量。,绝对权数,相对权数或称权重系数,3、需要注意的几个问题,(1)加权算术平均数不仅受各个变量值大小的影响,而且受权数大小的影响。(2)权数可以用比重形式。,(3)简单算术平均数是加权算术平均数的特例。,(三)算术平均数的数学性质 各变量值与算术平均数的离差之和为零。这一性质说明算术平均数是一组数据的重心。,各变量值与算术平均数的离差平方和为最小。,是各变量值的倒数的算术平均数的倒数。调和平均数用 H 表示。,二、调和平均数(倒数平均数),简单调和平均数,加权调和平均数,已知某商品在三个集贸市场上的平均价格及销售额资料如下,计算平均价格。,加权调和平均数法的应用:,已知某商品在三个集贸市场上的平均价格及销售额资料如下,计算平均价格。,已知某商品在三个集贸市场上的平均价格及销售额资料如下,计算平均价格。,已知某商品在三个集贸市场上的平均价格及销售额资料如下,计算平均价格。,某公司有四个工厂,已知其计划完成程度及实际产值资料如下,计算平均计划完成程度。,某公司有四个工厂,已知其计划完成程度及实际产值资料如下,计算平均计划完成程度。,某公司有四个工厂,已知其计划完成程度及实际产值资料如下,计算平均计划完成程度。,某公司有四个工厂,已知其计划完成程度及实际产值资料如下,计算平均计划完成程度。,算术平均数和调和平均数比较:,b、调和平均数常作为算术平均数的变形使用。,联系:,a、两种平均数经济意义相同。,两种平均数应用场合不相同。,区别:,总体标志总量(分子)总体单位总量(分母),分母已知 算术平均数 各组分母相同(简单)各组分母不同(加权)分母未知 调和平均数 各组分子相同(简单)各组分子不同(加权),早晨:买 1.5千克单价:.6.7元/千克,中午:买 2千克单价:5.0元/千克,晚上:买 2.5千克单价:4.0元/千克,?,这一天苹果平均价格应是多少,几何平均数是n个变量值连乘积的n次方根,适应于计算平均比率和平均速度。用G表示。,三、几何平均数,加权几何平均数,简单几何平均数,例:,某企业生产某种产品要经过三道工序,第一道工序的产品合格率是92%,第二道工序的产品合格率是95%,第三道工序的产品合格率是90%,要求计算该产品三道工序的平均合格率。,?,定期存款25年的年利率如下,若按复利计算,试计算平均年利率。,四、数值平均数的运用原则,1、用组平均数补充说明总平均数。,已知某企业两个时期各技术等级的工人数和工资总额如下:,某工业部门100个企业年度利润计划完成程度资料如下:,2、用频数分布补充说明数值平均数,3、平均数和典型事例相结合,第三节 位置平均数,众数是一组数据中出现次数最多的标志值。,一、众数Mo,(一)众数的概念,如果各标志值分布很均匀,无明显的变化,则数列无众数。2.如果是单项式数列或未分组的数据,出现次数最多的那一个标志值就是众数。3.由组距式数列确定众数,先根据次数的多少确定众数组,然后可按下述公式之一计算。,(二)众数的确定,利用比例插值法推算众数的近似值。,确定众数所在组;,计算众数。,二、中位数Me,中位数是指将总体各单位标志值按照大小顺序排列后,处于中间位置的那个标志值,用Me表示。,(一)中位数的概念,1.由未分组的数据确定中位数,步骤:(1)将总体各单位的标志值按大小顺序排列(2)找中点位置,(二)中位数的确定,某班学生按身高分组如下,计算中位数。,步骤:a、确定中点位置,b、计算累计次数,找到中位数。,2.由单项数列确定中位数,某班学生按身高分组如下,计算中位数。,某班学生按身高分组如下,计算中位数。,步骤:a、确定中点位置,b、计算累计次数,找到中位数所在组,c、由公式计算中位数的近似值。,3.由组距数列确定中位数,三、分位数*,一、离中趋势指标的含义,离中趋势是指一组数据中各数据值以不同程度的距离偏离其中心(平均数)的趋势,又称标志变动度。,第四节 离中趋势的度量,离中趋势指标是用来综合反映数据的离中程度的一类指标。,极差,分位差,平均差,方差,标准差,离散系数,(一)极差,极差最大变量值-最小变量值,组距数列极差可近似值为:极差 最大组的上限-最小组的下限,二、离中趋势指标的计算,优点计算简便 含义清楚,缺点 没有考虑到中间变量值的变动情况,测定离中趋势时不准确。,(二)分位差,是从一组数据中剔除了一部分极端值之后重新计算的类似于极差的指标。常用的有四分位差、八分位差和十分位差等。,四分位差是第三个四分位数减去第一个四分位数的差的一半,例题见教材P103,(三)平均差,平均差是数据组中各数据值与其算术平均数离差绝对值的算术平均数,常用符号“M.D”表示。,简单平均式,加权平均式,由于平均差是根据数列中所有数值计算出来的,受极端值影响较小,所以对整个统计数列的离中趋势有较充分的代表性。,但是在计算过程中,数学处理方法不够理想,所以,其应用受限,(四)方差与标准差,方差是数据组中各数据值与其算术平均数离差平方的算术平均数。方差的平方根就是标准差,简单平均式,加权平均式,标准差是应用最广泛的离中趋势指标,(五)离散系数V,上述四个指标带有计量单位,而且其离中趋势大小与变量平均水平的高低有关。要比较数据平均水平不同的两组数据的离中程度的大小,就有必要计算它们的相对离中程度指标,即离散系数。常用的离散系数指标是标准差系数。,标准差系数,标准差系数是将一组数据的标准差与其算术平均数对比的结果。,已知甲乙两个水稻品种分别在五块田里试种,资料如下,试计算有关指标,比较甲乙两个水稻品种的收获率哪一个具有较强的稳定性,可以推广.甲 乙平均亩产量 面积 平均亩产 面积(千克/亩)(亩)(千克/亩)(亩)459 2.2 439 2.3 452 2.1 445 2.0 440 2.0 450 2.5 453 1.9 461 1.9 461 1.8 478 2.3 合 计 10.0 合 计 11.0,甲平均亩产x 面积 f xf x-x(x-x)(x-x)f 459 2.2 1010 6 36 79.2 452 2.1 950-1 1 2.1 440 2.0 880-13 169 338.0 453 1.9 860 0 0 0 461 1.8 830 8 64 115.2 合计 10.0 4530-534.5,乙平均亩产x 面积 f xf x-x(x-x)(x-x)f 439 2.3 1010-16 256 588.8 445 2.0 890-10 100 200.0 450 2.5 1125-5 25 62.5 461 1.9 875 6 36 68.4 478 2.3 1100 23 529 1216.7 合计 11.0 5000-2136.4,甲水稻品种的收获率具有较强的稳定性,可以推广.,交替标志的概念 只能用“是”或“否”来回答的标志。,交替标志的算术平均数和标准差,交替标志的算术平均数和标准差的计算,N:N1,N。N1 是具有某种标志表现的单位数,N。是不具有这种标志表现的单位数,,具有某种标志变量值为1,不具有这种标志变量值为0,结论:,例:某厂对1200件产品质检,不合格品20件,求这批 产品的平均合格率和标准差。,三、离中趋势指标的作用,1、离中趋势指标能反映数据分布的离散程度。,2、离中趋势指标能反映平均数代表性的大小。,3、离中趋势指标可用来反映经济活动过程的均衡性或协调性,以及产品质量的稳定程度。,一、名词解释平均指标 众数 中位数 标志变异指标,二、简答 什么是标志变异指标?它有什么作用?,三、判断并改错 1、如果各组次数相等,次数的权数作用就消失了。,2、权数越大,对算术平均数的影响也就越大。3、加权算术平均式转变为简单算术平均式的条件是各组 变量值完全相等。()4、三种水果,每公斤价格分别为5元、4元和2.5元。各买2公斤和各买10元的平均价格都是每公斤4元。(),四、选择题,1、某商店在制定男式衬衫进货计划时,需了解已售衬衫的平均尺寸,则应计算()A、算术平均数 B、调和平均数 C、中位数 D、众数2、下列指标中,属于强度相对数的有()A、人均国内生产总值 B、人均工资 C、流动资金周转次数 D、现金收支比例,3、比较两个单位的资料,甲的标准差小于乙的标准差,则()A、两个单位的平均数代表性相同B、甲单位的平均数代表性大于乙单位C、乙单位的平均数代表性大于甲单位D、不能确定哪个单位的平均数代表性大,4、下列指标属于平均指标的有()A、每人平均国民收入B、出生率C、每人平均年龄D、每个职工平均工资E、每人平均国内生产总值,6、众数()A、是位置平均数B、不受极端值的影响C、是总体中出现次数最多的变量值D、适用于总体次数多且有明显的集中趋势的情形E、是有序数列中间位置的变量值,5、衡量平均指标代表性大小可使用的指标有()A、平均差B、标准差C、算术平均数D、调和平均数E、离散系数,作业,1、某厂三个车间一季度生产情况如下:车间 计划完成%实际产量(件)单位成本(元件)90 198 15 105 315 10三 110 220 8 根据以上资料计算:(1)一季度三个车间产量平均计划完成百分比。(2)一季度三个车间平均单位产品成本。,2、甲、乙两班同时对统计学原理课程进行测试,甲班平均成绩为70分,标准差为9.0分;乙班的成绩分组资料如下:试比较甲、乙两班哪个班的平均成绩更有代表性?,