第四章 数据的度量ppt课件.ppt
商场欺骗顾客了吗?,某大商场策划了一次“返利给顾客”活动,凡一次购物100元以上(含100元)均可当场抽奖。商场提醒:平均每份奖金249元,莫失良机呦!但中奖顾客却说:商场在欺骗我们顾客,我们中只有两人获得80元,其他人都是20元,可气!你认为商场欺骗了顾客吗?说说你的看法,以后我们再遇到中奖问题应该关心什么?,原始数据,原始数据,统计指标,静态分布,动态趋势,总量指标相对指标平均指标变异指标,水平指标速度指标因素分析,加工,整理,一、相对指标的概念及作用二、相对指标的种类三、使用相对指标应注意的问题,第一节 数据比较分析,指应用对比的方法来反映相关事物之间数量联系程度的指标,也称为相对数。,相对指标,用倍数、系数、成数、等表示,用双重计量单位表示的复名数,成数一般应当用整数的形式来表述3成、近7成0.5成、 8.6成,相对指标的表现形式,相对指标的种类,部分与总体比,看结构与分布特征,部分与部分比,落后与先进比,看差异及其发展潜力,报告期与基期比,看增减变化的速度,与有关现象比,看强度、密度和普遍程度,实际与计划比,看计划完成情况,例:我国某年国民收入使用额为19715亿元,其中消费额为12945亿元,积累额为6770亿元。则,例:我国某年国民收入使用额为19715亿元,其中消费额为12945亿元,积累额为6770亿元。则,例:某年某地区甲、乙两个公司商品销售额分别为5.4亿元和3.6亿元。则,例:某年某地区年平均人口数为100万人,在该年度内出生的人口数为8600人。则该地区,例:某地区某年末现有总人口为100万人,医院床位总数为24700张。则该地区,例题:想一想可以计算哪几种相对指标?,单位:万人,又知我国国土面积为960万平方公里。,结构相对指标,比例相对指标,比较相对指标,强度相对指标,动态相对指标, 计划数与实际数同期时,直接应用公式:,A.计划任务数表现为绝对数时,短期计划完成情况的检查,例:某企业2000年计划产量为10万件,而实际至第三季度末已生产了8万件,全年实际共生产11万件。则, 考察计划执行进度情况:,长期计划完成情况的检查,其中,2000年各月份实际完成情况为(单位:亿元):,要求计算:该市“九五”期间固定资产投资计划的完成程度;提前完成计划的时间。,例:某市计划“九五”期间要完成社会固定资产投资总额60亿元,计划任务的实际完成情况为:,解:,提前完成计划时间:因为到2000年10月底已完成固定资产累计投资额60亿元(61.70.80.9=60),即已完成计划任务,提前完成计划两个月。,例:某市计划“九五”期间要完成社会固定资产投资总额60亿元,计划任务的实际完成情况为:,其中,2000年各月份实际完成情况为(单位:亿元):,即提前完成任务两个月零两天。,即提前完成任务两个月零两天。,例:某自行车厂计划“九五” 末期达到年产自行车120万辆的产量,实际完成情况为:,其中,最后两年各月份实际产量为(单位:万辆):,要求计算: 该厂“九五”期间产量计划的完成程度;提前完成计划的时间。,=120,解:,提前完成计划时间:因为自1999年3月起至2000年2月底连续12个月的时间内该厂自行车的实际产量已达到120万辆119+10.19.6+(10.19.6)=120,即已完成计划任务,提前完成计划10个月。,例:某自行车厂计划“九五” 末期达到年产自行车120万辆的产量,实际完成情况为:,其中,最后两年各月份实际产量为(单位:万辆):,【分析】,=119.8,(尚未完成计划),=120.2,可以判断出,计划任务应是在2000年3月份的某一天完成的,(已超额完成计划),由表可知,从1999年3月到2000年2月,产量合计为119.8万,而从从1999年4月到2000年3月产量合计为120.2万,因此当产值达到计划规定的120万时,时间一定出现在2000年3月的某一天。现设提前X天(指从2000年3月中从后往前数的前X天),又假定用月资料计算平均数代替每日资料,因要满足连续12个月的要求,故列方程如下:,即提前完成任务九个月零15天。,B. 计划任务数表现为相对数时,例:己知某厂2000年的计划规定产品产量要比上年提高5而实际提高了7。则,c. 计划任务数表现为平均数时,例:某产品的计划单位成本为100元,实际的单位成本为80元,其计划完成程度为,计算说明该企业该种产品的单位成本实际比计划降低了20%,超额完成了计划任务。,正确选择对比的基础;指标对比要有可比性;相对指标要与总量指标结合运用;多种相对指标结合运用。,三、使用相对指标应注意的问题,本单位历史水平本行业(全国)平均(先进)水平,经济发展、价格水平均较为正常的时期,正确选择对比基础,注意指标间的可比性,可比性主要指对比的两个指标在经济内容上要具有内在联系,在总体范围、指标口径、计算方法、计量单位等方面要保持一致。,比较两厂经济效益,不可比,不可比,可比,结构相对数比例相对数比较相对数动态相对数计划完成相对数强度相对数,(部分与总体关系)(部分与部分关系)(横向对比关系)(纵向对比关系)(实际与计划关系)(关联指标间关系),多种相对指标应当结合运用,1998年相对于1997年,美国的GDP增长速度为3.9,同期中国GDP增长速度为7.8,恰好为美国的2倍;但根据同期汇率(1美元兑换8.3元人民币),1998年中国GDP总量约合9671亿美元,约相当于同期美国GDP总量84272亿美元的1/9。,相对指标应当结合总量指标使用,人口性别比为1.03:1,1999年末我国共有总人口12.6亿人,其中男性人口为6.4亿,女性人口为6.2亿。,男性人口的比重为50.8,是1980年末的9.9亿人的128,人口密度是美国的4.5倍,人口密度为130人/平方公里,人口出生率为15.23,女性人口的比重为49.2,第二节 集中趋势的测定, 算术平均数 调和平均数 几何平均数 众数 中位数,平均指标的种类及计算方法,基本形式:,例:,直接承担者, 注意区分算术平均数与强度相对数,(一) 算术平均数,式中: 为算术平均数; 为总体单位总数; 为第 个单位的标志值。,算术平均数的计算方法,平均每人日销售额为:,式中: 为算术平均数; 为第 组的次数; 为组数; 为第 组的标志值或组中值。,【例】某企业某日工人的日产量资料如下:,计算该企业该日全部工人的平均日产量。,解:,【练习】某企业某日工人的日产量资料如下:,计算该企业该日全部工人的平均日产量。,分析:,起到权衡轻重的作用,决定平均数的变动范围,变量值与其算术平均数的离差之和衡等于零,即:变量值与其算术平均数的离差平方和为最小,即:,算术平均数的主要数学性质,-1,-1,-2,1,3,离差的概念,平均指标的种类及计算方法, 算术平均数 调和平均数 几何平均数 众数 中位数,例:小红去买水果,买了苹果、桃子、梨三种水果,价格分别为2元/斤、3元/斤、4元/斤,购买额相同,请问三种水果的平均价格为多少?,平均价格=(2+3+4)/3=3,【例】 设X=(2,4,6,8),则其调和平均数可由定义计算如下:,再求算术平均数:,求各标志值的倒数 : , , ,,再求倒数:,是总体各单位标志值倒数的算术平均数的倒数,又叫倒数平均数,调和平均数,(二) 调和平均数,A. 简单调和平均数,适用于总体资料未经分组整理、尚为原始资料的情况,式中: 为调和平均数; 为标志总量; 为第 个变量值。,调和平均数的计算方法,B. 加权调和平均数,适用于总体资料经过分组整理形成变量数列的情况,式中: 为第 组的变量值; 为第 组的标志总量。,若只知 x 和xf ,而f 未知,则不能直接使用加权算术平均方式,只能使用其变形即加权调和平均方式。,苹果 单价 购买量 总金额 品种 (元)(公斤) (元)红富士 2 3 6青香蕉 1.8 5 9,当己知各组变量值和标志总量时,作为算术平均数的变形使用。,因为:,调和平均数的应用,计算该企业该日全部工人的平均日产量。,即该企业该日全部工人的平均日产量为12.1375件。,平均指标的种类及计算方法, 算术平均数 调和平均数 几何平均数 众数 中位数,(三) 几何平均数,式中: 为几何平均数; 为变量值的个数; 为第 个变量值。,几何平均数的计算方法,【例】某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95、92、90、85、80,求整个流水生产线产品的平均合格率。,分析:,设最初投产100A个单位 ,则第一道工序的合格品为100A0.95;第二道工序的合格品为(100A0.95)0.92; 第五道工序的合格品为(100A0.950.920.900.85)0.80;,因该流水线的最终合格品即为第五道工序的合格品,故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:,即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。,因该流水线的最终合格品即为第五道工序的合格品, 故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:,即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。,思考,若上题中不是由五道连续作业的工序组成的流水生产线,而是五个独立作业的车间,且各车间的合格率同前,又假定各车间的产量相等均为100件,求该企业的平均合格率。,因各车间彼此独立作业,所以有 第一车间的合格品为:1000.95; 第二车间的合格品为:1000.92; 第五车间的合格品为:1000.80。则该企业全部合格品应为各车间合格品的总和,即总合格品=1000.95+1000.80,分析:,不再符合几何平均数的适用条件,又因为,应采用加权算术平均数公式计算,即,式中: 为几何平均数; 为第 组的次数; 为组数; 为第 组的标志值或组中值。,【例】某金融机构以复利计息。近12年来的年利率有4年为3,2年为5,2年为8,3年为10,1年为15。求平均年利率。,设本金为V,则至各年末的本利和应为:,第1年末的本利和为:,第2年末的本利和为:, ,第12年末的本利和为:,分析:,则该笔本金12年总的本利率为:,即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。,解,分析,第1年末的应得利息为:,第2年末的应得利息为:,第12年末的应得利息为:, ,则该笔本金12年应得的利息总和为:=V(0.034+0.052+0.151),这里的利息率或本利率不再符合几何平均数的适用条件,又因为,假定本金为V,所以,应采用加权算术平均数公式计算平均年利息率,即:,解:,平均指标的种类及计算方法, 算术平均数 调和平均数 几何平均数 众数 中位数,例:学校要召开运动会,决定从各班中抽调男生64人组成彩旗方队,如果从某班的体检表中抽出了10份男生表格,得到10名男生的身高(单位:米)如下:1.63 1.60 1.68 1.66 1.66 1.70 1.75 1.66 1.58 1.65根据这10个身高值提供的信息,试确定参加方队的学生的最佳身高值。,(四) 众数,【例A】已知某企业某日工人的日产量资料如下:,众数的确定,(单项数列),计算该企业该日全部工人日产量的众数。,众数的确定,(组距数列),【例B】某车间50名工人月产量的资料如下:,计算该车间工人月产量的众数。,当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数;前者无众数,后者为双众数或多众数,也等于没有众数。,众数的原理及应用,(无众数),(双众数),当数据分布呈现出双众数或多众数时,可以断定这些数据来源于不同的总体。,平均指标的种类及计算方法, 算术平均数 调和平均数 几何平均数 众数 中位数,例:对某城镇居民的月收入的调查中,测得50名居民的月收入如下表(单位:元):,能够算出,这50名居民月收入的平均数是1322.8,即50名居民每月平均收入是1322.8元;但这50名居民中有收入高的,收入低的,中等的是多少呢?这需要中位数来说明。,不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。,中位数的作用:,(五) 中位数,中位数的位次为:,即第3个单位的标志值就是中位数,(未分组资料),中位数的确定,中位数的位次为:,中位数应为第3和第4个单位标志值的算术平均数,即,【例C】某企业某日工人的日产量资料如下:,计算该企业该日全部工人日产量的中位数。,中位数的位次:,中位数的确定,(单项数列),中位数的确定,(组距数列),【例D】某车间50名工人月产量的资料如下:,计算该车间工人月产量的中位数。,中位数的作用及用法,中位数一定存在;中位数不受极端值影响;中位数与算术平均数相近;变量值与中位数离差绝对值之和最小。,20,中位数为6,中位数的作用及用法,中位数一定存在;中位数不受极端值影响;中位数与算术平均数相近;变量值与中位数离差绝对值之和最小。,5 6 6 6 6 8 9,20,中位数为(6+6)/2=6,中位数一定存在;中位数不受极端值影响;中位数与算术平均数相近;变量值与中位数离差绝对值之和最小。,中位数的作用及用法,中位数的作用及用法,中位数一定存在;中位数不受极端值影响;中位数与算术平均数相近;变量值与中位数离差绝对值之和最小。,中位数一定存在;中位数不受极端值影响;中位数与算术平均数相近;变量值与中位数离差绝对值之和最小。,中位数的作用及用法,中位数一定存在;中位数与算术平均数相近;中位数不受极端值影响;变量值与中位数离差绝对值之和最小。,中位数的作用及用法,变量值34556910中位数 5平均值 6与中位数离差 -2 -1 0 0 1 4 5与平均数离差 -3 -2 -1 -1 0 3 4,绝对数值之和 13 14,既然平均数、众数、中位数都是一组数据的集中趋势的特征数,那么他们在实际应用中存在怎么的作用呢?对某城镇居民的月收入的调查中,测得50名居民的月收入如下表(单位:元):,能够算出,这50名居民月收入的平均数是1322.8,即50名居民每月平均收入是1322.8元;它们的众数是1320,即月收入1320元的人数最多;它们的中位数是1310,说明约有一半居民的月收入在1310元以上,另一半在1310元以下,它们从不同角度描述了这组数据的集中趋势其中,又以平均数应用最广,这三个数据可能不同,也可能相同,某班三名同学三门课程的成绩如下(单位:分):,请比较三名同学学习成绩的差异。,第三节 离中趋势的测定,集中趋势弱、离中趋势强,集中趋势强、离中趋势弱,用来衡量和比较平均数代表性的大小:变异指标值越大,平均指标的代表性越小;反之,平均指标的代表性越大;用来反映社会经济活动过程的均衡性或协调,以及产品质量的稳定性程度。,测定标志变动度的意义,离散系数,标志变异指标的种类,全距,【例B】某季度某工业公司18个工业企业产值计划完成情况如下:,计算该公司该季度计划完成程度的全距。,优点:计算方法简单、易懂;缺点:易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差。,往往应用于生产过程的质量控制中,全距的特点,第三个四分位数与第一个四分位数之差。,第三个四分位数,第一个四分位数,四分位差越大,表明上下四分位点之间变量值的分布愈远离中位数,说明中位数的代表性愈差;反之,四分位差愈小,说明中位数的代表性愈好。,四分位差, 简单平均差适用于未分组资料,是各个数据与其算术平均数的离差绝对值的算术平均数,用 A.D. 表示,平均差,计算公式:,【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的平均差。,解:,即该售货小组5个人销售额的平均差为93.6元。, 加权平均差适用于分组资料,平均差的计算公式,【例B】计算下表中某公司职工月工资的平均差,解:,即该公司职工月工资的平均差为138.95元。,优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。,平均差的特点,一般情况下都是通过计算另一种标志变异指标标准差,来反映总体内部各单位标志值的差异状况, 简单标准差适用于未分组资料,计算公式:,【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。,解:,(比较:其销售额的平均差为93.6元),即该售货小组销售额的标准差为109.62元。, 加权标准差适用于分组资料,标准差的计算公式,【例B】计算下表中某公司职工月工资的标准差。,解:,(比较:其工资的平均差为138.95元),即该公司职工月工资的标准差为167.9元。,标准差的特点,不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.,由同一资料计算的标准差的结果一般要略大于平均差。,标准差的简捷计算,【练习】某企业某日工人的日产量资料如下:,计算该企业该日全部工人的日产量的标准差。,可比,身高的差异水平:cm,体重的差异水平:kg,可比,离散系数(变异系数):数列的离散水平指标与数列均值的比值。,【例】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。,解:,一班成绩的标准差系数为:,二班成绩的标准差系数为:,因为 ,所以一班平均成绩的代表性比二班大。,【练习】甲企业工人的平均日产量为20件,标准差为3件,乙企业某日工人的日产量资料如下:,计算乙企业该日全部工人的日产量的平均数和标准差,并比较那个企业的平均日产量更有代表性。,